**结束。**此问题不符合堆栈溢出准则。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
24天前关门。
改进这个问题
目前我正在用opennlp进行测试,我只找到了一个用于英语的lemmatizer,没有找到任何东西。代码:
private static String[] lemmatizeTokens(String[] tokens, String[] posTags)
throws InvalidFormatException, IOException {
// Better to read file once at start of program & store model in instance
// variable. but keeping here for simplicity in understanding.
try (InputStream modelIn = new FileInputStream("- Missing lemmatizer -")) {
// Tag sentence.
LemmatizerME myCategorizer = new LemmatizerME(new LemmatizerModel(modelIn));
String[] lemmaTokens = myCategorizer.lemmatize(tokens, posTags);
System.out.println("Lemmatizer : " + Arrays.stream(lemmaTokens).collect(Collectors.joining(" | ")));
return lemmaTokens;
}
}
暂无答案!
目前还没有任何答案,快来回答吧!