描述
当我们使用像fermented leaves and fruit
这样的简单句子时,CoreNLP无法捕捉到fermented
和fruit
之间的依赖关系。检测这种依赖关系对于我们的应用至关重要,因此我们想知道这是否可能?
最近有一个publication的示例,他们展示了能够捕获这种依赖关系(如图1所示)。然而,由于这次比赛非常近(本月),我们找不到相应的脚本。
复现
with CoreNLPClient( annotators=['tokenize','ssplit','pos','depparse']) as client:
ann = client.annotate('fermented leaves and fruit')
sentence = ann.sentence[0]
print(sentence.enhancedPlusPlusDependencies)
print(sentence.alternativeDependencies)
print(sentence.basicDependencies)
print(sentence.enhancedDependencies)
2条答案
按热度按时间wfveoks01#
FWIW,这不太可能通过当前的模型来解决。也许在使用目标数据集的情况下,stanza模型可以支持它。
busg9geu2#
问题在于,这个结构在形容词是否涵盖连接词方面存在系统性的模糊性,而CoreNLP目前没有一个好的方法来判断,因此我们将保守的选择视为不添加弧线。确定何时广泛地涵盖是一个很好的研究领域,但我们看不到它被添加到CoreNLP的任何可能的未来,除非有人提供解决方案。