CoreNLP 在连词的情况下缺少依赖项

yqhsw0fo  于 6个月前  发布在  其他
关注(0)|答案(2)|浏览(52)

描述

当我们使用像fermented leaves and fruit这样的简单句子时,CoreNLP无法捕捉到fermentedfruit之间的依赖关系。检测这种依赖关系对于我们的应用至关重要,因此我们想知道这是否可能?
最近有一个publication的示例,他们展示了能够捕获这种依赖关系(如图1所示)。然而,由于这次比赛非常近(本月),我们找不到相应的脚本。

复现

with CoreNLPClient( annotators=['tokenize','ssplit','pos','depparse']) as client:
    ann = client.annotate('fermented leaves and fruit')
    sentence = ann.sentence[0]
    print(sentence.enhancedPlusPlusDependencies)
    print(sentence.alternativeDependencies)
    print(sentence.basicDependencies)
    print(sentence.enhancedDependencies)
wfveoks0

wfveoks01#

FWIW,这不太可能通过当前的模型来解决。也许在使用目标数据集的情况下,stanza模型可以支持它。

busg9geu

busg9geu2#

问题在于,这个结构在形容词是否涵盖连接词方面存在系统性的模糊性,而CoreNLP目前没有一个好的方法来判断,因此我们将保守的选择视为不添加弧线。确定何时广泛地涵盖是一个很好的研究领域,但我们看不到它被添加到CoreNLP的任何可能的未来,除非有人提供解决方案。

相关问题