nltk STANFORD_CORENLP环境变量出现两次

mw3dktmi  于 2个月前  发布在  其他
关注(0)|答案(4)|浏览(28)

你好,
我不确定这是否是有意这样开发的,但现在nltk/nltk/parse/stanford.py的样子是这样的:

stanford_jar = max(
    find_jar_iter(
        self._JAR, path_to_jar,
        env_vars=('STANFORD_PARSER', 'STANFORD_CORENLP'),
        searchpath=(), url=_stanford_url,
        verbose=verbose, is_regex=True
    ),
    key=lambda model_path: os.path.dirname(model_path)
)

请注意,'STANFORD_CORENLP'出现了两次,分别对应两个不同的目的。这是原始文件中的第48行和第58行。这是一个问题吗?'STANFORD_CORENLP'指的是stanford-corenlp.jar和stanford-corenlp-models.jar?

icnyk63a

icnyk63a1#

我不确定,我从未理解过find_jar_iter背后的逻辑...也许值得删除,因为已经有了corenlp模型。

6gpjuf90

6gpjuf902#

我正在尝试使用模型路径名称加载多个模型,但它不起作用。经过一些调查,我得出结论,我的代码似乎没有错误,也许“STANFORD_CORENLP”出现两次可能是错误。
有人能确认这是预期的行为还是错误吗?
提前感谢。

x9ybnkn6

x9ybnkn63#

希望一旦我们将所有人迁移到新的nltk.parse.corenlp接口,这个问题就会消失;P
并且在之后的版本中主要执行一个硬删除所有nltk.*.stanford模块的操作。

g9icjywg

g9icjywg4#

尽管移除模块可能是一个过于激进的步骤,但我会将它们暂时标记为已弃用。

相关问题