gensim Only take forward window step of a sentence for Word2vec

bq3bfh9z  于 3个月前  发布在  其他
关注(0)|答案(1)|浏览(42)

根据Word2vec文档,参数window是句子中当前词和预测词之间的最大距离,它会将一个词的前后距离作为上下文。但是,我该如何只取向前的距离并添加一个补丁呢?

a7qyws3x

a7qyws3x1#

你可能想要查看 word2vec.py 文件中关于 model.window 的引用,以增强纯 Python 路径中的窗口处理(很少使用但保留用于指导目的),以及 word2vec_inner.pyx(Cython)文件中关于 model.windowwindow 的引用,以增强 Cython 实现中的性能关键窗口处理。
如果你能证明这种方法在实际应用中具有优势,那么它将是一个受欢迎的贡献。然而,由于缺乏主张这种方法的重要公开研究,我猜测任何尝试过它的研究人员都会发现平衡窗口表现更好。

相关问题