nltk prob_t_a_given_s() 只计算了它应该计算的一半,

smtd7mpg  于 6个月前  发布在  其他
关注(0)|答案(4)|浏览(45)

根据Jurafsky和Martin的书,以及original paper(等式5),P(F,A|E)不仅仅是单词概率的乘积,还应该由对齐概率(eps / (l + 1)^m)进行加权。这在prob_t_a_given_s()的实现中缺失了,因为它实际上只计算了P(F|A,E)。所以要么

  • 应该将缺失的代码添加到其中,或者
  • 应该将其重命名为prob_t_given_a_s()
3zwjbxry

3zwjbxry1#

关于这个状态?我可以稍后进行一些研究。您还需要说明您所指的是哪个IBMReference模型。谢谢

l3zydbqr

l3zydbqr2#

你好,我在原始论文中标注了方程编号。如果你指的是NLTK中的哪个模型,我很抱歉,但我不记得了。毕竟这已经是6年前的问题了。

sxpgvts3

sxpgvts33#

什么是epsilon?在论文中不是完全清楚吗?

o8x7eapl

o8x7eapl4#

我读了这篇论文,但实际上不清楚实际方程应该是什么。

相关问题