根据Jurafsky和Martin的书,以及original paper(等式5),P(F,A|E)不仅仅是单词概率的乘积,还应该由对齐概率(eps / (l + 1)^m)进行加权。这在prob_t_a_given_s()
的实现中缺失了,因为它实际上只计算了P(F|A,E)。所以要么
- 应该将缺失的代码添加到其中,或者
- 应该将其重命名为
prob_t_given_a_s()
。
根据Jurafsky和Martin的书,以及original paper(等式5),P(F,A|E)不仅仅是单词概率的乘积,还应该由对齐概率(eps / (l + 1)^m)进行加权。这在prob_t_a_given_s()
的实现中缺失了,因为它实际上只计算了P(F|A,E)。所以要么
prob_t_given_a_s()
。
4条答案
按热度按时间3zwjbxry1#
关于这个状态?我可以稍后进行一些研究。您还需要说明您所指的是哪个IBMReference模型。谢谢
l3zydbqr2#
你好,我在原始论文中标注了方程编号。如果你指的是NLTK中的哪个模型,我很抱歉,但我不记得了。毕竟这已经是6年前的问题了。
sxpgvts33#
什么是epsilon?在论文中不是完全清楚吗?
o8x7eapl4#
我读了这篇论文,但实际上不清楚实际方程应该是什么。