就是我有一个给定的关键词库,然后新来一篇文档,从词库里面找出几个词语作为这篇文档的关键词。
laximzn51#
目前我就在做类似的工作,效果挺不错。你的这种情况,可以这么做。
以上是一个基本的版本,直接用,效果一般。因此,需要考虑关键词的tf-idf。我是这么做的,在上面的步骤3时,对特征值进行tfidf加权。最后实验结果很好。
以上,楼主可以试试。
vsmadaxz2#
@MacQing 非常感谢,我试一下。
2条答案
按热度按时间laximzn51#
目前我就在做类似的工作,效果挺不错。
你的这种情况,可以这么做。
以上是一个基本的版本,直接用,效果一般。因此,需要考虑关键词的tf-idf。我是这么做的,在上面的步骤3时,对特征值进行tfidf加权。最后实验结果很好。
以上,楼主可以试试。
vsmadaxz2#
@MacQing 非常感谢,我试一下。