Apache Solr中的准确性文档嵌入

bwntbbo3 于 2022-11-05 发布在 Solr

关注(0)|答案(1)|浏览(197)

我使用Bert文档嵌入在CACM数据集上执行信息检索。我获得了非常低的准确率分数，大约6%。然而，当我使用传统的BM-25方法时，结果非常接近40%，这接近于文献中发现的该数据集的平均准确率。这一切都是在Apache Solr中执行的。
我也尝试过使用Doc 2 Vec进行信息检索，但结果和BERT一样糟糕。对于像这样的IR任务，使用文档嵌入是否不可取？

solr

来源：https://stackoverflow.com/questions/71735350/accuracy-document-embedding-in-apache-solr

1条答案

按热度按时间

5f0d552i1#

许多人发现文档嵌入对于他们的目的来说工作得非常好！
如果他们不为你工作，可能的原因包括：

训练数据不足
未显示的进程中的问题
不同的最终目标-你对“准确性”的看法是什么？-与其他人不同

如果没有更多关于你的目标和行动的细节，就不可能说出是什么影响了你的过程，以及对它的有用性的原始感知。
最值得注意的是，如果有其他已发表的工作使用相同的数据集，并且对“准确性”有类似的定义，而其他已发表的工作声称使用相同的方法得到更好的结果，而对你来说却给予更差的结果，那么你的实现中更有可能存在错误。
你必须命名你试图匹配的结果（理想的是与确切的文章链接），并显示你的代码做什么的细节，让其他人有任何机会猜测你发生了什么。

赞(0）回复(0）举报 2022-11-05

我来回答

Apache Solr中的准确性文档嵌入

1条答案

相关问题

热门标签

最新问答