是否存在相同错误的现有问题?
- 我已检查了现有问题。
分支名称
main
提交ID
main
其他环境信息
- 无响应*
实际行为
请解释查询中的boost设置?
ragflow/rag/nlp/search.py
第85行 58e95f7
| | bqry.boost=0.05 |
预期行为
- 无响应*
重现步骤
I am not sure: https://github.com/infiniflow/ragflow/blob/58e95f76c1054c9e4003d7b267b33cd8be870fc0/rag/nlp/search.py#L85
should `bqry.boost` be 0.5 as query(for bm25) and knn are both set to `bqry.boost`.
if it's not 0.5, why set 0.05 here? can you guys explain this? Thanks.
其他信息
- 无响应*
2条答案
按热度按时间hrirmatl1#
这是一个经验值。BM25的相似度分数通常比knn的余弦分数(介于0和1之间)要大得多。
rt4zxlrg2#
@KevinHuSh 感谢你的回复。我对es搜索几乎一无所知,这让我感到很困惑。
如果
bm25
中的boost值是一个经验值,为什么在Line131中设置s["knn"]["filter"] = bqry.to_dict()
?似乎knn
使用的boost值相同。经过一些研究,我发现boost的默认值是2.2,那么在这里
KNN
的boost值到底是什么?非常感谢。