ragflow [Bug]: boost应该是0.5而不是0.05?

bq8i3lrv  于 6个月前  发布在  其他
关注(0)|答案(2)|浏览(52)

是否存在相同错误的现有问题?

  • 我已检查了现有问题。

分支名称

main

提交ID

main

其他环境信息

  • 无响应*

实际行为

请解释查询中的boost设置?
ragflow/rag/nlp/search.py
第85行 58e95f7
| | bqry.boost=0.05 |

预期行为

  • 无响应*

重现步骤

I am not sure: https://github.com/infiniflow/ragflow/blob/58e95f76c1054c9e4003d7b267b33cd8be870fc0/rag/nlp/search.py#L85

should `bqry.boost` be 0.5 as query(for bm25) and knn are both set to `bqry.boost`.

if it's not 0.5, why set 0.05 here? can you guys explain this? Thanks.

其他信息

  • 无响应*
hrirmatl

hrirmatl1#

这是一个经验值。BM25的相似度分数通常比knn的余弦分数(介于0和1之间)要大得多。

rt4zxlrg

rt4zxlrg2#

@KevinHuSh 感谢你的回复。我对es搜索几乎一无所知,这让我感到很困惑。
如果bm25中的boost值是一个经验值,为什么在Line131中设置s["knn"]["filter"] = bqry.to_dict()?似乎knn使用的boost值相同。
经过一些研究,我发现boost的默认值是2.2,那么在这里KNN的boost值到底是什么?
非常感谢。

相关问题