langchain4j [特性]重新排序内容聚合器,包括最大结果

f1tvaqid  于 3个月前  发布在  其他
关注(0)|答案(2)|浏览(106)

新的高级RAG提供了ReRankingContentAggregator,它可以根据ScoringModel(例如CohereScoringModel)重新排序结果。这很好用,重新排序后的结果列表肯定比向量数据库返回的结果更好(即更相关的结果更有可能位于顶部)。

然而,我注意到Cohere分配的分数变化很大。我看到一个批次内的最大分数约为0.98,但然后有批次中最高分数为0.03。因此,minScore属性并没有那么有用。如果有一个类似于EmbeddingStoreContentRetriever中的maxResults属性就更好了。

t9eec4r0

t9eec4r01#

略有关联的是,EmbeddingStore返回的EmbeddingMatch包含了embeddingIdscore。然而,EmbeddingStoreContentRetriever返回的dev.langchain4j.rag.content.Content既不包含embeddingId也不包含score。询问的原因可能是有些人想要使用新的高级RAG功能来检索相关内容(通过QueryTransformerQueryRouterContentRetrieverContentAggregatorContentInjector),例如将其呈现为用户相关的内容列表。

uz75evzq

uz75evzq2#

好的方面,谢谢!

相关问题