新的高级RAG提供了ReRankingContentAggregator
,它可以根据ScoringModel
(例如CohereScoringModel
)重新排序结果。这很好用,重新排序后的结果列表肯定比向量数据库返回的结果更好(即更相关的结果更有可能位于顶部)。
然而,我注意到Cohere分配的分数变化很大。我看到一个批次内的最大分数约为0.98,但然后有批次中最高分数为0.03。因此,minScore
属性并没有那么有用。如果有一个类似于EmbeddingStoreContentRetriever
中的maxResults
属性就更好了。
2条答案
按热度按时间t9eec4r01#
略有关联的是,
EmbeddingStore
返回的EmbeddingMatch
包含了embeddingId
和score
。然而,EmbeddingStoreContentRetriever
返回的dev.langchain4j.rag.content.Content
既不包含embeddingId
也不包含score
。询问的原因可能是有些人想要使用新的高级RAG功能来检索相关内容(通过QueryTransformer
、QueryRouter
、ContentRetriever
、ContentAggregator
和ContentInjector
),例如将其呈现为用户相关的内容列表。uz75evzq2#
好的方面,谢谢!