问题验证
- 我在文档和discord上都搜索了答案。
问题
我有一个索引,它是从数据目录中的10个csv文件构建的。但是当我查询时,它只包含2个被索引的文件,而且它并不总是相同的2个文件,每次可能是2个不同的文件。这是我的代码:
def construct_index(directory_path):
max_input_size = 4096
num_outputs = 512
max_chunk_overlap = 1.0
chunk_size_limit = 600
5条答案
按热度按时间pb3s4cty1#
你如何知道它是两个文件?你在检查什么来确认这个?
w1e3prcc2#
在响应中,我正在查看源节点。我会附上一些截图。
这是我索引中的文件:
hs1ihplo3#
默认的top k值为2,因此源节点始终是从索引中检索到的前2个节点。这就是为什么它会发生变化,以及为什么它总是2。
ui7jx7zq4#
你可以增加顶部的k值,例如
index.as_query_engine(similarity_top_k=3)
。ldioqlga5#
啊,这很有道理,谢谢,我会尝试的!