llama_index [问题]:为什么当我查询我的索引时,它只索引2个文件,而我却有10个csv文件?

7nbnzgx9  于 4个月前  发布在  其他
关注(0)|答案(5)|浏览(113)

问题验证

  • 我在文档和discord上都搜索了答案。

问题

我有一个索引,它是从数据目录中的10个csv文件构建的。但是当我查询时,它只包含2个被索引的文件,而且它并不总是相同的2个文件,每次可能是2个不同的文件。这是我的代码:

def construct_index(directory_path):
    max_input_size = 4096
    num_outputs = 512
    max_chunk_overlap = 1.0
    chunk_size_limit = 600
pb3s4cty

pb3s4cty1#

你如何知道它是两个文件?你在检查什么来确认这个?

w1e3prcc

w1e3prcc2#

在响应中,我正在查看源节点。我会附上一些截图。

这是我索引中的文件:

hs1ihplo

hs1ihplo3#

默认的top k值为2,因此源节点始终是从索引中检索到的前2个节点。这就是为什么它会发生变化,以及为什么它总是2。

ui7jx7zq

ui7jx7zq4#

你可以增加顶部的k值,例如index.as_query_engine(similarity_top_k=3)

ldioqlga

ldioqlga5#

啊,这很有道理,谢谢,我会尝试的!

相关问题