llama_index [问题]:为什么当我查询我的索引时，它只索引2个文件，而我却有10个csv文件？

7nbnzgx9 于 4个月前发布在其他

关注(0)|答案(5)|浏览(113)

问题验证

我有一个索引，它是从数据目录中的10个csv文件构建的。但是当我查询时，它只包含2个被索引的文件，而且它并不总是相同的2个文件，每次可能是2个不同的文件。这是我的代码：

def construct_index(directory_path):
    max_input_size = 4096
    num_outputs = 512
    max_chunk_overlap = 1.0
    chunk_size_limit = 600

5条答案

你如何知道它是两个文件？你在检查什么来确认这个？

在响应中，我正在查看源节点。我会附上一些截图。

这是我索引中的文件：

默认的top k值为2,因此源节点始终是从索引中检索到的前2个节点。这就是为什么它会发生变化，以及为什么它总是2。

你可以增加顶部的k值，例如index.as_query_engine(similarity_top_k=3)。

啊，这很有道理，谢谢，我会尝试的！