以下是一些评估和决定是否值得尝试的技巧,但这取决于任务承担者尝试在选定的数据集上工作的不同技术。
voj3qocg1#
我认为除了提议的点(主要关注检索),添加专注于使用LLM生成答案的任务也是很好的。例如,
对于检索方面:
kcrjzv8t2#
在我的工作经验中,基本算术对于我所接触的所有LLMs来说一直是一个挑战。尽管有些LLMs(如代码模型)在这些任务上可能表现得稍微好一些,但它们的准确性仍然不稳定,使得它们不适合用于生产环境。
对于索引PDF,我建议我们可以开发一个处理文档的代理,以交互方式逐块处理文档,提取特定事实,如公司的净利润。这个代理可以为表格、图像和其他相关元素添加引用,然后我们可以用这些引用来增强这些元素的元数据。通过在文档存储中索引所有块并为表格和图像维护单独的存储,我们可以在检索过程中保留上下文。当需要访问表格时,检索过程会弹出引用它的段落。此外,在将表格的行和列传递给LLM之前对它们进行过滤可能有助于避免混淆。
我知道这需要测试,但我对它的潜力充满信心。考试结束后我会开始着手处理这个问题。
7ivaypg93#
如果你想将先进的表格问答技术添加到haystack中,我们应该开始阅读关于这个问题的论文,并讨论如何在库中实现讨论过的功能。我在我之前的项目中发现了这个非常有用。我会开始列出一些要阅读的论文,并尝试制定一些指导方针,以便在某个阅读小组或其他地方研究这个问题。如果有人愿意帮助我,我将非常乐意合作。如果你有其他建议,我愿意根据你提出的建议合作。
3条答案
按热度按时间voj3qocg1#
我认为除了提议的点(主要关注检索),添加专注于使用LLM生成答案的任务也是很好的。例如,
对于检索方面:
kcrjzv8t2#
在我的工作经验中,基本算术对于我所接触的所有LLMs来说一直是一个挑战。尽管有些LLMs(如代码模型)在这些任务上可能表现得稍微好一些,但它们的准确性仍然不稳定,使得它们不适合用于生产环境。
对于索引PDF,我建议我们可以开发一个处理文档的代理,以交互方式逐块处理文档,提取特定事实,如公司的净利润。这个代理可以为表格、图像和其他相关元素添加引用,然后我们可以用这些引用来增强这些元素的元数据。通过在文档存储中索引所有块并为表格和图像维护单独的存储,我们可以在检索过程中保留上下文。当需要访问表格时,检索过程会弹出引用它的段落。此外,在将表格的行和列传递给LLM之前对它们进行过滤可能有助于避免混淆。
我知道这需要测试,但我对它的潜力充满信心。考试结束后我会开始着手处理这个问题。
7ivaypg93#
如果你想将先进的表格问答技术添加到haystack中,我们应该开始阅读关于这个问题的论文,并讨论如何在库中实现讨论过的功能。我在我之前的项目中发现了这个非常有用。我会开始列出一些要阅读的论文,并尝试制定一些指导方针,以便在某个阅读小组或其他地方研究这个问题。如果有人愿意帮助我,我将非常乐意合作。
如果你有其他建议,我愿意根据你提出的建议合作。