ragflow [功能请求]:将问答知识库升级为常见问题解答知识库,

rlcwz9us  于 4个月前  发布在  其他
关注(0)|答案(3)|浏览(70)

是否存在针对相同功能请求的现有问题?

  • 已检查现有问题。

您的功能请求是否与问题相关?

  • 无响应

描述您希望实现的功能

主要针对问答系统,尤其是客服或其他有固定回复的问答系统。这里有一篇文章,可以作为参考:https://zhuanlan.zhihu.com/p/50799128
此项目已经有了QA问答的模板,就是一个问题一个回答的那种模板,但是在日常生活中,对于一个问题的问法是多样的,对于这一类问题都是同一个结果。相对于QA问答,我们也可以通过写多个QA来进行这样的目的(我自己是这样做的,不知道好不好),如下:

{"question": "你这个包安装吗", "answer": "老板,我们家是给您到货免费预约师傅上门安装,给您免费拆旧换新的,师傅上门是不会收取任何费的,无任何隐形消费,您可以放心下单!!(全程0费用的哦)"}
{"question": "安装费用", "answer": "老板,我们家是给您到货免费预约师傅上门安装,给您免费拆旧换新的,师傅上门是不会收取任何费的,无任何隐形消费,您可以放心下单!!(全程0费用的哦)"}
{"question": "这个包安装吗", "answer": "老板,我们家是给您到货免费预约师傅上门安装,给您免费拆旧换新的,师傅上门是不会收取任何费的,无任何隐形消费,您可以放心下单!!(全程0费用的哦)"}
{"question": "包安装吗", "answer": "老板,我们家是给您到货免费预约师傅上门安装,给您免费拆旧换新的,师傅上门是不会收取任何费的,无任何隐形消费,您可以放心下单!!(全程0费用的哦)"}

但是不久前了解到了FAQBot客服机器人这个项目,这个技术18年开始出现的,好多大厂客服机器人就是这个逻辑,发现他们有些想法非常不错。用户的问题虽然形式和说法各有不一,千奇百怪,但是其整体分布上是一个稳定的状态。而回答却会随着业务的发展和国家政策的更改不断发生变化。即QA数据本身,A就会发生变化,而Q却不会发生太大变化。而且问题和问题的语义空间是一致的,而问题与回答的语义空间可能是不一致的。这时候把相同语言的放在一起嵌入向量数据库会更加的好,他们的模板是这样的:

{
 'question': '你这个包安装吗',
 'similar_question':['安装费用',
 '这个包安装吗',
 '包安装吗']
 'answer': "老板,我们家是给您到货免费预约师傅上门安装,给您免费拆旧换新的,师傅上门是不会收取任何费的,无任何隐形消费,您可以放心下单!!(全程0费用的哦)"
}
eyh26e7m

eyh26e7m1#

我认为RAGFlow的问答功能已经很好地满足了这个要求。
我们使用RAG的原因是因为LLM可以识别相似的问题,而不需要枚举所有问题来回答。
RAGFlow将支持DOCX、PDF和MD等文件格式的问答,以处理更复杂的问答。
目前,仅支持TAB分隔的CSV文件和EXCEL。

5sxhfpxr

5sxhfpxr2#

我认为RAGFlow的问答系统已经很好地满足了这个要求。我们使用RAG的原因是因为LLM可以识别相似的问题,而不需要枚举所有问题并给出答案。RAGFlow支持DOCX、PDF和MD等格式的问答文件,以处理更复杂的问答。目前,仅支持TAB分隔的CSV文件和EXCEL。

首先感谢您的回复。在这里,我确实有些不明白。根据RAG的原理,我们可以简单地将其分为检索召回和生成两个阶段。在检索召回阶段,LLM模型并没有发挥作用,仍然基于向量数据库进行检索。虽然相似的语义可能分布在同一个空间中,但这并不意味着它具有语义识别能力。请问在检索召回阶段,哪里使用了LLM的能力?我们不是应该先找到正确的问题,然后通过找到的问题结合LLM模型来生成答案吗?

r55awzrz

r55awzrz3#

正确。搜索和检索与LLM无关。

相关问题