翻译结果为:目前,对于简单的文本文件上传(适用于PDF和CSV文件),需要将文本转换为嵌入,存储到矢量数据库中,然后才能使用/发布聊天机器人。如果我们能自动执行第一步,当用户在嵌入式聊天中上传文本文件时,这将是一个巨大的改进(当然,文件大小限制应该适用)。
sc4hvdpw1#
与 - #2444
slmsl1lt2#
与#2084相同,也很好 :-)@HenryHengZJ - 通过调用Flowise API是否可行?(即,而不是传递base64编码的图像,传递PDF URL或Claude需要支持的其他内容)- 你能想到任何解决方法吗?顺便说一下,随着多模态的快速增长,这应该是一个更高优先级的项目。
w8f9ii693#
@HenryHengZJ - 我查看了Anthropic Claude API文档,它看起来Create消息API接受文本或base64编码的图像,这意味着为了支持PDF/None图像格式,他们在调用API之前必须进行一些预处理,提取文本/图像的活动,所以这是支持这个的计划方式吗?或者你打算使用某种嵌入技术等。
我有一个使用案例,PDF文件中只有图像(扫描的文档),所以我需要找出基本的支持方式。
我可以从PDF中提取图像(每个PDF页面一个图像),然后用提取的图像调用API,但我不确定这是否是处理此请求的最有效方式。
3条答案
按热度按时间sc4hvdpw1#
与 - #2444
slmsl1lt2#
与#2084相同,也很好 :-)
@HenryHengZJ - 通过调用Flowise API是否可行?(即,而不是传递base64编码的图像,传递PDF URL或Claude需要支持的其他内容)- 你能想到任何解决方法吗?
顺便说一下,随着多模态的快速增长,这应该是一个更高优先级的项目。
w8f9ii693#
@HenryHengZJ - 我查看了Anthropic Claude API文档,它看起来Create消息API接受文本或base64编码的图像,这意味着为了支持PDF/None图像格式,他们在调用API之前必须进行一些预处理,提取文本/图像的活动,所以这是支持这个的计划方式吗?或者你打算使用某种嵌入技术等。
我有一个使用案例,PDF文件中只有图像(扫描的文档),所以我需要找出基本的支持方式。
我可以从PDF中提取图像(每个PDF页面一个图像),然后用提取的图像调用API,但我不确定这是否是处理此请求的最有效方式。