llama_index [问题]:AzStorageBlobReader与LlamaParse的集成

sgtfey8w  于 4个月前  发布在  其他
关注(0)|答案(1)|浏览(116)

问题验证

  • 我已经在文档和Discord上寻找答案。

问题

我目前正在使用 LlamaParse 作为 file_extractor,并与 AzStorageBlobReader 一起读取blob存储中的PDF文件,同时解析文档。目前,这种集成只允许 .load_data() 输出解析结果,可以是文本或markdown格式。是否有办法将解析结果以JSON格式输出,就像LlamaParse中提到的 get_json_result() 一样?
谢谢。

jexiocij

jexiocij1#

是的,当使用LlamaParse作为file_extractorAzStorageBlobReader一起读取blob存储中的PDF时,可以使用get_json_result()方法输出解析结果为JSON。get_json_result()方法在LlamaIndex框架的DashScopeParse类中定义。
以下是get_json_result()方法的相关代码片段:

def get_json_result(
self, file_path: Union[List[str], str], extra_info: Optional[dict] = None
) -> List[dict]:
extra_info = {"parse_fmt_type": ResultType.DASHSCOPE_DOCMIND.value}
"""Parse the input path."""
try:
return asyncio.run(self.aget_json(file_path, extra_info))
except RuntimeError as e:
if nest_asyncio_err in str(e):
raise RuntimeError(nest_asyncio_msg)
else:
raise


此方法可用于解析输入文件路径并以JSON格式返回结果。

* 要继续与[Dosu](https://dosu.dev)交谈,请提及@dosu。*

相关问题