llama_index [问题]:有人有处理系统操作手册文档的经验或想法吗？

llew8vvj 于 4个月前发布在其他

关注(0)|答案(1)|浏览(43)

问题验证

我已在文档和Discord中寻找答案。

问题

这些文档通常包含来自应用程序或网页的屏幕截图。

llama_index

来源：https://github.com/run-llama/llama_index/issues/14518

1条答案

按热度按时间

2ic8powd1#

嘿，@thorory ,我在这里帮助你在等待人工维护者时解决任何问题或疑虑。请告诉我如何帮助你！
LlamaIndex 支持在文档中提取和索引图像，如截图。你可以使用 llama_index.readers.file 模块中的 ImageReader 类来使用 DONUT 模型或 pytesseract 从图像中解析文本。这使得你可以有效地处理系统操作手册中的截图和其他图像。
以下是一个代码片段，用于设置处理 .jpg 、 .png 和 .jpeg 文件的 ImageReader :

from PIL import Image
from llama_index.readers.file import (
    DEFAULT_FILE_EXTRACTOR,
    ImageReader,
)

@st.cache_resource
def get_file_extractor():
    image_reader = ImageReader(keep_image=True, parse_text=True)
    file_extractor = DEFAULT_FILE_EXTRACTOR
    file_extractor.update(
        {
            ".jpg": image_reader,
            ".png": image_reader,
            ".jpeg": image_reader,
        }
    )

    return file_extractor

file_extractor = get_file_extractor()

此外，LlamaIndex 还提供了 ImageDocument 和 ImageNode 类来处理索引过程中的图像。这些类确保图像可以有效地被索引和查询。
要将图像集成到已索引的文档中并显示它们，你可以使用 ImageParser 及其工具处理图像 URL 并将图像编码为 base64。这对于在 Web 应用程序或其他界面中显示图像非常有用。

要继续与 @dosu 交谈，请提及 @dosu。*

赞(0）回复(0）举报 4个月前

我来回答

llama_index [问题]:有人有处理系统操作手册文档的经验或想法吗？

问题验证

问题

1条答案

相关问题

热门标签

最新问答