模型是否可以理解弯曲的文本?如果可以,是如何实现的?在文档和已发表的论文中没有对此进行解释。有人尝试使用预训练模型来预测场景文本数据集吗?
km0tfn4u1#
@senthil-r-10,我们没有在DiT训练中使用曲线文本,所以目前不支持。但是你可以继续训练这个模型以支持曲线文本检测。对于场景文本,你所说的场景文本文档是什么意思?你能举一些例子吗?
9vw9lbht2#
我的意思是,我只打算使用曲线文本检测方法,用于OCR文本检测,例如收据和发票。你能更新帮助文档中的数据准备链接吗?https://mmocr.readthedocs.io/en/v0.6.0/datasets/det.html#funsd
o4hqfura3#
@wolfshow :我之前使用合成数据训练了一个 DONUT 模型来适应新的语言。你认为在 DiT 文本检测中,是否可能采用相同的策略?其次,无法访问 /dit/text_detection 中列出的模型检查点或权重。所有链接都出现 PublicAccessNotPermitted 错误。
3条答案
按热度按时间km0tfn4u1#
@senthil-r-10,我们没有在DiT训练中使用曲线文本,所以目前不支持。但是你可以继续训练这个模型以支持曲线文本检测。对于场景文本,你所说的场景文本文档是什么意思?你能举一些例子吗?
9vw9lbht2#
我的意思是,我只打算使用曲线文本检测方法,用于OCR文本检测,例如收据和发票。你能更新帮助文档中的数据准备链接吗?
https://mmocr.readthedocs.io/en/v0.6.0/datasets/det.html#funsd
o4hqfura3#
@wolfshow :我之前使用合成数据训练了一个 DONUT 模型来适应新的语言。你认为在 DiT 文本检测中,是否可能采用相同的策略?
其次,无法访问 /dit/text_detection 中列出的模型检查点或权重。所有链接都出现 PublicAccessNotPermitted 错误。