unilm [LayoutLM]您是否计划为SROIE数据集开源收据理解任务示例?

ijnw1ujt  于 6个月前  发布在  其他
关注(0)|答案(6)|浏览(44)

能够重现SROIE challenge上获得的结果真是太棒了。

xzlaal3s

xzlaal3s2#

这里也是。我得到的结果与论文中展示的非常不同。

db2dz4w8

db2dz4w84#

伟大的工作@ruifcruz!我现在正在尝试运行你的笔记本。

bksxznpy

bksxznpy5#

也许这有帮助:https://github.com/ruifcruz/sroie-on-layoutlm
我明白了,这个笔记本直接使用了原始数据集提供的OCR注解。我们是否知道原始作者在SROIE信息提取任务中使用的OCR引擎是什么?LayoutLMv2论文提到他们“使用官方的OCR注解”。这是否意味着没有进行OCR操作,而是直接使用了注解?

kxxlusnw

kxxlusnw6#

据我所知(从那时起已经过去了一段时间),他们使用了Tesseract(在v1版本中)。我想说,他们不需要OCR,因为他们已经有了来自比赛的注解。

相关问题