我正在使用LayoutLM2和LayoutLM3进行关键信息提取。由于输出注解已经归一化,很难获得标记级别的注解。
我考虑将这类任务重新表述为类似Marksend et al, Doc2Dict: Information Extraction as Text Generation的语言生成问题。然而,LayoutLM是否具备/擅长语言生成的能力?
我正在使用LayoutLM2和LayoutLM3进行关键信息提取。由于输出注解已经归一化,很难获得标记级别的注解。
我考虑将这类任务重新表述为类似Marksend et al, Doc2Dict: Information Extraction as Text Generation的语言生成问题。然而,LayoutLM是否具备/擅长语言生成的能力?
2条答案
按热度按时间bd1hkmkf1#
@pzdkn LayoutLM可以作为通用编码器用于下游任务。对于语言生成任务,您可能需要为生成或复制操作设计解码器。
mklgxw1f2#
@pzdkn any update ?