我目前正在使用Amplify Framework for Android和它的预测插件,基本上是AWS Textract,将图像转换为文本。以前,我使用的是Firebase文本识别功能,该功能将文本划分为块、行和每个块中的单词。另一方面,Textract只将文本划分为行。
Amplify Framework
AWS Textract
Firebase
我使用的图片通常是屏幕截图,它们通常包含不止一列文本,因为现在我只得到行,我不知道如何将文本分成块。有没有办法配置Textract先把文本分成块,或者有没有办法手工精确地把它分成块?
Textract
hgb9j2n61#
不幸的是,Textract不提供阻止部分/段落的功能。Textract文本检测返回3个主要对象:页面、行块和字块[1]。行/字块的JSON响应对象中包括一个几何对象,该对象定义了一个边界框和多边形[2]。为了获得您想要的结果,使用Textract响应数据,您必须根据几何数据进一步处理行块,并将其分组。
1条答案
按热度按时间hgb9j2n61#
不幸的是,Textract不提供阻止部分/段落的功能。
Textract文本检测返回3个主要对象:页面、行块和字块[1]。
行/字块的JSON响应对象中包括一个几何对象,该对象定义了一个边界框和多边形[2]。为了获得您想要的结果,使用Textract响应数据,您必须根据几何数据进一步处理行块,并将其分组。