android AWS Textract检测线而非块

hm2xizp9  于 2023-02-06  发布在  Android
关注(0)|答案(1)|浏览(225)

我目前正在使用Amplify Framework for Android和它的预测插件,基本上是AWS Textract,将图像转换为文本。
以前,我使用的是Firebase文本识别功能,该功能将文本划分为块、行和每个块中的单词。
另一方面,Textract只将文本划分为行。

我使用的图片通常是屏幕截图,它们通常包含不止一列文本,因为现在我只得到行,我不知道如何将文本分成块。
有没有办法配置Textract先把文本分成块,或者有没有办法手工精确地把它分成块?

hgb9j2n6

hgb9j2n61#

不幸的是,Textract不提供阻止部分/段落的功能。
Textract文本检测返回3个主要对象:页面、行块和字块[1]。
行/字块的JSON响应对象中包括一个几何对象,该对象定义了一个边界框和多边形[2]。为了获得您想要的结果,使用Textract响应数据,您必须根据几何数据进一步处理行块,并将其分组。

相关问题