我正在研究一些用于阅读特定文本(OCR)的原型。很明显,在互联网上有这么多的例子等,但到目前为止,我无法找到任何有用的信息,为我的情况。一切对我来说都太笼统了。我不想花时间学习:)所以这就是它在这一刻的样子:
1.设备上的ML套件不适用于我的病例。
1.我已经构建了一个训练器来使用Python和Keras训练我自己的自定义模型。在最后的过程中,我得到了。tflite模型。
1.我想在我的Android应用程序中使用它。所以我的第一个方法是使用ML Kit和自定义模型。但是……它是为图像识别而生的(检测图像中的东西,而不是文本)
https://codelabs.developers.google.com/codelabs/mlkit-android-custom-model/index.html?index=..%2F..index#0
我找不到任何使用自定义模型进行文本识别的示例(在设备解决方案上)
- 所以问题nr1是**:是否可以将ML Kit与自定义模型一起用于文本识别?从:https://firebase.google.com/docs/ml-kit/android/recognize-text我可以得出结论,自定义模型“在设备上”只支持分类和对象识别,在其他情况下,我被迫使用“云”解决方案?
如果这是正确的,那么从另一方面,我们有这样的东西:https://firebase.google.com/docs/reference/android/com/google/firebase/ml/vision/text/FirebaseVisionTextRecognizer我的结论是它可以支持“在设备上”的解决方案,但没有传递自定义模型的函数,所以我完全困惑。也许“在设备上”意味着在设备上计算,而不是在设备模型上...
- 问题nr2为**:有没有相对简单的解决办法,一些例子,如何实现这一点?
2条答案
按热度按时间xa9qqrwz1#
1.文本被识别为有打字错误-例如,锡罐上的到期日期的文本识别可能会将单词June“JUN”与“JUH”混淆。如果您试图检测的词汇表是有限的,并且错误是高度可重复的,那么一个简单的StringMap查找可能足以纠正拼写。
1.检测到文本区域,但识别错误-您可以使用ML Kit文本识别API来告诉您文本的区域,然后使用您自己的自定义模型进行识别。
1.未检测到文本区域-恐怕当前的ML Kit解决方案无法解决这种情况。
在所有情况下,如果语言是拉丁语,请提交bug。如果它是一种非拉丁语言,则属于enhancement request。
如果输入可以来自用户在屏幕上的绘图而不是静态图片,请检查new Digital Ink Recognition API。
kfgdxczn2#
嗨,我刚刚发现你的问题,我也面临着同样的问题,我有一个自定义的OCR模型。但似乎我在互联网上找到的所有示例都依赖于MLKit