我在iOS上开发应用程序,一切似乎都很好,直到我尝试捕捉数字时钟,计算器,血压监测器,电子体温计等图像。
由于某种原因,Apple Vision Framework和VNRecognizeTextRequest无法识别原始LCD屏幕上的文本,如下图所示:
您可以尝试使用Apple's sample project捕获数字,但它会失败。或者您可以尝试Vision Framework的任何其他示例项目,但它将无法将数字识别为文本。
作为一个最终框架用户,我能做些什么?有解决方法吗?
我在iOS上开发应用程序,一切似乎都很好,直到我尝试捕捉数字时钟,计算器,血压监测器,电子体温计等图像。
由于某种原因,Apple Vision Framework和VNRecognizeTextRequest无法识别原始LCD屏幕上的文本,如下图所示:
您可以尝试使用Apple's sample project捕获数字,但它会失败。或者您可以尝试Vision Framework的任何其他示例项目,但它将无法将数字识别为文本。
作为一个最终框架用户,我能做些什么?有解决方法吗?
2条答案
按热度按时间pcww981p1#
训练模型...
训练你自己的
.mlmodel
使用多达10K的图像包含屏幕的数字时钟,计算器,血压监测器等,您可以使用Xcode Playground
或Apple Create ML
应用程序。以下是您可以复制并粘贴到macOS Playground中的代码:
正在从图像中提取文本...
如果你想知道如何使用Vision框架从图像中提取文本,请看这篇文章。
hfsqlsce2#
您可以训练自己的模型,例如https://developer.apple.com/documentation/vision/training_a_create_ml_model_to_classify_flowers