我正在写一个字符识别CNN。我已经使用EMNIST Dataset。
Kaggle笔记本链接:https://www.kaggle.com/code/notshrirang/ocr-with-cnn
GitHub笔记本链接:https://github.com/NotShrirang/MyOCR
我的模型在测试数据集上做得很好。但是当我使用我用手机捕捉的图像时,它从来没有正确预测过。
怎么办?请帮帮忙。
以下是我的模型架构代码片段:
第一个
训练模型时的输出:
损失与瓦尔损失图:
评估:
evaluation = new_model.evaluate(X_test, y_test)
evaluation
1.我将图像大小调整为(28x28)。
1.此外,训练、测试和真实的数据中的所有图像都转换为灰度。
1.数据集包含所有矩阵转置的图像。我已将它们拉直。
1.我尝试对数据进行归一化,但它降低了瓦尔_accuracy,因此我停止了归一化。
1.我试着打乱数据,它增加了瓦尔_accuracy,所以我保留了它。
1.我试着增加和减少模型中的层和时期。除了改变训练时间外,没有任何用处。
1.我增加了批处理规范化,增加了训练模型所需时间
1条答案
按热度按时间elcex8rz1#
有许多技术,不仅模型
1.增加数据的大小,这也会产生大量的输入。
1.使用特征提取功能和数据预处理、MFCC、Furriers和数据输入转换(模糊、旋转、翻转、填充、缩放或随机噪声)。
1.创建多组数据输入并训练K折叠验证。
1.随机数据选择、保存和加载模型或性能回调参数调整。
1.在模型或级连模型之间进行比较。
示例:我的图像识别模板,在执行功能和讨论解决方案时非常有用。
输出:他们实际上是泰国演员,从互联网上收集的广播。