keras Conv2D滤波器和CNN架构

1tuwyuhd 于 2023-01-30 发布在其他

关注(0)|答案(1)|浏览(178)

我目前正在攻读本科，我正在研究CNN模型来识别Telegu字符。
本问题分为两部分，
1.我有一个（32，32，1）形状的Telegu字符图像，我想训练我的CNN模型来识别字符。那么，我的模型架构应该是什么，以及如何决定架构，没有参数和隐藏层。我知道我的情况与手写数字识别完全相同，但我想知道如何决定这些参数。在建立这样的架构方面有什么常见的做法吗？
1.操作Conv2D（32，（5，5））意味着32个大小为5x5的过滤器应用于输入，我的问题是这些过滤器是相同还是不同，如果不同，初始化什么类型的过滤器，谁决定它们？
我试着上网，但无论我走到哪里，我得到的答案都是Conv2D操作在输入上应用过滤器并进行卷积操作。

keras

来源：https://stackoverflow.com/questions/75160539/conv2d-filters-and-cnn-architecture

1条答案

按热度按时间

cqoc49vn1#

要决定哪个模型架构是最好的，你需要实验。这是唯一的方法。正如你想要分类，VGG架构将是一个很好的起点，我相信。你需要实验的参数数量，因为它取决于你的问题。你可以使用Keras调谐器：https://keras.io/keras_tuner/对于内核初始化，据我所知Keras中的卷积层使用Glorot Uniform Initialization，但您可以通过使用kernel_initializer参数来更改它。长话短说，卷积层使用分布函数初始化，随着训练的进行，过滤器会更改内部的值，这就是学习过程。https://keras.io/api/layers/initializers我忘了告诉你，我建议VGG架构，但在某种程度上你缩小了模型很多。你的输入形状很少，所以如果你的模型太深，你会过拟合真的很快。

赞(0）回复(0）举报 2023-01-30

我来回答

keras Conv2D滤波器和CNN架构

1条答案

相关问题

热门标签

最新问答