如何在Keras中为Inception V3自定义input_shape？

x6yk4ghg 于 2022-11-13 发布在其他

关注(0)|答案(3)|浏览(182)

我知道Inception V3的input_shape是(299,299,3)，但在Keras中，如果include_top是False，则可以构建具有自定义input_shape的Inception V3版本。
“输入形状：可选形状元组，仅当include_top为False时才指定（否则输入形状必须为(299, 299, 3)（具有'channels_last'数据格式）或(3, 299, 299)（具有'channels_first'数据格式））。它应正好具有3个输入通道，宽度和高度应不小于75。例如，(150, 150, 3)将是一个有效值”- www.example.com
这是怎么可能的？为什么只有当include_top是false时，它才能有自定义的input_shape？

keras

来源：https://stackoverflow.com/questions/54522336/how-do-custom-input-shape-for-inception-v3-in-keras-work

3条答案

按热度按时间

wlzqhblo1#

这是可能的，因为模型是完全卷积的。卷积不关心图像大小，它们是“滑动滤波器”。如果你有大图像，你有大输出，如果小图像，小输出。（滤波器，虽然，有一个固定的大小定义为kernel_size和输入和输出滤波器）
使用include_top时无法执行此操作，因为此模型可能使用Flatten()图层，最后使用Dense图层。Dense图层需要固定的输入大小（通过基于图像大小的展平来指定），否则将无法创建可训练的权重（具有可变数量的权重没有意义）

赞(0）回复(0）举报 2022-11-13

wnvonmuf2#

为了理解这一点，你应该清楚卷积是如何工作的。就像丹尼尔·默勒说的，如果图像大小改变，卷积输出大小也会改变。要点是你不能在预先训练的模型上使用自定义图像大小，因为参数是固定的。
例如，在您的情况下，inception v3使用全局平均池，然后是最后一个卷积层之后的密集层。由于它是预先训练的模型，因此密集层始终期望来自全局平均池的输入大小相同。

mixed10 (Concatenate)          (None, 8, 8, 2048)   0           ['activation_743[0][0]',         
                                                              'mixed9_1[0][0]',               
                                                              'concatenate_15[0][0]',         
                                                              'activation_751[0][0]']         
                                                                                              
avg_pool (GlobalAveragePooling  (None, 2048)        0           ['mixed10[0][0]']                
 2D)                                                                                              
                                                                                              
 predictions (Dense)            (None, 1000)         2049000     ['avg_pool[0][0]']

它总是期望全局平均池中的值为2048。这就是为什么您不能使用include_top=True和weights='imagenet'的自定义图像大小。但是，如果include_top=False和weights=None，您可以使用自定义图像大小，因为您正在初始化取决于您的图像大小的参数。
您可以像这样实现自定义图像大小

a=tf.keras.applications.inception_v3.InceptionV3(include_top=False,weights=None,
input_shape=(256,256,4))

x=tfa.layers.SpectralNormalization(layers.Conv2D(filters=64, kernel_size= 
(3,3),strides=(2,2),padding='same',activation="LeakyReLU",name='ls_1'))(a.output)

x=layers.Dropout(0.3)(x)
x=keras.Model(inputs=a.input,outputs=x)

赞(0）回复(0）举报 2022-11-13

bd1hkmkf3#

Keras API reference / Keras Applications文档包含带有自定义输入Tensor的include_top=True。
从文档中：
“在自定义输入Tensor上构建InceptionV3”

from tensorflow.keras.applications.inception_v3 import InceptionV3
from tensorflow.keras.layers import Input

# this could also be the output a different Keras model or layer
input_tensor = Input(shape=(224, 224, 3))

model = InceptionV3(input_tensor=input_tensor, weights='imagenet', include_top=True)

赞(0）回复(0）举报 2022-11-13

我来回答

如何在Keras中为Inception V3自定义input_shape？

3条答案

相关问题

热门标签

最新问答