我正在使用带有Keras后端的Qubvel分割模型https://github.com/qubvel/segmentation_models来训练医学二值分割问题。我可以使用输入图像和空间维度为256 x 224、256 x 256、512 x 480、512 x 512以及其他值的模板来训练模型,只要宽度和高度可以被32整除。否则,模型不训练。2输入的宽度和高度被32整除的规则背后的数学定义是什么?
我正在使用带有Keras后端的Qubvel分割模型https://github.com/qubvel/segmentation_models来训练医学二值分割问题。我可以使用输入图像和空间维度为256 x 224、256 x 256、512 x 480、512 x 512以及其他值的模板来训练模型,只要宽度和高度可以被32整除。否则,模型不训练。2输入的宽度和高度被32整除的规则背后的数学定义是什么?
1条答案
按热度按时间fwzugrvs1#
Unet architecture
(来自原始论文,如下所示)通过编码器中的下采样层和解码器中的上采样层工作。它有5个这样的层。选择32的倍数(2^5)可以确保下采样和上采样过程产生相同的输入和输出分辨率,以便可以在像素级别计算损失。话虽如此,如果您想让它为不同的输入大小工作,您只需要确保解码器(通过填充或其他方式)在每个中间级别(对于跳过连接)以及输出图像返回与编码器输出相同的大小。