Tensorflow:模型拟合不收敛

dy2hfwbg  于 2023-03-19  发布在  其他
关注(0)|答案(1)|浏览(97)

我试图训练一个一维卷积网络来区分信号,但是优化并不收敛,损失函数在完全发散之前会减小一点。
我用下面的小例子重现了这个问题。
数据由4个向量组成,4个向量由8个相同值组成:

data=np.array([[[1, 2, 3, 4],
                [1, 2, 3, 4],
                [1, 2, 3, 4],
                [1, 2, 3, 4],
                [1, 2, 3, 4],
                [1, 2, 3, 4],
                [1, 2, 3, 4],
                [1, 2, 3, 4]]])

每个向量的标签就是这个值:

labels=np.array(np.array([[0, 1, 2, 3]]))

我曾试图构建一个尽可能简单的网络来重现这个问题,但修改它的结构或激活函数并不会对结果产生太大影响:
一个二个一个一个
不幸的是,优化不能收敛。
非常感谢!

roejwanj

roejwanj1#

我很抱歉,但是如果我理解错了,请纠正我!
正如我所看到的,你的数据都是一样的,我想它是如何能够确定每个样本之间的差异,以将它们归类到每个类?
我对你提供的数据感到困惑。

相关问题