我一直在尝试编写一个模型,该模型查看带有网格的图像,并返回一个包含该网格内容的矩阵。
以下是输入图像的示例:
Input
这应该是输出:
[30202133333,
12022320321,
23103100322,
13103110301,
22221301212,
33100210001,
11012010320,
21230233011,
00330223230,
02121221220,
23133103321,
23110110330]
0:蓝色,1:粉色,2:淡紫色,3:绿色
我很难找到如何做到这一点的资源。最简单的方法是什么?
先谢了!
1条答案
按热度按时间neskvpey1#
可以有多种设计选择来生成这种类型的输出。我建议使用自动编码器。
以下是有关取自Wikipedia的自动编码器的一些信息-
自动编码器是一种人工神经网络,用于学习无标签数据的有效编码(无监督学习)。1通过尝试从编码重新生成输入来验证和优化编码。自动编码器通过训练网络忽略无关紧要的数据(“噪声”)来学习一组数据的表示(编码),通常用于降维。
虽然自动编码器通常用于重构输入,但将输入Map到特定矩阵的问题略有不同。您可能希望通过提供图像作为输入并提供相应的矩阵作为“标签”来设置架构。通过使用卷积层而不是MLP层,可以进一步优化架构。