在hadoop中可以将图像转换成avro格式吗?
qnzebej01#
avro用于描述一种与平台无关的数据模式(“数据序列化系统”)。图像本身可以编码成各种格式(png、jpeg、bmp、gif等),所有这些格式都可以表示为字节序列。您还可以定义一些关于图像的元数据(无论如何,这些元数据可能是以字节编码的,但是根据您的用例,提取它可能是有用的)。原始模式可以如下(改编自文档):
{"namespace": "example.avro", "type": "record", "name": "Image", "fields": [ {"name": "filename", "type": "string"}, {"name": "type", "type": "string"}, {"name": "data", "type": "bytes"}, {"name": "width", "type": "int"}, {"name": "height", "type": "int"} ] }
1条答案
按热度按时间qnzebej01#
avro用于描述一种与平台无关的数据模式(“数据序列化系统”)。
图像本身可以编码成各种格式(png、jpeg、bmp、gif等),所有这些格式都可以表示为字节序列。您还可以定义一些关于图像的元数据(无论如何,这些元数据可能是以字节编码的,但是根据您的用例,提取它可能是有用的)。
原始模式可以如下(改编自文档):