我们可以在hadoop中将图像转换成avro格式吗?

qpgpyjmq  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(413)

在hadoop中可以将图像转换成avro格式吗?

qnzebej0

qnzebej01#

avro用于描述一种与平台无关的数据模式(“数据序列化系统”)。
图像本身可以编码成各种格式(png、jpeg、bmp、gif等),所有这些格式都可以表示为字节序列。您还可以定义一些关于图像的元数据(无论如何,这些元数据可能是以字节编码的,但是根据您的用例,提取它可能是有用的)。
原始模式可以如下(改编自文档):

{"namespace": "example.avro",
 "type": "record",
 "name": "Image",
 "fields": [
     {"name": "filename", "type": "string"},
     {"name": "type",  "type": "string"},
     {"name": "data", "type": "bytes"},
     {"name": "width", "type": "int"},
     {"name": "height", "type": "int"}
 ]
}

相关问题