为什么视频是大数据背景下的非结构化数据?

b4qexyjb  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(397)

我正在努力钻研大数据,我遇到的术语很少是 structured 以及 unstructured data . 我明白这是什么意思 structured 以及非结构化数据。
我很难理解为什么视频和照片属于 unstructured data .
有人能帮我理解吗?

eqqqjvef

eqqqjvef1#

“结构化”数据的大多数定义都是指具有高度组织性的数据,通常意味着预定义的数据模式。模式通常由若干字段按特定顺序组成,每个字段仅包含一种类型的数据,与经典的db表非常相似:

userId,username,age,location,joinedOn
12,"Polly",20,"Washington DC","2016-02-23 13:34:01"
14,"Dan",19,"San Diego CA","2016-11-10 18:32:21"
15,"Shania",36,"","2017-01-04 10:46:39"

在本例中,有两个字符串字段、两个整数字段和一个日期/时间类型字段。在大数据环境中,这允许方便的数据查询/处理、大大改进的压缩以及高效的存储。所有这些都可能是难题,尤其是当数据量越来越大时。
现在考虑图像,它可以用许多不同的方式表示:简单位图、矢量、渐进式JPEG、内置可变压缩格式、分形、动画帧容器等。不仅如此,图像还有不同的大小、调色板和元数据,所有这些变化意味着您不能将两个具有不同属性的图像视为一个数据模式(这意味着您无法获得面向列的存储、压缩或查询的好处)。
至于视频,以上所有的都是正确的,除了你有容器格式,其中可以包含多个不同的视频(和音频)编解码器和压缩内,增加了进一步的复杂性。

相关问题