是否有一个内置的机制来标记额外的元数据到hdfs文件,并根据标记的信息检索文件?比如说,如果我想向数据中添加企业级的信息,是可以在hadoop中实现,还是需要其他框架
ztigrdn81#
这可能对你有用queryio提供了高级的手动和自动数据标记功能,允许您在文件写入hdfs时定义文件的属性。它自动存储hdfs中存储的基本元数据文件,并通过允许您定义其他元数据来进一步扩展元数据层。它可以理解几十种文件格式,如pdf/xls/doc文件格式、图像文件、音频和视频文件等。http://www.slideshare.net/queryio/hadoop-data-tagging-and-metadata-extension
1条答案
按热度按时间ztigrdn81#
这可能对你有用
queryio提供了高级的手动和自动数据标记功能,允许您在文件写入hdfs时定义文件的属性。它自动存储hdfs中存储的基本元数据文件,并通过允许您定义其他元数据来进一步扩展元数据层。它可以理解几十种文件格式,如pdf/xls/doc文件格式、图像文件、音频和视频文件等。
http://www.slideshare.net/queryio/hadoop-data-tagging-and-metadata-extension