我想加载一些二进制格式的文件(例如jpeg,但可以是任何二进制格式),以某种方式对其进行操作并将其写回。我想在hadoop上这样做,我想在级联框架上编写它。有二进制格式文件的二进制接收器/选项卡吗?还有别的办法吗?我什么也找不到。我能想到的唯一选择是,也许我应该实现自己的hadoop inputformat,以字节数组或java bytebuffer的形式读取文件,但我觉得奇怪的是,没有内置的解决方案(因为我肯定我不是第一个遇到这个问题的人)。如果有人有任何建议,我们将不胜感激
vsdwdz231#
您将不得不编写自己的hadoop InputFormat 处理二进制数据,然后以自定义级联格式 Package 输入格式 Scheme . 好的一面是,你不需要一个习惯 Tap .这一切都来自作者本人。
InputFormat
Scheme
Tap
1条答案
按热度按时间vsdwdz231#
您将不得不编写自己的hadoop
InputFormat
处理二进制数据,然后以自定义级联格式 Package 输入格式Scheme
. 好的一面是,你不需要一个习惯Tap
.这一切都来自作者本人。