如何以级联方式读写二进制文件?

g0czyy6m  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(278)

我想加载一些二进制格式的文件(例如jpeg,但可以是任何二进制格式),以某种方式对其进行操作并将其写回。我想在hadoop上这样做,我想在级联框架上编写它。
有二进制格式文件的二进制接收器/选项卡吗?还有别的办法吗?
我什么也找不到。我能想到的唯一选择是,也许我应该实现自己的hadoop inputformat,以字节数组或java bytebuffer的形式读取文件,但我觉得奇怪的是,没有内置的解决方案(因为我肯定我不是第一个遇到这个问题的人)。
如果有人有任何建议,我们将不胜感激

vsdwdz23

vsdwdz231#

您将不得不编写自己的hadoop InputFormat 处理二进制数据,然后以自定义级联格式 Package 输入格式 Scheme . 好的一面是,你不需要一个习惯 Tap .
这一切都来自作者本人。

相关问题