我在试用rhipe和rhadoop[rmr rhdfs rhbase等]系列软件包。
现在,在这两个包[rhipe和rmr]中,我可以接收/读取存储到csv或文本文件中的数据。它们都支持创建新的文件格式,但我发现rmr对它有更多的支持,或者至少有更多的资源可以使用。好吧,当一个人计划对存储在hdfs中的原始数据执行少量数据处理,并最终希望以hadoop的其他组件(如hive impala等)可以识别的格式将其存储回hdfs时,这一要求将非常有用。这两个包都可以以仅包可以识别的本机格式编写。包rmr支持很少的其他格式。
有关rmr的参考,请查看:https://github.com/revolutionanalytics/rmr2/blob/master/docs/getting-data-in-and-out.md
然而,对于rhipe,我没有得到任何这样的文件,我尝试了各种方法,但都失败了。
所以我的问题是,在读取存储在hdfs中的文件并运行 rhwatch
在rhipe?
暂无答案!
目前还没有任何答案,快来回答吧!