我必须用hadoopmapreduce代码解析x12文件。有人能告诉我怎么做吗?解析后的输出应该可以被其他hadoop工具(如hive)使用谢谢,罗克托
3pmvbmvn1#
我们需要更多的信息,但在高层:根据您的语言获取或创建x12解析器。https://code.google.com/p/x12-parser/http://www.smooks.org/mediawiki/index.php?title=main_page决定mapreduce作业将输出什么:每个x12文档的xml树一堆片段???编写一个获取x12文档的作业(您没有说明它们是如何存储的,但我假设您在hdfs中有x12文件),并使用解析器向下游发出您想要的任何内容。
1条答案
按热度按时间3pmvbmvn1#
我们需要更多的信息,但在高层:
根据您的语言获取或创建x12解析器。https://code.google.com/p/x12-parser/http://www.smooks.org/mediawiki/index.php?title=main_page
决定mapreduce作业将输出什么:
每个x12文档的xml树
一堆片段
???
编写一个获取x12文档的作业(您没有说明它们是如何存储的,但我假设您在hdfs中有x12文件),并使用解析器向下游发出您想要的任何内容。