如何将xml数据导入hadoop

woobm2wo  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(450)

我对hadoop非常陌生,我想将半结构化数据xml导入hdfs。将xml数据从远程位置导入hdfs和任何用于此的开源工具的方法是什么?flume可以将xml数据导入hdfs吗?提前谢谢

z4bn682m

z4bn682m1#

您可以尝试使用hdfs-javaapi在hdfs中创建文件,并在每个文件中编写xml的全部内容。
是的,如果有大量的xml文件从源代码生成并希望嵌入hdfs,那么您也可以使用flume。
您可以查看以下链接:http://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html

相关问题