我对hadoop非常陌生,我想将半结构化数据xml导入hdfs。将xml数据从远程位置导入hdfs和任何用于此的开源工具的方法是什么?flume可以将xml数据导入hdfs吗?提前谢谢
z4bn682m1#
您可以尝试使用hdfs-javaapi在hdfs中创建文件,并在每个文件中编写xml的全部内容。是的,如果有大量的xml文件从源代码生成并希望嵌入hdfs,那么您也可以使用flume。您可以查看以下链接:http://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html
1条答案
按热度按时间z4bn682m1#
您可以尝试使用hdfs-javaapi在hdfs中创建文件,并在每个文件中编写xml的全部内容。
是的,如果有大量的xml文件从源代码生成并希望嵌入hdfs,那么您也可以使用flume。
您可以查看以下链接:http://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html