hdfs上有一个名为“output.json”的输出文件夹,它包含以下文件
|- _SUCCESS \- part-r-00000-3c9a6268-ff29-4a76-8d74-8c867e7f0f0f.json
有时它包含更多的“part-*”文件。从这个文件夹中读取的正确方法是什么?我猜应该是这样的
read("path/to/output.json") // and rest should be taken care off
注意:hdfs驻留在远程服务器上
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!