hadoop命令分割hdfs上的文件

5lwkijsr  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(572)

我有一个大小为11gb的hdfs文件。我想把它分成多个1 gb的文件。我该怎么做?我的hadoop版本是2.7.3

brvekthn

brvekthn1#

如果你有Spark,试试下面-
下面的示例将输入文件拆分为两个文件: spark-shell ```
scala> sc.textFile("/xyz-path/input-file",2).saveAsTextFile("/xyz-path/output-file")

相关问题