我有一个用hadoop构建的java mapreduce程序,现在我有一个位于gs://this\u是\u路径目录中的数据集,其中包含一些.txt文件,我将这些文件作为输入传递给我的mapreduce程序。
现在我将像“hadoop/program.jar program input\u loc output\u loc”那样运行我的程序。
当我在本地存储了一个文件的位置时,这种方法非常有效,但是我正在努力将数据从gs://位置拉到我自己的dataproc集群中,然后将其用作mapreduce程序的输入。
有什么办法吗?
暂无答案!
目前还没有任何答案,快来回答吧!