dataproc重命名spark在gcs文件夹中编写的文件

jq6vz3qz 于 2021-07-14 发布在 Java

关注(0)|答案(1)|浏览(376)

我正在使用dataproc使用scala实现spark作业。我的spark工作的目的是在gcs中读取数据并进行一些转换，然后在gcs下写入结果数据。我们从spark write得到的文件是part-00，我想重命名它们，但是我找不到任何解决方案，因为写入的文件在gcs下，而不是hdfs下。你知道怎么解决这个问题吗。谢谢。

scala apache-spark google-cloud-dataproc

来源：https://stackoverflow.com/questions/54814601/dataproc-rename-files-written-by-spark-in-gcs-folder

1条答案

按热度按时间

在dataproc集群上，仍然可以运行相同的 hadoop fs -mv 针对gcs的命令与针对hdfs的命令相同，只是使用了完整的“gs://bucket/filename…”路径。

赞(0）回复(0）举报 2021-07-14

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前