namenode.leaseexpiredexception

e0bqpujr 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(252)

我有一个spark代码，运行在一个Yarn集群上，并使用databricks库将csv转换为parquet。
当csv源是hdfs时，它可以正常工作。但是当csv源代码是非hdfs时（通常是这样），我会遇到这个异常。这不应该发生，因为相同的代码适用于hdfs csv源代码。
完整的问题链接：https://issues.apache.org/jira/browse/spark-19344

hadoop apache-spark apache-spark-sql parquet

来源：https://stackoverflow.com/questions/41822872/namenode-leaseexpiredexception-while-df-write-parquet-when-reading-from-non-hdfs

1条答案

按热度按时间

正如评论中所讨论的。
当文件位于驱动程序节点上，但节点无法访问时，读取将失败。
当使用读取输入文件时（例如。 spark.read 在spark 2.0中，所有executors节点都应该访问文件（例如，当文件位于hdfs、cassandra等上时）

赞(0）回复(0）举报 2021-06-02

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前