我使用clouderavm5.8在读取sqoop导入的avro文件(使用snappy编解码器压缩)时出错
conf = (SparkConf().setMaster("local").setAppName("anoterApp1").set("spark.executor.memory", "1g"))
sc=SparkContext(conf= conf)
sqlc = SQLContext(sc)
df = sqlc.read.format("com.databricks.spark.avro").load("/sqoopimported/avro/compressed/directorypath")
获取以下错误:py4j.protocol.py4jjavaerror:调用o266.load时出错。
如果我不使用snappy编解码器压缩文件,代码就可以正常工作
1条答案
按热度按时间ykejflvf1#
尝试添加此配置
这个文件也很有用
https://docs.databricks.com/spark/latest/data-sources/read-avro.html