Parquet格式的mapreduce错误

wr98u20j  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(483)

我想逃跑 mapreduce 工作。我的文件在一个 parquet 格式。
我得到以下错误:

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/thrift/TException
at parquet.format.converter.ParquetMetadateConverter.readParquetMetadata(ParquetMetadateConverter.java:268)
at parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:271)
at parquet.hadoop.ParquetFileReader.readSummeryFile(ParquetFileReader.java:200)
at parquet.hadoop.ParquetFileReader.readAllFootersInParallelUsingSummeryFiles(ParquetFileReader.java:99)
at parquet.hadoop.ParquetInputFormat.getFooters(ParquetInputFormat.java:354)
at parquet.hadoop.ParquetInputFormat.getFooters(ParquetInputFormat.java:339)
at parquet.hadoop.ParquetInputFormat.getSplits(ParquetInputFormat.java:246)
...

我试着把装有 TException--libjars my_path/libthrift-0.9.0.jar 我还是会犯同样的错误。

xtupzzrd

xtupzzrd1#

请尝试设置 HADOOP_CLASSPATH 参数指向 libthrift.jar 与所需版本匹配的文件。
例如:

export HADOOP_CLASSPATH=/var/lib/hdfs/libthrift-0.9.jar

希望这有帮助!

相关问题