有没有一种方法可以在读取avro到rdd时忽略零长度的文件?

ulydmbyx  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(182)

我在hdfs中有一个文件夹,里面有我的spark工作的源代码。有些文件长度为零,所以我得到: IOExeption: Not an Avro data file . 如果我去掉它们,一切正常,有没有办法忽略它们?
我在java中读取avro到rdd的方式:

JavaPairRDD<AvroWrapper<GenericRecord>, NullWritable> pairRDD =
        (JavaPairRDD<AvroWrapper<GenericRecord>, NullWritable>)sc.hadoopFile(inputPath, AvroInputFormat.class, AvroWrapper.class, NullWritable.class);

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题