我在hdfs中有一个文件夹,里面有我的spark工作的源代码。有些文件长度为零,所以我得到: IOExeption: Not an Avro data file
. 如果我去掉它们,一切正常,有没有办法忽略它们?
我在java中读取avro到rdd的方式:
JavaPairRDD<AvroWrapper<GenericRecord>, NullWritable> pairRDD =
(JavaPairRDD<AvroWrapper<GenericRecord>, NullWritable>)sc.hadoopFile(inputPath, AvroInputFormat.class, AvroWrapper.class, NullWritable.class);
暂无答案!
目前还没有任何答案,快来回答吧!