我是hadoop新手,我正在使用distcp命令在hadoop0.20和hadoop2.2.0之间传输数据。在转学期间,我发现以下错误:
校验和不匹配hftp://10.0.3.28:50070/hive/warehouse/staging\u precall\u cdr/operator=idea/precall\u cdr\u assam\u oct\u jan.csv和hdfs://10.0.20.118:9000/user/hive/warehouse/precall\u cdr\u assam\u oct\u jan.csv
我用过 -skipcrccheck
以及 -Ddfs.checksum.type=CRC32
但也没有得到任何解决办法。解决方案将不胜感激。
1条答案
按热度按时间kokeuurv1#
在jira中,复制0.20到2.2.0hadoop版本之间的数据似乎是一个已知的问题https://issues.apache.org/jira/browse/hdfs-3054.
解决这个问题的一个方法是使用-pbc在distcp复制中启用preserve block和check sum。
hadoop distcp -pbc <SRC> <DEST>