我有一个通过apachenifi流式传输到的hive托管表。当记录的数量是微不足道的~10k时,我可以在表上运行类似count(*)的简单查询,但当记录的数量超过该阈值时,我的查询就会失败并出现错误
原因:org.apache.hadoop.ipc.remoteexception(java.io.filenotfoundexception):文件不存在/delta<..>/bucket<..>
在rmui上,我可以确认压缩作业正在表上运行,这似乎是丢失文件的原因。
如何在压缩运行时查询流式传输到的配置单元表?
堆叠-
hdp 3.1.0.0 tez 0.9.1版
Hive3.1.0
暂无答案!
目前还没有任何答案,快来回答吧!