在配置单元中描述表时,我在表的描述中得到两条路径。
hive> MSCK REPAIR TABLE default.am_test;
OK
Time taken: 0.061 seconds
...
...
Location: hdfs://privacynameservice/anonymized/master/ste/finished/sessions
...
...
# Storage Information
SerDe Library: org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
InputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
Storage Desc Params:
path hdfs:/anonymized/master/ste/finished/sessions
serialization.format 1
Time taken: 0.048 seconds, Fetched: 57 row(s)
当我试图执行 MSCK REPAIR TABLE
在远程spark2 shell上(使用
--conf spark.hadoop.hive.metastore.uris=thrift://machine8068.dint.company.com:9083
出了问题,抱怨说
scala> sql("MSCK REPAIR TABLE privacygateway.ste_catchup_v2")
java.io.FileNotFoundException: File hdfs:/anonymized/master/ste/finished/sessions does not exist.
因此repair命令使用第二个路径来保存一个奇数uri,因为它不包含所有三个uri ///
也不是名称服务。
所以。。。这是什么 path
为什么它包含一条我没有设置的路径?
暂无答案!
目前还没有任何答案,快来回答吧!