scala—在hadoop文件位置上使用hive warehouse连接器的优点和缺点

u0njafvf  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(322)

通常我们使用配置单元表的hadoop文件位置来访问spark etl中的数据。使用hive warehouse connector而不是我们当前的方法有什么好处吗?在etls中使用hivewarehouse连接器有什么缺点吗?

bkhjykvo

bkhjykvo1#

我想不出有什么缺点。
hive存储模式并提供更快的 predicate 下推。如果从文件系统中读取,则需要经常自己定义方案

相关问题