通常我们使用配置单元表的hadoop文件位置来访问spark etl中的数据。使用hive warehouse connector而不是我们当前的方法有什么好处吗?在etls中使用hivewarehouse连接器有什么缺点吗?
bkhjykvo1#
我想不出有什么缺点。hive存储模式并提供更快的 predicate 下推。如果从文件系统中读取,则需要经常自己定义方案
1条答案
按热度按时间bkhjykvo1#
我想不出有什么缺点。
hive存储模式并提供更快的 predicate 下推。如果从文件系统中读取,则需要经常自己定义方案