我有一个使用hive创建的视图,它只不过是两个表的简单并集。我想阅读spark中的视图并对其进行操作。spark在读取表时将以不同的方式对待视图。如中所示,视图是使用map reduce读取的(hive会使用),还是spark通过并行分区读取的(通常读取表的方式)。我更喜欢视图方法,而不是用union创建另一个表,因为这样会造成无用的数据重复和空间浪费。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!