我听过这样的建议:在只获取数据集的某些列时使用parquet格式的文件(因为它的列存储格式)。但是获取所有列呢?如果我在hdfs的parquet文件中保存了一个结构化的数据集,并且想要获取所有的列,那么使用parquet文件有什么好处吗?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!