也许这是一个很好的文档,但我对如何做到这一点感到非常困惑(有许多apache工具)。
创建sql表时,使用以下命令创建表:
CREATE TABLE table_name(
column1 datatype,
column2 datatype,
column3 datatype,
.....
columnN datatype,
PRIMARY KEY( one or more columns )
);
如何将现有的table转换成Parquet地板?这个文件写入磁盘了吗?如果原始数据是几gb,需要等待多长时间?
我可以将原始数据格式化为Parquet格式吗?
2条答案
按热度按时间zlhcx6iw1#
这个
odbc2parquet
命令行工具在某些情况下也可能有用。wlp8pajw2#
apache spark可用于:
例子: