使用orc serde时在hive中创建表属性的差异

rekjcdws  于 2021-06-01  发布在  Hadoop
关注(0)|答案(0)|浏览(362)

下面是一个现有配置单元表的结构。

CREATE TABLE `tablename`(
col1 datatype,
col2 datatype,
col3 datatype)
partitioned by (col3 datatype)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
WITH SERDEPROPERTIES (
  'field.delim'='T',
  'serialization.format'='T')
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  'maprfs:/file/location'
TBLPROPERTIES (
  'COLUMN_STATS_ACCURATE'='{\"BASIC_STATS\":\"true\"}',
  'numFiles'='0',
  'numRows'='0',
  'rawDataSize'='0',
  'totalSize'='0',
  'transient_lastDdlTime'='1536752440')

现在我想创建一个具有相同属性的表,如何在createtable语法中定义以下属性。
字段分隔符和序列化格式tblproperty,用于存储numfiles、numrows、raddatasize、totalsize(以及我们可以在tblproperty选项中存储的所有其他信息)
下面是我使用的create table语法之一

create table test_orc_load (a int, b int) partitioned by (c int) stored as ORC;

我使用showcreatetable选项得到的表属性。

CREATE TABLE `test_orc_load`(
  `a` int,
  `b` int)
PARTITIONED BY (
  `c` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  'maprfs:/user/hive/warehouse/alb_supply_chain.db/test_orc_load'
TBLPROPERTIES (
  'transient_lastDdlTime'='1537774167')

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题