从配置单元表获取数据时遇到问题。
输入字符串:“\u0001d1\u0002d2\u0003”
此处\u0001=^一个字符。类似地\u0002=^b字符。。。
已成功将上面的字符串插入配置单元表。配置单元ddl查询是:
CREATE TABLE test_lt_snap (f1 string) PARTITIONED BY ( date string) ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde' WITH SERDEPROPERTIES ('serialization.encoding'='utf-8') STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat' LOCATION '<file path>' TBLPROPERTIES ( 'store.charset'='utf-8', 'retrieve.charset'='utf-8');
通过配置单元cli选择字段f1后,我无法看到“\u0001”字符。例如:
hive (test_db) > select f1 from test_lt_snap;
output: d1d2
hive (test_db) > select f1 from test_lt_snap where f1 like '\u0001d1%';
output: d1d2
上述select子句的问题是\u0001字符不可见。有什么办法我们也可以显示字符吗?
谢谢,阿米雅
暂无答案!
目前还没有任何答案,快来回答吧!