我正在尝试将xml文件加载到配置单元表中。我在这里使用xmlserde。我能够加载简单的平面xml文件。但是当xml中有嵌套元素时,我使用hive复杂数据类型来存储它们(例如。, array<struct>
). 下面是我尝试加载的示例xml。我的目标是将所有元素、属性和内容加载到配置单元表中。
<description action="up">
<name action="aorup" ln="te">
this is name1
</name>
<name action="aorup" ln="tm">
this is name2
</name>
<name action="aorup" ln="hi">
this is name2
</name>
</description>
我想得到的Hive输出是。。。
{action:"up", name:[{action:"aorup", ln:"te", content:"this is name1"}, {action:"aorup", ln:"tm", content:"this is name2"}, {action:"aorup", ln:"hi", content:"this is name3"}]}
我想将整个xml加载到一个配置单元列中。我尝试了以下方法:
CREATE TABLE description(
description STRUCT<
Action:STRING,
name:ARRAY<STRUCT<
Action:STRING, ln:STRING, content:STRING
>>
>)
ROW FORMAT SERDE 'com.ibm.spss.hive.serde2.xml.XmlSerDe'
WITH SERDEPROPERTIES (
"xml.processor.class"="com.ximpleware.hive.serde2.xml.vtd.XmlProcessor",
"column.xpath.description"="/description")
STORED AS INPUTFORMAT 'com.ibm.spss.hive.serde2.xml.XmlInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.IgnoreKeyTextOutputFormat'
TBLPROPERTIES ("xmlinput.start"="<description ","xmlinput.end"= "</description>");
但我得到的值为空 Label
现场。有人能帮我吗?
谢谢
1条答案
按热度按时间iqjalb3h1#