我有如下格式的xml文件。
<nt:vars>
<nt:var id="1.3.0" type="TimeStamp"> 89:19:00.01</nt:var>
<nt:var id="1.3.1" type="OBJECT ">1.9.5.67.2</nt:var>
<nt:var id="1.3.9" type="STRING">AB-CD-EF</nt:var>
</nt:vars>
我用下面的代码在上面建立了一个Dataframe。虽然代码显示3行并检索id和type字段,但它没有显示实际值89:19:00.01、1.9.5.67.2、ab cd ef
spark.read.format("xml").option("rootTag","nt:vars").option("rowTag","nt:var").load("/FileStore/tables/POC_DB.xml").show()
你能帮我,如果我必须添加任何其他选项以上的行带来的价值观,以及请。
1条答案
按热度按时间frebpwbc1#
您可以指定
rowTag
作为nt:vars
:要将值作为单独的行获取,可以分解结构数组:
或者,如果您只需要值: