文件脉冲-“xml属性”提取

nzkunb0c  于 2021-06-04  发布在  Kafka
关注(0)|答案(1)|浏览(220)

我正在尝试使用文件脉冲连接器来读取xml文件。我不熟悉kafka/kafka connect/xml处理
对于下面这样的文件,我想保留数据“unit”和“string1”、“string2”。目前,默认情况下,处理的有效负载会删除它们。

<?xml version="1.0" encoding="UTF-8"?>
<data>
    <someField>someValue</someField>
    <anotherField-I-Forced-the-type-to-Array>
        <value unit="string1">123</value>
        <value unit="string2">456</value>
    </anotherField-I-Forced-the-type-to-Array>
    <lastField>lastValue</lastField>
</data>

是否已经存在某种配置?我没有在文档中找到配置https://streamthoughts.github.io/kafka-connect-file-pulse/docs/developer-guide/file-readers/
如果已经存在解决方案,请提供帮助,并给出一些例子。
目前我得到了这个有效载荷。你可以看到 unit 以及它的价值 string1 , string2 都不见了。

"anotherField-I-Forced-the-type-to-Array": [
{
  "value": [
    "123",
    "456"
  ]
}
],

另外,我使用的版本是1.5.2,从这里下载https://github.com/streamthoughts/kafka-connect-file-pulse/releases
好奇,根据这篇文章:https://medium.com/streamthoughts/streaming-data-into-kafka-s01-e02-loading-xml-file-21b5e69c645 播放列表确实具有“name”属性,并且没有丢失。 <playlist name="BestOfStarWars">

fhity93d

fhity93d1#

仅供参考这是现在固定在1.5.3版本非常快

相关问题