我正在尝试使用文件脉冲连接器来读取xml文件。我不熟悉kafka/kafka connect/xml处理
对于下面这样的文件,我想保留数据“unit”和“string1”、“string2”。目前,默认情况下,处理的有效负载会删除它们。
<?xml version="1.0" encoding="UTF-8"?>
<data>
<someField>someValue</someField>
<anotherField-I-Forced-the-type-to-Array>
<value unit="string1">123</value>
<value unit="string2">456</value>
</anotherField-I-Forced-the-type-to-Array>
<lastField>lastValue</lastField>
</data>
是否已经存在某种配置?我没有在文档中找到配置https://streamthoughts.github.io/kafka-connect-file-pulse/docs/developer-guide/file-readers/
如果已经存在解决方案,请提供帮助,并给出一些例子。
目前我得到了这个有效载荷。你可以看到 unit
以及它的价值 string1
, string2
都不见了。
"anotherField-I-Forced-the-type-to-Array": [
{
"value": [
"123",
"456"
]
}
],
另外,我使用的版本是1.5.2,从这里下载https://github.com/streamthoughts/kafka-connect-file-pulse/releases
好奇,根据这篇文章:https://medium.com/streamthoughts/streaming-data-into-kafka-s01-e02-loading-xml-file-21b5e69c645 播放列表确实具有“name”属性,并且没有丢失。 <playlist name="BestOfStarWars">
1条答案
按热度按时间fhity93d1#
仅供参考这是现在固定在1.5.3版本非常快