我们正在以增量+时间戳模式使用jdbc源连接器构建kafka connect应用程序。我们尝试了独立模式,它正在按预期工作。现在,我们想切换到分布式模式。
当我们有一个单一的配置单元表作为源时,任务将如何在工作人员中分配?
我们面临的问题是,当我们在多个示例中运行应用程序时,它会查询每个示例的表并再次获取相同的行。并行性在这种情况下有效吗?如果是的话,
在当前的表格状态下,这些任务将如何相互协调?
我们正在以增量+时间戳模式使用jdbc源连接器构建kafka connect应用程序。我们尝试了独立模式,它正在按预期工作。现在,我们想切换到分布式模式。
当我们有一个单一的配置单元表作为源时,任务将如何在工作人员中分配?
我们面临的问题是,当我们在多个示例中运行应用程序时,它会查询每个示例的表并再次获取相同的行。并行性在这种情况下有效吗?如果是的话,
在当前的表格状态下,这些任务将如何相互协调?
1条答案
按热度按时间olhwl3o21#
参数
tasks.max
kafka connect jdbc源/接收器连接器没有任何区别。jdbc连接器项目的源代码中没有出现此属性。有关此连接器的可用属性,请参阅jdbc源配置选项。