Kafka在bigquery中复制了行

rta7y2nd  于 2021-06-04  发布在  Kafka
关注(0)|答案(1)|浏览(425)

我正在用bigquery下沉postgres数据库,它正在工作,但是当我插入、更新或删除一行(postgres)时,它会出现在bigquery的3行中:一行使用insert命令,另一行使用update命令,最后一行使用delete命令。
例如:
1-插入后

Postgres
--------------------
id | name | deleted
--------------------
1  | John |  false
--------------------

BigQuery
--------------------
id | name | deleted
--------------------
1  | John |  false
--------------------

2-更新名称后

Postgres
--------------------
id | name | deleted
--------------------
1  | Mary |  false
--------------------

BigQuery
--------------------
id | name | deleted
--------------------
1  | John |  false
1  | Mary |  false
--------------------

3-删除后

Postgres
--------------------
id | name | deleted
--------------------
1  | Mary |  true
--------------------

BigQuery
--------------------
id | name | deleted
--------------------
1  | John |  false
1  | Mary |  false
1  | Mary |  true
--------------------

有人能告诉我怎么解决这个问题吗?

fjaof16o

fjaof16o1#

听起来您使用的是debeziumpostgres连接器,它从数据库中捕获所有相关事件,并为每个事件创建新记录。
不确定您是否希望bigquery与数据库完全匹配,但如果是这样的话,您可能不会使用kafka connect,因为它几乎总是向bigquery插入新记录(取决于连接器实现的详细信息),而是使用一些批处理来周期性地将整个数据库导入biqquery

相关问题