如果源表没有timestamp列,如何使用sqoop incremental lastmodified

gev0vcfq  于 2021-06-03  发布在  Sqoop
关注(0)|答案(1)|浏览(245)

如果源表没有时间戳列或任何类似的日期列,并且客户端不允许对源表进行任何更改,如何使用sqoop incremental lastmodified。请指导!

rdlzhqv9

rdlzhqv91#

1. 源表永远不会更新,只需追加

通过指定先前集成的最后一行,可以基于主自动增量键获取新插入的行。

2. 源表已更新并插入

如果源表也被更新,唯一的方法就是获取整个表,并使用基于所有列的哈希函数比较source和target。通过使用 hash() 函数更新配置单元表有几种方法:
合并(在hive2中效果更好)和第二部分
如果您使用的是稳定配置单元1.2.x版本,请用两个语句update/insert替换merge

相关问题