快速hdfs和hive数据复制

euoag5mw  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(394)

我正在考虑两个用例的集群之间的数据重复:
dr(2个数据中心之间的so复制)
两个生产集群之间的同步
首先,我倾向于认为猎鹰是正确的选择。但对于第二种情况,我希望将数据复制为可用的sson(对于hdfs意味着put结束,对于hive意味着表创建结束)。你对此有何看法?

zi8p0yeb

zi8p0yeb1#

刚刚发现了reairhttps://github.com/airbnb/reair
看起来是个不错的工具。:)

相关问题