我正在考虑两个用例的集群之间的数据重复:dr(2个数据中心之间的so复制)两个生产集群之间的同步首先,我倾向于认为猎鹰是正确的选择。但对于第二种情况,我希望将数据复制为可用的sson(对于hdfs意味着put结束,对于hive意味着表创建结束)。你对此有何看法?
zi8p0yeb1#
刚刚发现了reairhttps://github.com/airbnb/reair看起来是个不错的工具。:)
1条答案
按热度按时间zi8p0yeb1#
刚刚发现了reairhttps://github.com/airbnb/reair
看起来是个不错的工具。:)