spark中两个集群间的java同步hbase表

bgibtngc  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(276)

我想写一个在两个环境之间同步hbase表的工具。该工具应该从第二个集群读取数据,并根据时间戳更新表。
我在版本1.2.0-cdh5.12.1和spark版本2.4.0-cdh6.1.1中使用hbase客户端
我知道copytable(带有时间戳参数)mapreduce解决方案,但它似乎很慢。
有人能告诉我使用spark框架是否可以加快处理速度吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题