我想写一个在两个环境之间同步hbase表的工具。该工具应该从第二个集群读取数据,并根据时间戳更新表。我在版本1.2.0-cdh5.12.1和spark版本2.4.0-cdh6.1.1中使用hbase客户端我知道copytable(带有时间戳参数)mapreduce解决方案,但它似乎很慢。有人能告诉我使用spark框架是否可以加快处理速度吗?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!