我使用的是hbase 0.94.x和hadoop 1.0.4我想读取hbase表中的所有行,但是会有多个读卡器,读卡器的数量将来会增加,读卡器不知道db中存在的键,我想确保每个读卡器只获得一次键,然后处理它,然后请求下一个键像我的hbase表reader1中的k1到kn键-->处理后的处理键k1获取键k3,因为k2正在由reader2 reader2处理-->处理后的处理键k2请求下一个键任何关于如何实现这一点的建议都会大有帮助当做,
tjvv9vkg1#
也许你可以用它。如果一个进程接触到一行,那么它会自动更改此行中的内容,而其他进程则跳过此行。但如果我是你的话,我会在1到50这类键上加盐。当读卡器进程启动时,读卡器进程1将读取salt1,读卡器进程2将读取salt2等。通过这样做,集群上的负载也将以这种方式平衡。
1条答案
按热度按时间tjvv9vkg1#
也许你可以用它。如果一个进程接触到一行,那么它会自动更改此行中的内容,而其他进程则跳过此行。但如果我是你的话,我会在1到50这类键上加盐。当读卡器进程启动时,读卡器进程1将读取salt1,读卡器进程2将读取salt2等。通过这样做,集群上的负载也将以这种方式平衡。