hbase中特定字段的批量更新

lmvvr0a8  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(711)

我在做hbase的时候有个场景。最初,我必须批量上传一个csv文件到hbase table.which我可以成功地使用hbase批量加载。现在,我想通过与提供的新csv进行比较来更新hbase表中的特定字段,如果更新了值,则必须维护一个表示rowkey已更新的标志。任何暗示我怎么做都很容易。非常感谢您的帮助。
谢谢

vdzxcuhz

vdzxcuhz1#

hbase维护每个单元的版本。只要带着row键,就可以获得行的句柄,并且可以使用put添加更新的列。它在内部维护版本,您也可以访问更新值的历史记录。
不过,正如我所见,你也需要比较。因此,在以最快的速度批量加载之后,使用map reduce作为源和汇。请看7.2.2节。其思想是让mapreduce执行扫描,在map中进行比较,并将更新后的put写入输出。它就像一个基本的获取、修改和更新序列。但是在处理大量数据时,我们使用的是map-reduce并行特征

相关问题