我在做hbase的时候有个场景。最初,我必须批量上传一个csv文件到hbase table.which我可以成功地使用hbase批量加载。现在,我想通过与提供的新csv进行比较来更新hbase表中的特定字段,如果更新了值,则必须维护一个表示rowkey已更新的标志。任何暗示我怎么做都很容易。非常感谢您的帮助。谢谢
vdzxcuhz1#
hbase维护每个单元的版本。只要带着row键,就可以获得行的句柄,并且可以使用put添加更新的列。它在内部维护版本,您也可以访问更新值的历史记录。不过,正如我所见,你也需要比较。因此,在以最快的速度批量加载之后,使用map reduce作为源和汇。请看7.2.2节。其思想是让mapreduce执行扫描,在map中进行比较,并将更新后的put写入输出。它就像一个基本的获取、修改和更新序列。但是在处理大量数据时,我们使用的是map-reduce并行特征
1条答案
按热度按时间vdzxcuhz1#
hbase维护每个单元的版本。只要带着row键,就可以获得行的句柄,并且可以使用put添加更新的列。它在内部维护版本,您也可以访问更新值的历史记录。
不过,正如我所见,你也需要比较。因此,在以最快的速度批量加载之后,使用map reduce作为源和汇。请看7.2.2节。其思想是让mapreduce执行扫描,在map中进行比较,并将更新后的put写入输出。它就像一个基本的获取、修改和更新序列。但是在处理大量数据时,我们使用的是map-reduce并行特征