通过hbase配置单元集成删除值

agyaoht7  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(277)

我正在使用hbase配置单元集成来读写带有配置单元的hbase,下面是文档。
基本上,我用 HBaseStorageHandler 比如:

CREATE EXTERNAL TABLE hbase.test (
  col1 string,
  col2 map<string, double>
)
STORED BY
  'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
  'hbase.columns.mapping'=':key, cf:',
  'hbase.table.name'='test')

它在阅读和写作方面都非常有效。但是现在我想通过值清除一些坏数据。该值同时在行键和列单元格中,即col1和col2的键中。
我在文档中没有发现任何与数据删除相关的内容。希望有类似经验的人能回答我的问题。
提前谢谢!

tgabmvqs

tgabmvqs1#

最近的删除用例是overwrite。您可以在您提供的文档中找到它。
一般来说,在大数据领域,删除是不容易实现的。在hbase中,它们是使用墓碑和压缩实现的。在hive中,它仅在0.14版本中可用。对于支持酸的table也是如此。同样,酸的支持度为0.13。
如您所见,删除投标数据集的工作最近才开始。您需要计划更好的选项,如插入覆盖,以处理删除坏数据。
由于您没有单独使用每个框架(如hbase或hive),因此无法获得它们的全部功能。只有在后端有大量sql视图和hbase时,集成才是好的。
同样,为什么选择在后端使用hbase,可能有自己的要求。希望这有助于设计更好的解决方案

相关问题