我有一个hbase表,它将包含数百万条记录。出于某种目的,我需要实时查询表中的记录数。使用rowcount mr job不是一个选项((需要快速)使用resultscanner很慢。只有几千条记录需要几秒钟。
yrwegjxp1#
不能-hbase不支持此功能。您可以使用tariq的建议,但是您应该记住hbase中没有跨表事务,因此不能保证您在一个表中累积的数量反映另一个表中的确切行数
yftpprvb2#
使它绝对实时的唯一方法是跟踪行数并将其存储在某个位置。每当你放新行时,就更新它。你需要的时候就上吧。如果真的需要实时性,以上两个指定的选项都不会帮助您。
2条答案
按热度按时间yrwegjxp1#
不能-hbase不支持此功能。您可以使用tariq的建议,但是您应该记住hbase中没有跨表事务,因此不能保证您在一个表中累积的数量反映另一个表中的确切行数
yftpprvb2#
使它绝对实时的唯一方法是跟踪行数并将其存储在某个位置。每当你放新行时,就更新它。你需要的时候就上吧。如果真的需要实时性,以上两个指定的选项都不会帮助您。