我正在计划一个带有hbase的版本化数据存储。在这种情况下,“版本化”意味着旧数据永远不会被删除,并且为了审计和分析的目的而被不确定地保留。大多数读取仍将发生在最新版本上。
hbase本身提供了一种版本控制机制,但默认情况下,它只保留最后的x版本,而放弃其他所有版本。
我有几点担心:
将hbase中的最大版本数增加到 Integer.MAX_VALUE
,特别是在性能方面?hbase准备好处理这个案子了吗,还是不鼓励?
(主要的)契约会尊重 max_versions
使用hbase内部版本控制系统时,主压缩是否总是丢弃旧的行版本?这里的文档不是很具体。
考虑到给定键上的版本数可能会增长到非常大的数量,是否最好忽略内置的版本控制系统,并通过组合的行键来实现它?
暂无答案!
目前还没有任何答案,快来回答吧!