hbase vs cassandra:哪个更适合timeseries数据存储?

5kgi1eie  于 2021-05-30  发布在  Hadoop
关注(0)|答案(2)|浏览(424)

我使用api日志提取如下信息:
在这段时间里,我的api有多少用户?
或者在这段时间里,什么类型的服务被称为最多?
我提取的几乎所有信息都依赖于时间戳。实际上,我使用mongodb并添加了时间戳作为索引(对于80gb,索引大小是12gb)。
我建议迁移到cassandra或hbase。我想知道哪个更适合我的用例:
timeseries数据分析。
需要良好的读写性能。
使用hadoop进行数据分析的可能性。
谢谢分享你的观点或经验。

ebdffaop

ebdffaop1#

cassandra的优点:cassandra通常表现出更好的性能(尽管两者都很优秀)。从操作的Angular 来看,cassandra更易于设置和管理(尽管有一些工具可以提供帮助)。
hbase的优点:hadoop生态系统的固有特性
hbase将要求你安装hadoop无论如何,你会得到一个很好的二合一。要使用cassandra,您可能需要使用datastax enterprise,这是一个商业的、非开源的产品,或者使用spark来调查您的分析工作,它与cassandra有一个开源连接器。

ubbxdtey

ubbxdtey2#

巧克力或香草冰淇淋-哪一个更好?
我建议你是最好的决策者。为每个选项设置开发环境,这将告诉您有关操作和调优问题的更多信息,我认为这比任何其他人都能提供的信息多得多。:)

相关问题