我使用api日志提取如下信息:在这段时间里,我的api有多少用户?或者在这段时间里,什么类型的服务被称为最多?我提取的几乎所有信息都依赖于时间戳。实际上,我使用mongodb并添加了时间戳作为索引(对于80gb,索引大小是12gb)。我建议迁移到cassandra或hbase。我想知道哪个更适合我的用例:timeseries数据分析。需要良好的读写性能。使用hadoop进行数据分析的可能性。谢谢分享你的观点或经验。
ebdffaop1#
cassandra的优点:cassandra通常表现出更好的性能(尽管两者都很优秀)。从操作的Angular 来看,cassandra更易于设置和管理(尽管有一些工具可以提供帮助)。hbase的优点:hadoop生态系统的固有特性hbase将要求你安装hadoop无论如何,你会得到一个很好的二合一。要使用cassandra,您可能需要使用datastax enterprise,这是一个商业的、非开源的产品,或者使用spark来调查您的分析工作,它与cassandra有一个开源连接器。
ubbxdtey2#
巧克力或香草冰淇淋-哪一个更好?我建议你是最好的决策者。为每个选项设置开发环境,这将告诉您有关操作和调优问题的更多信息,我认为这比任何其他人都能提供的信息多得多。:)
2条答案
按热度按时间ebdffaop1#
cassandra的优点:cassandra通常表现出更好的性能(尽管两者都很优秀)。从操作的Angular 来看,cassandra更易于设置和管理(尽管有一些工具可以提供帮助)。
hbase的优点:hadoop生态系统的固有特性
hbase将要求你安装hadoop无论如何,你会得到一个很好的二合一。要使用cassandra,您可能需要使用datastax enterprise,这是一个商业的、非开源的产品,或者使用spark来调查您的分析工作,它与cassandra有一个开源连接器。
ubbxdtey2#
巧克力或香草冰淇淋-哪一个更好?
我建议你是最好的决策者。为每个选项设置开发环境,这将告诉您有关操作和调优问题的更多信息,我认为这比任何其他人都能提供的信息多得多。:)