场景我必须使用janusgraph来存储数据,并且我有一个用例,在这个用例中,我拥有不断增长的数据量,这些数据永远都不需要修改。它将是只读的,当然写一次(添加时)。janugraph提供了一些存储选项,在我的场景中应该选择哪一个ApachehbaseCassandra锡拉db伯克利数据库我所寻找和思考的因为我不需要修改太多的数据,我不太关心一致性,所以我想我应该考虑可用性和分区容限,所以cassandra是个不错的选择?
h43kikqp1#
完全公开-我在锡拉项目工作。我同意,如果容错性和可用性是您的主要需求,那么您应该选择cassandra或scylla,因为它们在这些需求方面是同类中最好的(scylla是cassandra的重新实现,共享相同的体系结构和api,但底层代码不同。详细信息在此)考虑到您的用例,如果您设想存储多tb的数据,我建议使用scylla而不是cassandra。cassandra建议每个节点最多存储1 tb。“锡拉”没有这样的限制——每个节点有20多tb的存储容量。这里是白皮书。在吞吐量、调优、内存管理等方面,scylla与cassandra相比还有其他优势,但这种数据密度可能是您的主要优势。
1条答案
按热度按时间h43kikqp1#
完全公开-我在锡拉项目工作。
我同意,如果容错性和可用性是您的主要需求,那么您应该选择cassandra或scylla,因为它们在这些需求方面是同类中最好的(scylla是cassandra的重新实现,共享相同的体系结构和api,但底层代码不同。详细信息在此)
考虑到您的用例,如果您设想存储多tb的数据,我建议使用scylla而不是cassandra。cassandra建议每个节点最多存储1 tb。“锡拉”没有这样的限制——每个节点有20多tb的存储容量。这里是白皮书。
在吞吐量、调优、内存管理等方面,scylla与cassandra相比还有其他优势,但这种数据密度可能是您的主要优势。