我希望评估使用cassandra、bigtable或hadoop解决方案的可能性。有没有什么地方对这三种方法在一组基准测试中的比较和表现进行了最新的比较?我发现了一些五年前的数据,但我想在深入研究之前,对这三个数据库的优势和劣势有一个更高层次的了解。
n1bvdmb61#
hadoop是一个生态系统,有许多类型的数据库在其上运行。我相信你要比较的是hbase。在我见过的大多数基准测试中,cassandra的速度比较慢,您可以很容易地找到比较这两个基准测试的基准测试。当你谈论hadoop的时候,你需要明白这是一个比cassandra或bigtable更复杂的环境。bigtable几乎可以吃掉你扔在上面的所有东西,只要支付谷歌,一切都会好起来的(以200万条记录/秒的速度进行测试)。cassandra架构基于dynamodb(aws)和bigtable设计。它的工作负载非常快(你可以找到许多每秒100万次写操作的基准测试)。从不信任internet上的基准:)。你必须用你的样本数据自己运行它。并不是所有的数据库都能满足所有的需要。如果您提供更多关于您希望在数据库上放置什么工作负载的信息,这里的人可以为您提供所需的数据库(有很多比你列出的3)。
uqzxnwby2#
ycsb(雅虎!云服务基准(cloudservicingbenchmark)是nosql数据库性能测试的标准。本演示似乎总结了ycsb测试延迟和可伸缩性的目标。除了延迟和可伸缩性之外,我还检查高批量负载的吞吐量(即完成的总工作量),以及充分配置服务器时“在线”类型系统的尾部延迟。我所说的尾部延迟指的是:最慢的1%(或0.1%)请求的速度有多快。cloudbigtable在第一次发布时发布了一些ycsb结果(仅供参考)。
2条答案
按热度按时间n1bvdmb61#
hadoop是一个生态系统,有许多类型的数据库在其上运行。我相信你要比较的是hbase。在我见过的大多数基准测试中,cassandra的速度比较慢,您可以很容易地找到比较这两个基准测试的基准测试。当你谈论hadoop的时候,你需要明白这是一个比cassandra或bigtable更复杂的环境。
bigtable几乎可以吃掉你扔在上面的所有东西,只要支付谷歌,一切都会好起来的(以200万条记录/秒的速度进行测试)。
cassandra架构基于dynamodb(aws)和bigtable设计。它的工作负载非常快(你可以找到许多每秒100万次写操作的基准测试)。
从不信任internet上的基准:)。你必须用你的样本数据自己运行它。并不是所有的数据库都能满足所有的需要。如果您提供更多关于您希望在数据库上放置什么工作负载的信息,这里的人可以为您提供所需的数据库(有很多比你列出的3)。
uqzxnwby2#
ycsb(雅虎!云服务基准(cloudservicingbenchmark)是nosql数据库性能测试的标准。本演示似乎总结了ycsb测试延迟和可伸缩性的目标。
除了延迟和可伸缩性之外,我还检查高批量负载的吞吐量(即完成的总工作量),以及充分配置服务器时“在线”类型系统的尾部延迟。我所说的尾部延迟指的是:最慢的1%(或0.1%)请求的速度有多快。
cloudbigtable在第一次发布时发布了一些ycsb结果(仅供参考)。