您会使用cassandra进行聚合查询吗?

kfgdxczn  于 2021-06-14  发布在  Cassandra
关注(0)|答案(1)|浏览(431)

是否有人在生产中使用cassandra,用于跨多个地区的数百万行数据聚合?
例如:一家全球销售商,比如亚马逊
数据列:用户、邮政编码、购买的物品、金额、日期时间、国家
假设我想要一个查询:给我每个国家每个项目每个邮政编码的总花费。
对于这种聚合,Cassandra会是一个错误的选择吗?
你会用什么?是不是像elasticsearch?rdbms?

xam8gpfp

xam8gpfp1#

快速回答:否:)
cassandra不支持富sql查询。从技术上讲,cassandra有一些聚合,但是这个功能非常有限。
如果您的数据对于rdbms来说太大,有几种方法可以进行聚合。
nosql存储+查询引擎。您可以将数据存储在cassandra、hbase甚至s3上的文件中,并使用hive、sparksql或apachedrill等软件在nosql存储上执行复杂的sql查询。
elasticsearch现在拥有丰富的聚合功能。
如果你在aws上,相对简单且便宜的解决方案是将你的数据以Parquet格式放在s3上,并使用athena进行聚合。

相关问题