复合分区密钥与性能

4ioopgfo  于 2021-06-10  发布在  Cassandra
关注(0)|答案(1)|浏览(279)

我正在为cassandra环境开发键空间和表。我理解cassandra的大小限制,并处理分区键以保持其优化。但是,对于如何处理密钥,我与开发人员有分歧。拥有一个包含大量数据而不是少量数据的密钥有什么不利之处吗。例如,
我有10万张唱片。我可以创建一个密钥,将其划分为10k;我还可以创建一个键,将它划分为10个记录(按天)。所以我要么存储10k和10个分区,要么存储10条记录和10000个分区。

hlswsv35

hlswsv351#

请记住,键中有更多的列需要在select语句中指定这些列,这有时是不需要的。分区越多越好—无论是选择一个更好的单列还是拥有多个列。
cassandra通过分区键读取数据,如果使用集群列,则可以获得性能方面的帮助。如果您有一个大分区,则必须读取整个分区(内存和磁盘),然后合并输出。如果你有很大的分区,这肯定会减慢你的速度。

相关问题