Cassandra集群的预期接收速度是多少?

e5nqia27  于 2022-11-05  发布在  Cassandra
关注(0)|答案(1)|浏览(151)

我正在运行一个项目,需要加载数百万条记录到cassandra。我正在使用kafka connect,进行分区,并提升24个工作线程。我每秒只得到大约4000行。我用pentaho pdi做了一个测试,用jdbc驱动程序直接插入到cassandra,每秒得到的行稍微少了一点:3860(平均值)cassandra集群有24个节点。默认情况下的预期插入速度是多少?如何微调大数据负载的接收?

mepcadol

mepcadol1#

Cassandra集群接收数据的速度并没有什么神奇的“默认”。一个集群可以执行10万次操作/秒,另一个集群可以执行1000万次操作/秒。理论上,它可以是无限的。
群集的吞吐量由许多移动部件决定,这些部件包括(但不限于):

  • 硬体组态
  • 内核数量、CPU类型
  • 内存量、RAM类型
  • 磁盘带宽,磁盘配置
  • 网络容量/带宽
  • 数据模型
  • 客户端/驱动程序配置
  • 访问模式
  • 群集拓扑
  • 簇大小

确定集群吞吐量的唯一方法是在尽可能接近生产负载的情况下进行自己的测试。

相关问题