我正在尝试在datastax企业集群中设置一些hadoop节点和一些cassandra节点。在这一点上有两件事我不清楚。第一,我需要多少hadoop节点?Cassandra节点的数量相同吗?数据是否仍然存在于cassandra节点上?第二——教程提到我应该在hadoop节点上禁用vnode。我还能在集群中的cassandra节点上使用vnode吗?谢谢您。
6tqwzwtp1#
在datastax enterprise中,在同样运行cassandra的节点上运行hadoop。最常见的部署是建立两个数据中心(节点的逻辑分组)。一个数据中心专门用于分析,包含同时运行hadoop和c的计算机,另一个数据中心仅用于c并提供集群的oltp功能。analytics节点上的c进程连接到集群的其余部分(与任何其他c节点一样),并在写入突变时接收更新,以便最终与数据库的其余部分保持一致。数据同时存在于这些节点和集群中的其他节点上。同样,大多数人最终都会使用networktopologystrategy的复制模式,在他们的conly dc中指定多个副本,在analytics dc中指定一个副本,但您的用例可能不同。两个数据中心中的节点数不必相等。对于第二个问题,是的,您可以在仅c的数据中心中启用vnode。此外,如果批处理作业的大小非常大,您还可以在analytics Datacenter中运行vnodes,只需稍微降低性能。同样,这完全基于您的用例。如果您想要更多更快、更短的分析作业,则不希望在分析数据中心中启用vnode。
1条答案
按热度按时间6tqwzwtp1#
在datastax enterprise中,在同样运行cassandra的节点上运行hadoop。最常见的部署是建立两个数据中心(节点的逻辑分组)。一个数据中心专门用于分析,包含同时运行hadoop和c的计算机,另一个数据中心仅用于c并提供集群的oltp功能。analytics节点上的c进程连接到集群的其余部分(与任何其他c节点一样),并在写入突变时接收更新,以便最终与数据库的其余部分保持一致。数据同时存在于这些节点和集群中的其他节点上。同样,大多数人最终都会使用networktopologystrategy的复制模式,在他们的conly dc中指定多个副本,在analytics dc中指定一个副本,但您的用例可能不同。两个数据中心中的节点数不必相等。
对于第二个问题,是的,您可以在仅c的数据中心中启用vnode。此外,如果批处理作业的大小非常大,您还可以在analytics Datacenter中运行vnodes,只需稍微降低性能。同样,这完全基于您的用例。如果您想要更多更快、更短的分析作业,则不希望在分析数据中心中启用vnode。