在生产环境中,是否应该在每个可能的服务器上设置Solr,包括具有Zookeeper的服务器?服务器总数:5情况1:Solr在所有5台服务器上。Zookeeper在3台服务器上。案例2:Solr在2台服务器上,Zookeeper在3台服务器上。案例3:Solr在5台服务器上。Zookeeper在5台服务器上。最佳实践是什么?使用一个案例比使用另一个案例有什么好处?我读到过将Zookeeper放在一个单独的服务器上会更好。
uyto3xhc1#
在任何时间点,zookeeper示例的数量都应该是2n+1。在您的情况下,您可以使用最多5个示例,因为您有5台服务器。例如,Solr在5台服务器上,zookeeper在5台Solr服务器上。但是,最初的大小只能根据索引大小、查询复杂度、一分钟内的近似查询命中数以及折衷的结果时间来确定。
pdtvr36n2#
在同一个节点上同时运行Solr和ZooKeeper是很常见的,ZK实际上并不需要太多的资源。如果ZK数据库和Solr安装在不同的物理磁盘上,ZK的性能会更好。但是,除非云非常庞大,否则即使这样也没有必要。有五台机器,也不太可能是一个庞大的云。您不会计划进行成百上千个集合,对吗?对于真正的最佳操作,ZK将运行在单独的机器上,但我个人不会这样做,除非我有一个三个非常小的服务器,不需要其他东西。最小的高可用性SolrCloud安装可能是三台机器,其中一台比其他机器小得多。两台大机器将同时运行Solr和ZK(作为单独的进程),第三台只运行ZK。如果第三台机器与其他机器相同,它也可以同时运行这两台机器。我更关心的是支持我的搜索需求所需的Solr服务器的总数,而不是是否单独运行ZK。
2条答案
按热度按时间uyto3xhc1#
在任何时间点,zookeeper示例的数量都应该是2n+1。在您的情况下,您可以使用最多5个示例,因为您有5台服务器。例如,Solr在5台服务器上,zookeeper在5台Solr服务器上。但是,最初的大小只能根据索引大小、查询复杂度、一分钟内的近似查询命中数以及折衷的结果时间来确定。
pdtvr36n2#
在同一个节点上同时运行Solr和ZooKeeper是很常见的,ZK实际上并不需要太多的资源。
如果ZK数据库和Solr安装在不同的物理磁盘上,ZK的性能会更好。但是,除非云非常庞大,否则即使这样也没有必要。有五台机器,也不太可能是一个庞大的云。您不会计划进行成百上千个集合,对吗?
对于真正的最佳操作,ZK将运行在单独的机器上,但我个人不会这样做,除非我有一个三个非常小的服务器,不需要其他东西。
最小的高可用性SolrCloud安装可能是三台机器,其中一台比其他机器小得多。两台大机器将同时运行Solr和ZK(作为单独的进程),第三台只运行ZK。如果第三台机器与其他机器相同,它也可以同时运行这两台机器。
我更关心的是支持我的搜索需求所需的Solr服务器的总数,而不是是否单独运行ZK。