当使用https://github.com/o19s/solr-to-es将数据从SOLR迁移到Elasticsearch时,是否可以同时并行迁移所有节点?

mefy6pfw  于 2023-04-20  发布在  ElasticSearch
关注(0)|答案(1)|浏览(192)

我正在考虑使用https://github.com/o19s/solr-to-es将数据从SOLR迁移到Elasticsearch
Readme md声明“...将遍历本地Solr上的所有文档,并将其提交给本地Elasticsearch服务器”。
让我想到SOLR节点和弹性节点之间存在一对一的Map。这个Python脚本将数据从一个Solr节点移动到其对应的弹性节点。
如果有多节点Solr集群和多节点ES集群...这个命令可以在所有节点上并行运行而不影响索引性能吗?
还是应该在每个SOLR节点上串行运行?
我正在尝试估计迁移需要多少时间。
还没有尝试使用脚本。只是阅读Readme.md。它描述了从Solr到ES的某种形式的本地传输。所以我想知道是否可以引入并行性。

mnowg1ta

mnowg1ta1#

它的工作方式是Solr节点作为一个集群运行,与Elasticsearch节点的方式相同。因此,当您在Solr端点上指向查询时,您不必选择要读取的特定节点,只需使用特定查询指定要滚动的集合(即--solr-query SOLR_QUERY)。集合本身分布在Solr集群的所有(或部分)节点中。
同样,在目标端,您只需指定数据需要复制到哪个Elasticsearch索引(即elasticsearch_index)。
你不需要担心节点到节点的数据复制,因为它不是这样工作的。所以如果你有多个集合要复制,那么你肯定可以为每个集合/索引启动一个进程,但是如果你只有一个集合要复制,那么一个进程就足够了,它会很乐意地滚动Solr集合中的所有文档,并将它们发送到Elasticsearch集群。

相关问题