我正在运行一个虚拟专用服务器,在那里,每天午夜,所有的文件都由VPS提供商自动备份。因此,我需要将Solr索引导出到一个文件中,这样,如果某一天出现问题,我就能够轻松地将它导入回Solr。我该怎么做呢?
evrscar21#
Solr数据库是一个(或几个)文件,其中有一个文件夹,看起来像这样:
root@vs210044:/home/solr/apache-solr-1.4.0/example/solr/data/index# ls segments.gen _xzy.tii _y26.tii _y4f.tii _y6o.tii _y8n.tii _y9i.tis _y9k.fdt _y9l.fdx _y9m.fnm segments_uud _xzy.tis _y26.tis _y4f.tis _y6o.tis _y8n.tis _y9j.fdt _y9k.fdx _y9l.fnm _y9m.frq _xzy_2n.del _y26_20.del _y4f_1z.del _y6o_21.del _y8n_2.del _y9i.fdt _y9j.fdx _y9k.fnm _y9l.frq _y9m.nrm _xzy.fdt _y26.fdt _y4f.fdt _y6o.fdt _y8n.fdt _y9i.fdx _y9j.fnm _y9k.frq _y9l.nrm _y9m.prx _xzy.fdx _y26.fdx _y4f.fdx _y6o.fdx _y8n.fdx _y9i.fnm _y9j.frq _y9k.nrm _y9l.prx _y9m.tii _xzy.fnm _y26.fnm _y4f.fnm _y6o.fnm _y8n.fnm _y9i.frq _y9j.nrm _y9k.prx _y9l.tii _y9m.tis _xzy.frq _y26.frq _y4f.frq _y6o.frq _y8n.frq _y9i.nrm _y9j.prx _y9k.tii _y9l.tis _xzy.nrm _y26.nrm _y4f.nrm _y6o.nrm _y8n.nrm _y9i.prx _y9j.tii _y9k.tis _y9m.fdt _xzy.prx _y26.prx _y4f.prx _y6o.prx _y8n.prx _y9i.tii _y9j.tis _y9l.fdt _y9m.fdx
但是:保存这个文件夹就足够了。你也可以使用增量rsync或其他什么来备份你的整个solr安装...一旦再次启动,只有缓存需要重新填充等等。但是:我希望solr不是你的主要数据库?它的目的是作为一个搜索引擎,而不是一个数据库的替代品,甚至不是一个备份!就像mysql复制很好地做负载平衡,但作为一个备份是无用的...为什么?因为使用相同的查询,你可能会以一个空的索引结束。它就像solr/lucene一样...或对许多人来说,很多其他的原因已经被更聪明的人讨论过了。记住这一点,祝你有一个美好的一天!
hgtggwj02#
请参阅我关于使用Solr的ReplicationHandler进行热备份的其他回答。您只需wget一个URL,Solr将安全地为您的数据目录拍摄快照。我不会使用cp拍摄快照。
wget
cp
qfe3c7zg3#
如果您关心保持增量状态,那么可以配置许多shell脚本,让它们通过cron安排运行时间,或者在提交和优化之后运行。更多信息请访问http://wiki.apache.org/solr/SolrOperationsTools有一件事我想指出的是,虽然Solr可能通常不被用作主要的“记录系统”,但作为其他一些数据存储的辅助,没有任何东西需要这样做!在很多情况下,如果你丢失了Solr索引,你就会丢失你的数据。想象一个在互联网上抓取特定数据的网站。每个抓取结果的唯一副本可能只在Solr中,我认为,只要有适当的备份,这是可以的!
q8l4jmvw4#
在Solr 8/9版本中,solr备份和恢复可通过其复制处理程序实现。它将创建数据的快照,您也可以在以后恢复该快照。在solr文档页面中,您可以找到更多有用的信息:https://solr.apache.org/guide/8_9/making-and-restoring-backups.html#standalone-mode-backups
4条答案
按热度按时间evrscar21#
Solr数据库是一个(或几个)文件,其中有一个文件夹,看起来像这样:
但是:保存这个文件夹就足够了。你也可以使用增量rsync或其他什么来备份你的整个solr安装...一旦再次启动,只有缓存需要重新填充等等。
但是:我希望solr不是你的主要数据库?它的目的是作为一个搜索引擎,而不是一个数据库的替代品,甚至不是一个备份!就像mysql复制很好地做负载平衡,但作为一个备份是无用的...为什么?因为使用相同的查询,你可能会以一个空的索引结束。它就像solr/lucene一样...或对许多人来说,很多其他的原因已经被更聪明的人讨论过了。
记住这一点,祝你有一个美好的一天!
hgtggwj02#
请参阅我关于使用Solr的ReplicationHandler进行热备份的其他回答。您只需
wget
一个URL,Solr将安全地为您的数据目录拍摄快照。我不会使用cp
拍摄快照。qfe3c7zg3#
如果您关心保持增量状态,那么可以配置许多shell脚本,让它们通过cron安排运行时间,或者在提交和优化之后运行。
更多信息请访问http://wiki.apache.org/solr/SolrOperationsTools
有一件事我想指出的是,虽然Solr可能通常不被用作主要的“记录系统”,但作为其他一些数据存储的辅助,没有任何东西需要这样做!
在很多情况下,如果你丢失了Solr索引,你就会丢失你的数据。想象一个在互联网上抓取特定数据的网站。每个抓取结果的唯一副本可能只在Solr中,我认为,只要有适当的备份,这是可以的!
q8l4jmvw4#
在Solr 8/9版本中,solr备份和恢复可通过其复制处理程序实现。
它将创建数据的快照,您也可以在以后恢复该快照。
在solr文档页面中,您可以找到更多有用的信息:
https://solr.apache.org/guide/8_9/making-and-restoring-backups.html#standalone-mode-backups