我有超过100个CSV文件,其中有10000行,我正在索引。然后查询拼写是类似的拼写。而这样做索引是非常缓慢的。
我找到了一些好的解决办法
1.主-从,其中主索引和从索引用于查询。How to index records in Solr faster (and not impact ColdFusion web server)? Two JVM?
1.使用三量程http://www.lucidimagination.com/blog/2009/05/13/exploring-lucene-and-solrs-trierange-capabilities/
我知道这两个解决方案是不同的,我想一些意见,这应该是更高的优先级?第二个解决方案适合我的问题?如果有更多的解决方案,我的拼写检查问题。
先谢谢你
2条答案
按热度按时间jfewjypa1#
编制索引通常会使查询变慢。如果磁盘速度快,编制索引将使用100%的CPU,否则将使用100%的磁盘带宽。无论哪种情况,查询都将变慢。
主/从配置是标准的解决方案。从服务器专用于搜索查询。唯一的一次它们变慢是在复制之后,当新的搜索器和新的缓存被创建时。
主/从配置可能不会使索引速度更快,但它可以避免查询性能降低。已经有一些工作在使索引成为多线程,因此您可能希望一次测试多个索引任务。如果瓶颈是磁盘IO,这将没有帮助,只有当它使用了一个CPU的100%时。
Trie字段非常适合范围查询。我怀疑它们会对索引速度有很大影响。
最后,您可能需要调整拼写建议选项。拼写建议可能是一项很大的工作,您可以使用不同的、成本较低的选项来获得良好的结果。
35g0bw712#
您通常可以在执行大容量索引时获得良好的查询性能,而无需求助于蓝/绿色设置。
以下是实现这一目标的一些要点:
add(Collection<SolrInputDocument)
方法。如果你用insert http请求淹没了solr,它会大大降低查询速度。