我不熟悉分布式系统。我知道solrcloud提供了分布式搜索功能。据我所知,hadoop是一个用于大数据的分布式处理框架。那么我们为什么要将两个分布式框架集成在一起呢?它是否用于索引和搜索hdfs格式的文件?在solrcloud中使用hadoop有什么好处?如果有人能详细解释或给我链接,让我更好地了解这两个将真的很有帮助。
mutmk8jj1#
solr(主要)用于存储和搜索,hadoop(主要)用于分布式处理。他们解决不同的问题。最常见的方法是将solr与hdfs结合使用来存储/加载其索引文件,既可以使用hdfs集群中的现有功能,也可以通过solr搜索处理过的hadoop结果。如果你在google上做一些搜索,你会发现很多可用的用例、演示和库,比如lucidworks的hadoop集成、solr+hadoop或hortonworks在apachesolr中索引和搜索数据。
1条答案
按热度按时间mutmk8jj1#
solr(主要)用于存储和搜索,hadoop(主要)用于分布式处理。他们解决不同的问题。
最常见的方法是将solr与hdfs结合使用来存储/加载其索引文件,既可以使用hdfs集群中的现有功能,也可以通过solr搜索处理过的hadoop结果。
如果你在google上做一些搜索,你会发现很多可用的用例、演示和库,比如lucidworks的hadoop集成、solr+hadoop或hortonworks在apachesolr中索引和搜索数据。