无论如何,我可以在solr中创建索引来执行hbase中的全文搜索,几乎是实时的。
我不想把整个文本存储在solr索引中。制造的 "stored=false"
注意:请记住,我正在处理大型数据集,希望进行近实时搜索。我们讨论的是tb/pb的数据。
更新
cloudera发行版:5.4.x与cloudera搜索组件一起使用。
解决方案:4.10.x
hbase:1.0.x版本
索引器服务:lily hbase indexer with cloudera morphlines
在cloudera上是否有其他nrt索引器服务或框架可以代替lily使用。只是一个想法。
1条答案
按热度按时间hwamh0ep1#
cloudera:请检查这篇文章和hbase solr使用cloudera搜索,它描述了如何实现这一点。请参见下面这些文章所描述的屏幕截图。
看看cloudera搜索的已知问题
是的,你可以考虑变形线。它们可以用于近实时应用程序以及批处理应用程序。
我不太了解hortonworks平台以及如何实现这一点。