我们有一个需求,即结构化和非结构化数据都进入系统。我们需要索引它们,然后在上面启用搜索功能。我们在hadoop平台上使用solrcloud。对于结构化数据,我们计划将数据放入hbase,对于非结构化数据,则直接放入hdfs。我的问题是如何在一个solr核下索引这些源?有没有可能在solrcloud的单个核心/集合下索引结构化和非结构化数据,然后在该索引上启用搜索功能?提前谢谢。
hivapdat1#
您最多只能有一个solr模式,其中包含所有可能的字段名,即结构化和非结构化数据的字段名。还要注意的是,由于您提到了非结构化,您可以将更多的字段名附加到现有的模式文件中。如果您不能添加字段,那么您需要考虑一些其他的方法使之成为可能。因此,对于结构化数据,只需填充特定于结构化数据的字段的值,而保留其余字段不变。对于solr中的单个核心和索引,上面提到的实际上是如何让不同的文档具有不同的结构。如果你在这个问题上有什么不同的意思,请给我回电话。
1条答案
按热度按时间hivapdat1#
您最多只能有一个solr模式,其中包含所有可能的字段名,即结构化和非结构化数据的字段名。还要注意的是,由于您提到了非结构化,您可以将更多的字段名附加到现有的模式文件中。如果您不能添加字段,那么您需要考虑一些其他的方法使之成为可能。
因此,对于结构化数据,只需填充特定于结构化数据的字段的值,而保留其余字段不变。
对于solr中的单个核心和索引,上面提到的实际上是如何让不同的文档具有不同的结构。
如果你在这个问题上有什么不同的意思,请给我回电话。