solr 含空格词的LUCENE -模糊搜索

djp7away  于 2023-04-20  发布在  Solr
关注(0)|答案(1)|浏览(201)

我面临的情况似乎很简单,但我真的无法想象一个明确的解决方案:

  • 想象一下,我想在Lucene索引上索引一个包含“Summertime,and the living is easy”的文本。
  • 我希望我的用户界面上的搜索“夏季时间”找到包含我的文本与夏季索引的文档,同时保持一个StandardAnalyser标准数据的所有好处。

我想使用fuzzyQuery就足够了(因为距离是1)。由于我使用的分词器基于空格进行分割,因此解决方案不相关,我不知道使用哪个分析器来允许这种可能性?同时保留StandardAnalyzer的所有好处,如(Stopwords,添加同义词的可能性,...)。
也许这比我想象的要简单(至少看起来是这样),但我现在真的看不到任何解决方案。

bjp0bcyl

bjp0bcyl1#

您可以使用ShingleFilter使Solr将多个标记组合为一个,并使用用户定义的分隔符。
这样你就可以得到“summer time”作为一个单独的token,以及“summer”和“time”(除非你禁用了outputUnigrams)。当你这样做的时候,你会得到一个编辑距离很小的token,模糊搜索应该按照你想要的方式工作。

相关问题