如何使Solr搜索不区分大小写？

uklbhaso 于 2022-11-05 发布在 Solr

关注(0)|答案(1)|浏览(354)

我用的是apachesolr 8.7版本。
这是我的托管模式代码，用于不区分大小写搜索。但是它不能正常工作。

<fieldType name="text_en_splitting" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
      <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <!-- in this example, we will only use synonyms at query time
        <filter class="solr.SynonymGraphFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
        -->
        <!-- Case insensitive stop word removal.
        -->
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="lang/stopwords_en.txt"
        />
        <filter class="solr.WordDelimiterGraphFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
        <filter class="solr.FlattenGraphFilterFactory" />
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.SynonymGraphFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="lang/stopwords_en.txt"
        />
        <filter class="solr.WordDelimiterGraphFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
      </analyzer>
    </fieldType>

这是我的数据库的一些记录。

我希望有助于解决这个问题。

solr

来源：https://stackoverflow.com/questions/66312509/how-to-make-solr-search-in-case-insensitive

1条答案

按热度按时间

qfe3c7zg1#

如果我们只想搜索“quality”字段，那么上面的字段类型定义对我来说似乎是过度设计的，因此会导致意外的结果。
我建议从最少需要的字段类型定义开始，如以下所示，然后根据要求继续添加，如词干或字母数字或同义词搜索：

<analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
    </fieldType>

这是一种自下而上的方法，当你在处理新的东西和许多未知的变量时，它效果最好。
问题中的每个filterfactory都有特定的用途，因此只有在您有需求时才使用。
所有solr过滤器工厂：https://solr.apache.org/guide/8_5/filter-descriptions.html

赞(0）回复(0）举报 2022-11-05

我来回答

如何使Solr搜索不区分大小写？

1条答案

相关问题

热门标签

最新问答