elasticsearch 如何在char_filter中应用小写?

dhxwm5r4  于 2022-11-02  发布在  ElasticSearch
关注(0)|答案(1)|浏览(128)

我想将小写应用于char过滤器。
我使用了pattern_replace,但它不起作用。

"custom_lowercase": {
    "type": "pattern_replace",
    "pattern": "([A-Z])(.*)",
    "replacement": "\L$0"
}

如何在char_filter中应用小写?

eeq64g8w

eeq64g8w1#

无需使用自定义版本来小写标记,在Elasticsearch分析器的分析链中,标记过滤器排在最后,因此使用内置的小写标记过滤器会将所有标记转换为小写。
在Elasticsearch文档中显示了一个使用自定义分析器小写示例

PUT my-index-000001
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_custom_analyzer": {
          "type": "custom", 
          "tokenizer": "standard",
          "char_filter": [
            "html_strip"
          ],
          "filter": [
            "lowercase",
            "asciifolding"
          ]
        }
      }
    }
  }
}

相关问题