elasticsearch 按顺序创建所有可能的标记

ljsrvy3e  于 2022-11-22  发布在  ElasticSearch
关注(0)|答案(1)|浏览(118)

我正在尝试创建一个分析器,它可以返回所有可能的标记,例如,对于这个单词AB-12-1993 xyz.pdf,如果生成了任何其他不成问题的额外标记,则生成的标记将是AB, AB-12, -12-1993, 12-1993, -1993, 1993, AB-12-1993 xyz, xyz, xyz.pdf, AB-12-1993 xyz.pdf
我尝试过使用带有ngram的空格分析器,但是没有生成这些-12-1993, 12-1993, -1993, 1993
我也试过this,用不同的分析仪,但没有帮助
我正在使用ElasticSearch8.3.3。有人能帮帮我吗?

afdcj2ne

afdcj2ne1#

您可以将以下定义用于生成所需令牌的分析器

PUT ngram_custom_example
{
  "settings": {
    "index": {
      "max_ngram_diff": 10
    },
    "analysis": {
      "analyzer": {
        "default": {
          "tokenizer": "keyword",
          "filter": [ "2_10_grams" ]
        }
      },
      "filter": {
        "2_10_grams": {
          "type": "ngram",
          "min_gram": 2,
          "max_gram": 10
        }
      }
    }
  }
}

相关问题