ElasticSearch:检查应用于索引的分析器/标记器/过滤器如何将文本拆分为标记?

bfrts1fy  于 2023-01-12  发布在  ElasticSearch
关注(0)|答案(1)|浏览(118)

我是ElasticSearch的新手,所以如果我忽略了一些明显的/基本的东西,请原谅我。
现在我正在使用ElasticSearch,并想看看分析器/标记器/过滤器的复杂设置(由我的前辈设置)如何将文本拆分为标记。
我做了一些研究,找到了方法:

GET /_analyze
{
  "tokenizer" : "whitespace",
  "filter" : ["lowercase", {"type": "stop", "stopwords": ["a", "is", "this"]}],
  "text" : "this is a test"
}

但是,正如我所说,分析器/标记器/过滤器的设置是如此复杂,以至于每次测试设置时都要写细节,这会可怕地拖慢我的速度。
所以我想用已经应用到索引的分析器/标记器/过滤器设置来分析文本。有办法做到吗?
如果有人能解释一下我会很感激的。

s2j5cfk0

s2j5cfk01#

您不必每次都提供完整的分析器定义来分析API,您可以简单地使用索引上的_analyze API,并像下面这样使用它

GET <your-index-name>/_analyze
{
  "analyzer" : "standard",
  "text" : "Quick Brown Foxes!"
}
    • 因此,您将在索引级别**使用分析API,而不是在集群级别使用分析API,在索引级别已经存在分析器定义,因此您只需提供analyzer名称而不是其定义(如filter等),即可基于分析器获取令牌。

参考Elasticsearch官方文档,了解如何在特定索引或特定字段上使用它。
希望这个有用。

相关问题