我是ElasticSearch的新手,所以如果我忽略了一些明显的/基本的东西,请原谅我。
现在我正在使用ElasticSearch,并想看看分析器/标记器/过滤器的复杂设置(由我的前辈设置)如何将文本拆分为标记。
我做了一些研究,找到了方法:
GET /_analyze
{
"tokenizer" : "whitespace",
"filter" : ["lowercase", {"type": "stop", "stopwords": ["a", "is", "this"]}],
"text" : "this is a test"
}
但是,正如我所说,分析器/标记器/过滤器的设置是如此复杂,以至于每次测试设置时都要写细节,这会可怕地拖慢我的速度。
所以我想用已经应用到索引的分析器/标记器/过滤器设置来分析文本。有办法做到吗?
如果有人能解释一下我会很感激的。
1条答案
按热度按时间s2j5cfk01#
您不必每次都提供完整的分析器定义来分析API,您可以简单地使用索引上的
_analyze
API,并像下面这样使用它analyzer
名称而不是其定义(如filter
等),即可基于分析器获取令牌。参考Elasticsearch官方文档,了解如何在特定索引或特定字段上使用它。
希望这个有用。