我想避免在加载过程中将所有条目都加载到ElasticSearch中。条目如AND、OR、THE、A、I等。感谢我正在将所有文件内容和文件名作为数据加载文件名可能包含“和”我不希望搜索包括那些提供比所需更多行文章
xoshrz7s1#
我建议阅读关于stop words filter的文章。应用过滤器停止词,你的文档将不会索引像“and”或“the”这样的词。
GET /_analyze { "tokenizer": "standard", "filter": [ "stop" ], "text": "a quick fox jumps over the lazy dog" }
标记[快,狐狸,跳,过,懒,狗]
1条答案
按热度按时间xoshrz7s1#
我建议阅读关于stop words filter的文章。应用过滤器停止词,你的文档将不会索引像“and”或“the”这样的词。
标记
[快,狐狸,跳,过,懒,狗]