我正在使用标准分析器创建Lucene 3.0.3索引。当使用C,**C#或C++**等查询在索引上进行搜索时,这三个词都得到相同结果正如我所知,在创建索引分析器时,忽略特殊字符,并且不为相同字符创建索引
需要能够区分“C”、“C#”和“C++"
请建议我,是否有任何现有的分析器可以解决这个问题?任何建议都将不胜感激!!!
zdwk9cvp1#
我猜这是因为StandardAnalyzer使用了StandardFilter,而StandardFilter使用了StandardTokenizer,StandardTokenizer删除了特殊字符。您可以创建自己得Analyzer实现.
StandardAnalyzer
StandardFilter
StandardTokenizer
wfveoks02#
请访问http://www.gossamer-threads.com/lists/lucene/java-user/91747?do=post_view_threaded#91747
2条答案
按热度按时间zdwk9cvp1#
我猜这是因为
StandardAnalyzer
使用了StandardFilter
,而StandardFilter
使用了StandardTokenizer
,StandardTokenizer
删除了特殊字符。您可以创建自己得Analyzer实现.
wfveoks02#
请访问http://www.gossamer-threads.com/lists/lucene/java-user/91747?do=post_view_threaded#91747