我想使用Solr来索引具有术语权重的文档。文档1:此文档(w=0.3)是(w=0.4)第一个(w = 0.7)文档(w=0.2)Doc 2:此(w=0.1)是(w=0.2)第二个(w =0.8)文档(w=0.1)请注意,两个文档中相同术语的权重可能不同。在索引之后,我希望搜索功能在给文档评分时考虑这些权重。例如,如果查询是“doc”,我希望doc 1得到更高的分数。这可能吗?谢谢你!
92dk7w1h1#
这是由MatsLindh指出的,谢谢!可以使用Payloads完成此操作:https://lucene.apache.org/solr/guide/8_5/other-parsers.html#payload-score-parser我不建议尝试使用下面的例子:https://lucidworks.com/post/end-to-end-payload-example-in-solr/这就是解决办法。1)创建新收藏:
bin/./solr create -c my_docs -s 1 -rf 2
2)将以下内容(基于示例)写入CSV文件:(1.csv)标识,txt_dpf1、本|0.3为|0.4把|0.1优先级|0.7文件|0.22、本|0.1为|0.2本|0.5秒|0.8文件|0.1分3)将内容添加到集合中:
bin/./post -c my_docs -type text/csv -out yes docs/csv/1.csv
4)如果您有任何问题,请联系我们。如果您有问题,请联系我们。一些重要注意事项:1.权重所在字段的名称非常重要!必须以“dpf”结尾。1.请使用IncludeSpanScore=true,否则您的分数将只是权重。@MatsLindh,再次感谢!
1条答案
按热度按时间92dk7w1h1#
这是由MatsLindh指出的,谢谢!
可以使用Payloads完成此操作:https://lucene.apache.org/solr/guide/8_5/other-parsers.html#payload-score-parser
我不建议尝试使用下面的例子:https://lucidworks.com/post/end-to-end-payload-example-in-solr/
这就是解决办法。
1)创建新收藏:
2)将以下内容(基于示例)写入CSV文件:(1.csv)
标识,txt_dpf
1、本|0.3为|0.4把|0.1优先级|0.7文件|0.2
2、本|0.1为|0.2本|0.5秒|0.8文件|0.1分
3)将内容添加到集合中:
4)如果您有任何问题,请联系我们。如果您有问题,请联系我们。
一些重要注意事项:
1.权重所在字段的名称非常重要!必须以“dpf”结尾。
1.请使用IncludeSpanScore=true,否则您的分数将只是权重。
@MatsLindh,再次感谢!