在完成这些教程后,我安装了Solr 9并在Windows 10上运行-https://solr.apache.org/guide/solr/latest/getting-started/solr-tutorial.html
我使用的是安装附带的techproducts_config,它应该可以处理多种文件类型,正如我尝试使用内置post.jar进行索引时的输出所示:java -jar -Dc=cd2 -Dauto .\post.jar /pathTo/myFiles
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
但是,对于我的每个文件,post工具都会报告404:POSTing file example1.txt (text/plain) to [base]/extract - SimplePostTool: WARNING: Solr returned an error #404
只有调用特定文件类型(文本文件,此处),才能成功:java -jar -Dc=cd2 -Dauto .\post.jar /pathTo/myFiles/*.txt
我使用的内置solrconfig.xml
有一个更新处理程序:<requestHandler name="/update/extract" startup="lazy" class="solr.extraction.ExtractingRequestHandler" >
1条答案
按热度按时间2hh7jdfx1#
在清除所有东西并开始清洁后工作。