Solr索引自定义文件类型

um6iljoc  于 2022-11-05  发布在  Solr
关注(0)|答案(1)|浏览(150)

基本上,我是一个Solr新手,在我们的SolrMaven离开公司后,我对这个问题没有任何经验。我们从客户端收到了一个专有文件。我无法访问生成该文件的应用程序。
上传到Solr时,我们收到以下错误

SOLR Log
solr-cloud.log: {"msg":"2022-01-19 08:10:06.915 ERROR (qtp349420578-3516) [c:<collection> s:shard2 r:core_node5 x:<redacted>] o.a.s.s.HttpSolrCall null:java.lang.RuntimeException: java.lang.NoClassDefFoundError: ucar/nc2/NetcdfFile"}

Our App logging
org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException: Error from server at http://localhost:8983/solr/<collection>: Expected mime type application/octet-stream but got text/html. <html>
<head>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8"/>
<title>Error 500 Server Error</title>
</head>
<body><h2>HTTP ERROR 500</h2>
<p>Problem accessing /solr/<collection>/update/extract. Reason:
<pre>    Server Error</pre></p><h3>Caused by:</h3><pre>java.lang.NoClassDefFoundError: ucar/nc2/NetcdfFile
        at org.apache.tika.parser.hdf.HDFParser.parse(HDFParser.java:88)
        at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:280)

其他正常文件类型也可以使用(例如doc、pdf、zip)
1.我无法打开或编辑该文件以查看其中有哪些字段要索引,那么有没有办法能够索引这个呢?
1.如果没有,我还能做些什么来处理这种文件类型
短暂性脑缺血

ql3eal8s

ql3eal8s1#

Solr/Tika使用HDF解析器解析文件,HDF解析器又依赖于NetCDF解析器-https://www.unidata.ucar.edu/downloads/netcdf-java/

相关问题