如何解析apachesolr数据库

mtb9vblg  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(222)

我使用的是ApacheSolr4.10。它的数据是通过apachenutch(hadoop,hbase系统)爬行提供的。solr使用本地文件系统作为索引存储。现在我必须解析并删除一些不好的文档,例如没有内容的文档等等。
我如何解析它。有没有什么方法可以使用hadoopmapreduce来达到这个目的?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题