我使用的是ApacheSolr4.10。它的数据是通过apachenutch(hadoop,hbase系统)爬行提供的。solr使用本地文件系统作为索引存储。现在我必须解析并删除一些不好的文档,例如没有内容的文档等等。我如何解析它。有没有什么方法可以使用hadoopmapreduce来达到这个目的?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!