apache nutch 2.3 2.x solr 4.8 hbase版

qij5mzcb  于 2021-06-10  发布在  Hbase
关注(0)|答案(0)|浏览(232)

我安装了ApacheNutch2.3、Solr4.8和HBase0.9,爬网并获取了内容。我想根据标题数据、html标记、标记类名或标记id对爬网内容进行索引,或者以这样的方式进行爬网,以便轻松获取内容标题数据、html标记、标记类名或标记id。请帮帮我。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题