我不想垄断这个论坛,但一开始有很多问题。。。jsoup只正确处理web上找到的html页面的一小部分(肯定少于50%)并在其中发现新的url,这正常吗?这就是我的种子文件所发生的事情,令人沮丧。或者有更好的解析器在那里我可以使用?当做
zujrkrfu1#
检查http.content.limit的值。可能是因为文档被截断,所以得到了部分结果。编辑:可以尝试debugparsefilter来查看jsoup生成的dom是什么样子的。正如塞巴斯蒂安所说,这可能与js有关。
1条答案
按热度按时间zujrkrfu1#
检查http.content.limit的值。可能是因为文档被截断,所以得到了部分结果。
编辑:可以尝试debugparsefilter来查看jsoup生成的dom是什么样子的。正如塞巴斯蒂安所说,这可能与js有关。