我在学习兵团图书馆。他面临着困难。在chrome开发者工具中看到的标签在解析时消失。帮助我。
在此处输入图像描述
在此处输入图像描述
缺少id为cbox\u module的div标记的内容。告诉我如何获取此标签的内容。
这是我的密码
public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
String url = "https://comic.naver.com/webtoon/detail.nhn?titleId=597447&no=364&weekday=sat";
String address = "https://comic.naver.com/comment/comment.nhn?titleId=651673&no=514";
Document doc = Jsoup.connect(address).get();
Elements el = doc.select("#cbox_module");
System.out.println(doc);
System.out.println(el);
}
如果我的英语不好,我很抱歉。我是外国人,我在用翻译。
1条答案
按热度按时间yduiuuwa1#
不完全确定你要提取什么,但你要
cbox_module
哪一个元素是<body>
标签。通过chrome工具中的“网络”选项卡,我可以看到一个请求:
它返回填充页面中注解的json,从而使您能够更直接地访问可能需要的数据。
大多数查询参数都在收到的初始html响应中,但有一个查询参数不是。。。
_callback=jQuery112408278558406808354_1605604312744
1605604312744
-是unix时间戳,使用int now = Integer.parseInt(String.valueOf(LocalDateTime.now().toEpochSecond(ZoneOffset.UTC)));
jQuery112408278558406808354
-这很难理解是如何计算的,但是,从脚本来看: