我想使用highcharts.js
从一个显示图表的页面中抓取数据,这样我就完成了对所有页面的解析,得到了following page。但是,最后一个显示数据集的页面使用highcharts.js
来显示图表,要访问原始数据似乎几乎是不可能的。
我使用Python 3.5和BeautifulSoup。
还可以解析吗?如果可以,我怎么能把它刮下来呢?
我想使用highcharts.js
从一个显示图表的页面中抓取数据,这样我就完成了对所有页面的解析,得到了following page。但是,最后一个显示数据集的页面使用highcharts.js
来显示图表,要访问原始数据似乎几乎是不可能的。
我使用Python 3.5和BeautifulSoup。
还可以解析吗?如果可以,我怎么能把它刮下来呢?
2条答案
按热度按时间smtd7mpg1#
数据在一个脚本标记中,可以使用bs4和一个正则表达式来获取脚本标记,也可以使用正则表达式来提取数据,但我喜欢使用/js2xml来将js函数解析为xml树:
这将为您提供:
所以要得到所有的数据:
就像我说的,你可以只使用一个正则表达式,但 js2xml 我发现更可靠的错误空间等。
cnwbcb6i2#
给其他偶然发现的人。
如果您的页面是在Selenium中加载的,则可以执行以下操作:
将提取YData等的数据。这假定驱动程序是Selenium Webdriver。