如何将包含多个页面的HAR转换为JSON

fkvaft9z  于 2022-11-19  发布在  其他
关注(0)|答案(1)|浏览(220)

我正在做一个研究项目,我需要能够从大量的Tiktok中提取标签。Tiktok有很多措施来对抗网页抓取的正常方法,但我发现我可以从chrome下载HAR文件,并从那里提取标签。
我找到的每个HAR to JSON python或java模块要么不工作,要么在输出JSON文件中没有hashtag信息。大多数在线HAR查看器只显示头和参数,而我需要原始JSON文件才能访问hashtag。我可以从this chrome扩展访问它,但由于需要查看大量数据,它崩溃了。
我需要从一个HAR文件中获取多个网页的原始JSON。
任何帮助都是感激不尽的!

42fyovps

42fyovps1#

免责声明:HttpWatch开发人员的回答

我们的HttpWatch软件(仅限Windows)可以与Chrome和Edge一起使用,它可以处理多个页面,如果没有足够的HAR格式信息,您可以使用HttpWatch日志文件(HWL)。HWL文件包含每个HTTPS交易的所有细节。
此外,HttpWatch有一个编程接口(请参见https://apihelp.httpwatch.com),可用于搜索和提取hashtag。

相关问题