我的HTML知识非常有限,但我有一些Python知识。我正在尝试实现这个article和这个github repo中的代码,
我知道这可能是一个愚蠢的事情,但我有真实的的麻烦,只是找到类的第5步的WebScraping_Session_I文件。有人能告诉我如何找到它的随机列表搜索。我发现的类名与代码中的类名完全不同,它们不起作用,并且在抓取代码以实现ML算法后,它不允许我进入下一步:)
任何帮助将不胜感激!
如果我有什么不明白的,尽管问我!
我尝试的是:
我检查了HTML代码,选择了一个清单进行检查,尝试了突出显示区域中的类,但它不起作用。问ChatGPT为什么,告诉我这是错误的类,但ChatGPT建议的类也没有一个是正确的。
1条答案
按热度按时间vc9ivgsu1#
从我在代码中看到的和我理解的来看,当执行
soup.find_all('div', '_gig1e7')
时,代码会中断。假设您没有更改任何代码,我猜问题就在这里。
查看beautiful soup的find_all()的文档,我们可以看到参数是:name,attrs和其他(如果你阅读文档,你可以看到它只是滚动了一点)。
查看attrs(我认为问题所在),它说那些是不同的css类。因此,
soup.find_all('div', '_gig1e7')
行搜索的是div类,其中有_gig1e7文本或id或其他类型的属性。试着删除_gig1e7部分,看看它是否有效(即使它给你的匹配比预期的多),然后试着找出现在web的变化。可能_gig1e7类已经不存在了,这就是它不返回任何东西的原因。