- 已关闭。**此问题为not reproducible or was caused by typos。当前不接受答案。
这个问题是由打字错误或无法再重现的问题引起的。虽然类似的问题在这里可能是on-topic,但这个问题的解决方式不太可能帮助未来的读者。
上个月关门了。
Improve this question
我试图解析一个网站,我想得到两个网页的源代码。但结果,我得到了第一个网页的两次重复的代码。
import requests
from bs4 import BeautifulSoup as bs
import pandas as pd
URL_TEMPLATE = ["https://colmagzhan.kz/content/nasledie-velikih-novye-vozmoghnosti-razvitiyasovremennogoobrazovaniya/lang-kz",
"https://colmagzhan.kz/content/provedena-razyyasnitelynaya-beseda-so-studentami-1-kursov-po-profilakt/lang-kz"]
r = [0]*len(URL_TEMPLATE)
for i in range(len(URL_TEMPLATE)):
r[i] = requests.get(URL_TEMPLATE[0])
for i in range(len(r)):
print(r[i].text)
这是我第一次尝试解析,我在Habr网站上找到了beautifulsoup4的使用说明,但他们只讨论了解析一个页面的可能性。我需要同时解析多个页面,我决定使用数组来完成。
1条答案
按热度按时间zz2j4svz1#
如果您的代码不是很“Python”,即使John Gordon给了您一个答案,我们也强烈建议您按如下所示重新格式化代码:
此代码片段还修复了您的问题,即:
即使你在
URL_TEMPLATE
上迭代,当你在request.get
函数上执行URL_TEMPLATE[0]
时,你仍然调用了第一个元素。如果你想了解for循环在Python中是如何工作的,我可以向你推荐Python wiki上的这个条目。
另外,如果你想写更多的“Python”代码,我推荐你this指南。