我正在尝试使用requests模块从webpage获取一封电子邮件。问题是,电子邮件地址似乎被编码或什么的,这就是为什么它是不可读的,我想解码它的正常形式。
import requests
from bs4 import BeautifulSoup
link = 'https://global-standard.org/find-suppliers-shops-and-inputs/certified-suppliers/database/search_result/38996'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36',
}
res = requests.get(link,headers=headers)
soup = BeautifulSoup(res.text,"html.parser")
email = soup.select_one("script[type='text/javascript']:-soup-contains('emailProtector')").contents[0]
print(email)
当我运行上面的脚本时,得到了以下结果:
emailProtector.addCloakedMailto("ep_586c4771", 1);
这就是我想要的结果
fttextilegroup2017@gmail.com
1条答案
按热度按时间zmeyuzjn1#
您可以尝试:
图纸: