我尝试使用beautifulsoup来保留下面的自关闭html标记中的值“XXXXX”(如果我的术语不正确,请道歉)这可能吗?我能找到的所有问题都是关于获取div标签之间的数据,而不是self结束标签中的属性。第一个月
dldeef671#
考虑到需要解析的文本位于 file 变量中,可以使用以下代码:
soup = BeautifulSoup(file, "html.parser") X = soup.find('input').get('value') print(X)
z4iuyo4d2#
我不认为在这种情况下它是一个自结束标记会有什么不同,相同的方法应该仍然适用(注解中的任何方法也应该作为一种替代方法)。
nonceInp = soup.select_one('input[name="nonce"]') # nonceInp = soup.find('input', {'name': 'nonce'}) if nonceInp: nonceVal = nonceInp['value'] # nonceVal = nonceInp.attrs['value'] # nonceVal = nonceInp.get('value') # nonceVal = nonceInp.attrs.get('value') else: nonceVal = None # print('could not find an input named "nonce"')
2条答案
按热度按时间dldeef671#
考虑到需要解析的文本位于 file 变量中,可以使用以下代码:
z4iuyo4d2#
我不认为在这种情况下它是一个自结束标记会有什么不同,相同的方法应该仍然适用(注解中的任何方法也应该作为一种替代方法)。