我有这样的html代码
<tr>
<td class="a">...</td>
<td class="a">...</td>
<td class="a">
<p>
<sup>
Name Name Name
</sup>
</p>
</td>
<td class="a">...</td>
<td class="a">...</td>
<td class="a">
<p>
<sup>25.01.1980</sup>
</p>
</td>
<td class="a">...</td>
<td class="a">...</td>
</tr>
<tr>...</tr>
<tr>...</tr>
我需要获取每个tr的第3个和第5个td的文本
显然这是行不通的:)
from bs4 import BeautifulSoup
import index
soup = BeautifulSoup(index.index_doc, 'lxml')
for i in soup.find_all('tr')[2:]:
print(i[2].text, i[4].text)
1条答案
按热度按时间umuewwlo1#
可以使用
css selectors
和伪类:nth-of-type()
来选择元素(假设您需要日期,所以我选择了第6个td):要获得
tuples
的列表:示例