如何用html5lib替换所有< h1>标记的innerhtml?

nqwrtyyt  于 2021-09-08  发布在  Java
关注(0)|答案(1)|浏览(321)

如何用html5lib替换所有标记的innerhtml?
输入:

foo
<h1>Moonlight</h1>
bar

期望输出:

foo
<h1>Sunshine</h1>
bar

我想使用html5lib,因为它已经是一个依赖项了。

zfciruhq

zfciruhq1#

from xml.etree import ElementTree
from html5lib import HTMLParser

parser = HTMLParser(namespaceHTMLElements=False)

tree = parser.parse('''
  foo
  <h1>Moonlight</h1>
  bar''')

for e in tree.findall('.//h1'):
    e.text = 'Sunshine'

print(ElementTree.tostring(etree))

相关问题