我需要在divtestimonial1 div中提取此内容,我使用以下regEx,但它只返回第一行
Regex r = new Regex("<div([^<]*<(?!/div>))");
<div class="testimonial_content" id="divtestimonial1">
<a name="T1"></a>
<div class="testimonial_headline">%testimonial1headline</div>
<p align="left"><img src="" alt="" width="193" height="204" align="left" hspace="10" id="img_T1"/><span class="testimonial_text">%testimonial1text</span><br />
</p>
</div>
2条答案
按热度按时间lyr7nygr1#
正则表达式通常不是解析HTML的好选择。您最好使用HTML Agility Pack之类的工具,因此我建议您使用它。
也就是说,您可以使用此Regex匹配特定的示例输入:
但它可能会在你的现实世界中崩溃。Regex和HTML的一个问题是正确地检测标签的嵌套等。
kt06eoxx2#
使用HtmlAgilityPack不是一个好的选择吗?
结果:
使用Regex。匹配它看起来像这样: