groovy 删除一列中的反斜杠和换行符

tzxcd3kk  于 2022-11-01  发布在  其他
关注(0)|答案(1)|浏览(511)

我得到了html文本字符串,沿着反斜杠和换行符。我可以很容易地用.replaceAll("<[^>]*>","")删除html标签,但仍然\和换行符仍然存在。所以,我再次尝试replaceAll("\\r\\n|\\r|\\n",""),但删除了行尾字符。
输入字符串:

test1|test2|test3|test4|test5
testa|testB|testc|testd|teste
test11|test22|
<table cellpadding="0" cellspacing="0" id="master_tbl">\
<tbody>\
<tr id="master_cr">\
<td>\
<table cellpadding="0" cellspacing="0" id="master_DefaultContent_rts_s3801_tbl">\
<tbody>\
<tr id="master_DefaultContent_rts_s3801_cr">\
<td>\
<table cellpadding="0" cellspacing="0" id="master_DefaultContent_rts_s3801_ctl03" width="100%">\
<tbody>\
<tr>\
<td><span id="master_DefaultContent_rts_s3801_f25914c">test33</span></td>\
</tr>\
</tbody>\
</table>\
</td>\
</tr>\
</tbody>\
</table>\
</td>\
</tr>\
</tbody>\
</table>|test44|test55
test66|test77|test88|test99|test00

预期的输出字符串:

test1|test2|test3|test4|test5
testa|testB|testc|testd|teste
test11|test22|test33|test44|test55
test66|test77|test88|test99|test00
mec1mxoz

mec1mxoz1#

这是一个奇怪的请求,我会在您生成输入文本的地方修复它
但是,似乎要删除的每一个新行前面都有一个反斜杠\

input.replaceAll("<[^>]*>","")
     .replaceAll("\\\\[\\r\\n]+","") // backslach+newline -> empty
     .replaceAll("\\|[\\r\\n]+","|") // pipe+newline -> pipe

相关问题