我有一些杂乱的文本数据需要清理。
每个字符串看起来像下面这样:\r\r \r\n \r\nSome interesting text on line one...\r\n And line two \r\n
我想从另一端拿出来的是Some interesting text on line one\nAnd line two
有效地:将所有包含换行符的空白块折叠到\n
,并将所有其他空白块折叠到单个空格。
我可以匹配空格(带或不带换行符),但我看不到一种方法来保留 * 最多 * 一个\n
或有条件地处理它。
有没有一个简单的方法来做到这一点?
1条答案
按热度按时间zvokhttg1#
将解决方案空间扩展到不仅使用regex,下面的代码似乎也解决了这个问题: