import re
lyrics = "lyric lyric See John Mayer Live Get tickets as low as $53 lyric lyric"
pattern = r'See\s+(.*?)\s+Live Get tickets as low as\s+\$[\d,]+'
clean_lyrics = re.sub(pattern, '', lyrics).strip()
clean_lyrics = re.sub(r'\s+', ' ', clean_lyrics)
print(clean_lyrics)
# Output: 'lyric lyric lyric lyric'
1条答案
按热度按时间a8jjtwal1#
编辑:已修复,因此它会删除删除文本的位置的空间。
假设广告总是这种格式,这是一个非常简化的版本,你可以扩展。
\s+,.*?,**\d+**是空格,一组中的任何随机字符,以及按此顺序排列的数字。这用于帮助识别模式。