我有一个自由文本格式的足球表:
我努力创建了一个正则表达式,它将适用于可选数字和多个空格分隔的单词。无论我创建什么,都倾向于在俱乐部名称后面包含数字,或者在其他方面失败。
示例:
这可能是我能找到的最接近的了。正则表达式工作正常,只要我最多有两个单词,没有数字。(\d+)\s+([A-Za-z\s]+)(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)
这适用于除7和14以外的所有行。
当我将数字添加到第二组时,正则表达式开始溢出到表中的整数中:(\d+)\s+([A-Za-z0-9\s]+)(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)
编辑:Tim要求指出预期结果:示例:match = [ '14','Vukovar 1991','0','30','8','7','15','29','52','-23','31' ]
1条答案
按热度按时间kmbjn2e31#
使用下面的正则表达式:
参见regex101中的演示
Python代码: