regex re.findall返回命名捕获组的dict？

x4shl7ld 于 2023-04-07 发布在其他

关注(0)|答案(4)|浏览(139)

灵感来自一个现已删除的问题;给定一个带有命名组的正则表达式，是否有一个像findall这样的方法，它返回一个带有命名捕获组的dict列表，而不是一个tuple列表？
给出：

>>> import re
>>> text = "bob sue jon richard harry"
>>> pat = re.compile('(?P<name>[a-z]+)\s+(?P<name2>[a-z]+)')
>>> pat.findall(text)
[('bob', 'sue'), ('jon', 'richard')]

应给予：

[{'name': 'bob', 'name2': 'sue'}, {'name': 'jon', 'name2': 'richard'}]

regex

来源：https://stackoverflow.com/questions/11103856/re-findall-which-returns-a-dict-of-named-capturing-groups

4条答案

按热度按时间

pxyaymoc1#

使用Pattern.finditer()，然后使用Match.groupdict()：

>>> import re
>>> s = "bob sue jon richard harry"
>>> r = re.compile('(?P<name>[a-z]+)\s+(?P<name2>[a-z]+)')
>>> [m.groupdict() for m in r.finditer(s)]
[{'name2': 'sue', 'name': 'bob'}, {'name2': 'richard', 'name': 'jon'}]

赞(0）回复(0）举报 2023-04-07

57hvy0tb2#

你可以切换到finditer

>>> import re
>>> text = "bob sue jon richard harry"
>>> pat = re.compile('(?P<name>[a-z]+)\s+(?P<name2>[a-z]+)')
>>> for m in pat.finditer(text):
...     print m.groupdict()
... 
{'name2': 'sue', 'name': 'bob'}
{'name2': 'richard', 'name': 'jon'}

赞(0）回复(0）举报 2023-04-07

vtwuwzda3#

如果你使用match：

r = re.match('(?P<name>[a-z]+)\s+(?P<name2>[a-z]+)', text)
r.groupdict()

文档在这里

赞(0）回复(0）举报 2023-04-07

vmdwslir4#

没有内置的方法来实现这一点，但可以通过使用列表解析来实现预期的结果。

[dict([[k, i if isinstance(i, str) else i[v-1]] for k,v in pat.groupindex.items()]) for i in pat.findall(text)]

友好的格式：

>>> [
...     dict([
...         [k, i if isinstance(i, str) else i[v-1]]
...         for k,v in pat.groupindex.items()
...     ])
...     for i in pat.findall(text)
... ]

我们使用列表解析构造一个列表，迭代findall的结果，该结果要么是字符串列表，要么是元组列表（0或1个捕获组导致str的列表）。
对于结果中的每一项，我们从另一个列表解析中构造一个dict，该列表解析是从编译模式的groupindex字段生成的，看起来像这样：

>>> pat.groupindex
{'name2': 2, 'name': 1}

为groupindex中的每个项目构造一个列表，如果来自findall的项目是一个元组，则使用来自groupindex的组号来查找正确的项目，否则将该项目分配给（唯一现存的）命名组。

[k, i if isinstance(i, str) else i[v-1]]

最后，从字符串列表的列表构造一个dict。
请注意，groupindex只包含命名组，因此生成的dict将省略未命名的捕获组。
结果是：

[dict([[k, i if isinstance(i, str) else i[v-1]] for k,v in pat.groupindex.items()])  for i in pat.findall(text)]
[{'name2': 'sue', 'name': 'bob'}, {'name2': 'richard', 'name': 'jon'}]

赞(0）回复(0）举报 2023-04-07

我来回答

regex re.findall返回命名捕获组的dict？

4条答案

相关问题

热门标签

最新问答