>>> x = 'http://www.example.com:8080/abcd/dir/file1.html?query1=value1&query2=value2'
>>> query_pattern='(query\d+)=(\w+)'
>>> # query_pattern='(\w+)=(\w+)' a more general pattern
>>> re.findall(query_pattern, x)
[('query1', 'value1'), ('query2', 'value2')]
2条答案
按热度按时间klr1opcd1#
不要使用正则表达式!使用urlparse。
bfnvny8b2#
我同意最好不要使用正则表达式,最好使用
urlparse
,但这里是我的正则表达式。像
urlparse
这样的类是专门为高效地处理所有URL而开发的,比正则表达式可靠得多,所以如果可以的话,请使用它们。