regex 如何在python 2.7中找到包含瑞典字符的匹配后的单词

js5cn81o 于 11个月前发布在 Python

关注(0)|答案(1)|浏览(100)

几天来，我一直在努力让一个函数工作。我想搜索单词“Ort：“（ort =城市英语），并获得该词后。工程伟大的话没有瑞典语的åäö。这并不重要，如果我读一行文件写的windows机器或我创建一个文件与Vim。它的“Ort”包含但搜索返回空.我已经尝试了许多类型的编码，有时我得到错误，但不是我想要的结果.一个文本可以看起来像这样“品牌我byggnad Ort：Örebro alla ute”和功能看起来像这样

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = 'stefan'
import re
import codecs
import findloc
from findloc import findloc
# tried different ways open file
#testfil = open('extra.flt.test', 'r')
#testfil =  codecs.open('/medianas/html/extra.flt.hist', 'r', '1250')
testfil =  codecs.open('extra.flt.klar', 'r', 'latin1')
#testfil =  codecs.open('/medianas/html/pocsaglog.flt', 'r', '1250')
keyword = 'Ort :'
for line in testfil:
    line = line.decode('utf8')
# Find word after Ort :
    ort = re.search(r'\Ort : (\w+)', line)
# Find word after Adr :
    adr = re.search(r'\Adr : (\w+)', line)
    if adr:
        print adr.group(1)
        adress = adr.group(1)
        cord = findloc(adress)
        lat = (cord[0])
        lng = (cord[1])
    if ort:
        print ort.group(1)
        stad = ort.group(1)
        cord = findloc(stad)
        lat = (cord[0])
        lng = (cord[1])
testfil.close()

字符串
我希望有人能帮助我，或者给我指出正确的方向。

regex

来源：https://stackoverflow.com/questions/37506804/how-to-find-word-after-match-containing-swedish-characters-in-python-2-7

1条答案

按热度按时间

toiithl61#

我冒昧地把你的例子按照https://stackoverflow.com/help/mcve删减了。
对于你的问题，试试这个：

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import re

line="Brand i byggnad Ort : Örebro alla ute"

# Find word after Ort :
ort = re.search('Ort : (.*)', line)
print ort.groups()[0].split(' ')[0]

字符串

赞(0）回复(0）举报 11个月前

我来回答

regex 如何在python 2.7中找到包含瑞典字符的匹配后的单词

1条答案

相关问题

热门标签

最新问答