regex 从文本文件中提取阿拉伯数字

ncgqoxb0  于 2023-06-25  发布在  其他
关注(0)|答案(1)|浏览(104)

I have a text file that includes“)ر م:٤٢٢٧ ٢٢٤" .我正在使用此代码来提取:

arabic_num = re.search(r':([\d\s]+)', text, re.UNICODE)
    arabic_num = arabic_num.group(1)
    arabic_num = arabic_num.replace(' ', '')

但输出错误٤٢٢٧٢٢٤。当我删除٢٢٤٤٢٢٧之间的空格时,就会发生这种情况。我如何修复它,请记住,任何阿拉伯数字都可以在:)之间,有时文本文件中的数字不包括数字之间的空格。

gzjq41n4

gzjq41n41#

此正则表达式将捕获“)”和“:”之间的所有内容

text = ")رقم : ٤٢٢٧ ٢٢٤"
arabic_num = re.search(r'\).*\:', text, re.UNICODE)

如果你不想要")",":"和空格,你可以去掉:

arabic_num.group().strip(")").strip(":").replace(" ", "")

相关问题