I have a text file that includes“)ر م:٤٢٢٧ ٢٢٤" .我正在使用此代码来提取:
arabic_num = re.search(r':([\d\s]+)', text, re.UNICODE)
arabic_num = arabic_num.group(1)
arabic_num = arabic_num.replace(' ', '')
但输出错误٤٢٢٧٢٢٤
。当我删除٢٢٤
和٤٢٢٧
之间的空格时,就会发生这种情况。我如何修复它,请记住,任何阿拉伯数字都可以在:
和)
之间,有时文本文件中的数字不包括数字之间的空格。
1条答案
按热度按时间gzjq41n41#
此正则表达式将捕获“)”和“:”之间的所有内容
如果你不想要")",":"和空格,你可以去掉: