有没有方法可以加速这个代码regex代码?文件真的很大,因为大小的原因不会在excel中打开。
import regex as re
path = "C:/Users/.../CDPH/"
with open(path + 'Thefile.tab') as file:
data = file.read()
# replace all space bars between tab characters
data = re.sub('( )*(?=\n)|( )*(?=\t)', '', data )
with open(path + 'Data.csv', 'w') as file:
file.write(data)
1条答案
按热度按时间wztqucjr1#
由于不知道制表符分隔的csv文件的确切方言,我不得不猜测一下,你会在
csv
库文档中找到更多的选项。以下是我试图加快正确修剪字段的方法: