嗨,我正在使用3GB的txt文件,并希望将其更改为CSV,但它给出错误_坏_行解析器错误:'"'后面应为''
我正在使用的代码
df1 = df.read_csv("path\\logs.txt", delimiter = "\t", encoding = 'cp437',engine="python")
df1.to_csv("C:\\Data\\log1.csv",quotechar='"',error_bad_lines=False, header=None, on_bad_lines='skip')
2条答案
按热度按时间6ojccjat1#
在read_csv中添加on_bad_lines='warn'。看起来有一些错误的行。
qxsslcnc2#
下面的代码在每个记录或制表符之间查找不需要的引号(
'
和"
),并将其替换为nothing
。然后将制表符(\t
)替换为逗号(,
)。此脚本使用
regex
查找不需要的引号。出现此问题的原因是记录中有一个不需要的引号。例如: