我想导入一个csv文件,它的分隔符是逗号,但是我不想解析双引号下的逗号:
region,votes,share,liste
1,1453,"45,16",ABC
2,5489,"54,17","BCD,DEF"
3,5486,32,WSE
我想要的数据框架
region votes share liste
1 1453 45.16 ABC
2 5489 54.17 BCD DEF
3 5486 32 WSE
考虑到前面的问题Python parse CSV ignoring comma with double-quotes,我尝试了以下代码:
df=csvReader(myfile, quotechar='"', delimiter=',', quoting=csv.QUOTE_ALL, skipinitialspace=True)
但我收到了以下信息
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
如何正确导入此数据集?
1条答案
按热度按时间kg7wmglp1#
对于pandas,一个非常基本的方法是将(
,
)设置为read_csv
中要识别为十进制的字符,然后在非数字列中设置replace
剩余的逗号和单个 * 空格 *。输出: