我正在尝试用分隔符ctrl+a编写csv文件。我最终将不得不将文件写入hadoop,而我无法使用标准分隔符。
目前我正在尝试:
writer = csv.writer(f, delimiter = "\u0001")
for item in aList:
writer.writerow(item)
f.close()
但是,输出的excel文件似乎没有正确写入。。。一些行被压缩成一个块,而另一些行在第一个块中有一个字段,然后其他行被压缩成第二个块,以此类推。
是在设置writer对象时出现的错误,还是我不熟悉用这种方式分隔文件?
1条答案
按热度按时间50pmv0ei1#
您可以尝试使用非打印的“组分隔符”字符,它可以在python代码中表示为“\035”
看到了吗http://www.asciitable.com/index/asciifull.gif 如果你需要更多的非打印字符。
包含更多关于为什么要使用非标准分隔符的上下文可能会有所帮助。以及是否需要excel解析文件,或者只是快速检查一下目标系统hadoop是否可以正确解析文件。