在python csv模块中将分隔符更改为ctrl+a

igetnqfo  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(344)

我正在尝试用分隔符ctrl+a编写csv文件。我最终将不得不将文件写入hadoop,而我无法使用标准分隔符。
目前我正在尝试:

writer = csv.writer(f, delimiter = "\u0001")
for item in aList:
     writer.writerow(item)

f.close()

但是,输出的excel文件似乎没有正确写入。。。一些行被压缩成一个块,而另一些行在第一个块中有一个字段,然后其他行被压缩成第二个块,以此类推。
是在设置writer对象时出现的错误,还是我不熟悉用这种方式分隔文件?

50pmv0ei

50pmv0ei1#

您可以尝试使用非打印的“组分隔符”字符,它可以在python代码中表示为“\035”
看到了吗http://www.asciitable.com/index/asciifull.gif 如果你需要更多的非打印字符。
包含更多关于为什么要使用非标准分隔符的上下文可能会有所帮助。以及是否需要excel解析文件,或者只是快速检查一下目标系统hadoop是否可以正确解析文件。

相关问题