删除csv文件中列内容内的新行

ff29svar  于 2023-01-28  发布在  其他
关注(0)|答案(1)|浏览(167)

我有以下示例csv文件:

'TEXT';'DATE'
'hello';'20/02/2002'
'hello!
how are you?';'21/02/2002'

因此,如您所见,列之间的分隔符是;,每列的内容由'分隔,这给我在处理带有Pandas的文件时带来了问题,因为它使用换行符作为行之间的分隔符,也就是说,它将“hello!”和“how are you”之间的换行符解释为行之间的分隔符。
因此,我需要删除每列内容中的换行符,使文件看起来像这样:

'TEXT';'DATE'
'hello';'20/02/2002'
'hello! how are you?';'21/02/2002'

删除r'\n序列将不起作用,因为这样我将丢失行分隔。我可以尝试什么?我正在使用Teradata SQL Assistant生成csv文件。

hyrbngr7

hyrbngr71#

可以在pd.read_csv中使用sep=quotechar=参数:

df = pd.read_csv('your_file.csv', sep=';', quotechar="'")
print(df)

图纸:

TEXT        DATE
0                   hello  20/02/2002
1  hello!\r\nhow are you?  21/02/2002

如果要进一步替换换行符:

df['TEXT'] = df['TEXT'].str.replace('\r', '').str.replace('\n', ' ')
print(df)

图纸:

TEXT        DATE
0                hello  20/02/2002
1  hello! how are you?  21/02/2002

相关问题