csv 识别和移除以定位点分隔的文字档中的额外定位点

ve7v8dk2  于 2022-12-06  发布在  其他
关注(0)|答案(1)|浏览(109)

我有一个文本文件,有120列和数千行,其中的分隔符是一个制表符。在某些行中,有一个额外的制表符,使它看起来,在该行中,有121列。这个额外的制表符的位置是不知道是相同的所有文本文件。
我想知道是否有人有任何想法,有效地定位额外的标签,并删除它的编程。

sshcrbum

sshcrbum1#

您可以在read_csv中使用正则表达式作为分隔符。
使用'\t+'(一个或多个表格):

df = pd.read_csv('your_file.csv', sep='\t+', engine='python')

相关问题