我有一个文本文件,有120列和数千行,其中的分隔符是一个制表符。在某些行中,有一个额外的制表符,使它看起来,在该行中,有121列。这个额外的制表符的位置是不知道是相同的所有文本文件。我想知道是否有人有任何想法,有效地定位额外的标签,并删除它的编程。
sshcrbum1#
您可以在read_csv中使用正则表达式作为分隔符。使用'\t+'(一个或多个表格):
read_csv
'\t+'
df = pd.read_csv('your_file.csv', sep='\t+', engine='python')
1条答案
按热度按时间sshcrbum1#
您可以在
read_csv
中使用正则表达式作为分隔符。使用
'\t+'
(一个或多个表格):