csv 识别和移除以定位点分隔的文字档中的额外定位点

ve7v8dk2 于 2022-12-06 发布在其他

关注(0)|答案(1)|浏览(119)

我有一个文本文件，有120列和数千行，其中的分隔符是一个制表符。在某些行中，有一个额外的制表符，使它看起来，在该行中，有121列。这个额外的制表符的位置是不知道是相同的所有文本文件。
我想知道是否有人有任何想法，有效地定位额外的标签，并删除它的编程。

1条答案

您可以在read_csv中使用正则表达式作为分隔符。
使用'\t+'（一个或多个表格）：

df = pd.read_csv('your_file.csv', sep='\t+', engine='python')