我有一个input.txt
文件,其中有2列(file_name,text
),我想替换text
列中出现的""分隔符字符(此处表示选项卡,因为我使用此字符创建了txt文件)
输入文件示例:
0.jpg Jól olvasom? Összesen négy, azaz 4 számot játszott el
1.jpg a csapat a koncerten Ilyet még nem is hallottam
我写了下面的代码:
df = pd.read_csv(f'{path}labels.txt',# labels labels_tab_remove
header=None,
delimiter=' ',
encoding="utf8",
engine='python'
)
df.rename(columns={0: "file_name", 1: "text"}, inplace=True)
print(df.head())
因此,我想将"tab"替换为"single space
for idx in range(len(df)):
df['text'][idx].replace(" "," ")
因此,预期输出:
0.jpg Jól olvasom? Összesen négy, azaz 4 számot játszott el
1.jpg a csapat a koncerten Ilyet még nem is hallottam
2条答案
按热度按时间xcitsw881#
你真的需要Pandas来做这些吗?
labels_clean.txt
的含量:83qze16e2#
感谢所有的意见之前。作为解决方案提到,我们并不真的需要Pandas,我们可以使用它后,处理文本