如何使用Pandas删除csv文件中的注解图标

fhity93d  于 2023-01-18  发布在  其他
关注(0)|答案(2)|浏览(96)

我尝试删除出现在我的csv文件的许多行中的图标。当我使用www.example.com_csv创建一个 Dataframe 对象时,它显示一个绿色的方形复选图标,但如果我使用Excel打开csv,我会看到..而不是。我尝试使用拆分功能删除,因为验证状态由pd.read_csv it shows a green squared check icon, but if I open the csv using Excel I see âœ... instead. I tried to delete using split function because the verification status is separated by | to the comment:

df['reviews'] = df['reviews'].apply(lambda x: x.split('|')[1])

我注意到它没有检测到"|"分隔符,当审阅包含上述图标时。

我不确定这是否是编码问题。我尝试在panda read_csv中添加encoding ='utf-8 ',但没有解决问题。
先谢了。
我想补充的是,这是一个图片,当我打开csv文件使用excel。

but5z9lq

but5z9lq1#

可以使用encode/decode方法删除非拉丁字符:

>>> df
           reviews
0  ✓ Trip Verified
1         Verified

>>> df['reviews'].str.encode('latin1', errors='ignore').str.decode('latin1')
0     Trip Verified
1          Verified
Name: reviews, dtype: object
uplii1fm

uplii1fm2#

假设您有以下 Dataframe :

reviews
0  ✅ Trip Verified
1     Not Verified
2     Not Verified
3  ✅ Trip Verified

您可以使用replace方法替换符号,它是unicode字符2705

df['reviews'] = df['reviews'].apply(lambda x: x.replace('\u2705',''))

下面是完整的示例:

代码:

import pandas as pd

df = pd.DataFrame({"reviews":['\u2705 Trip Verified', 'Not Verified', 'Not Verified', '\u2705 Trip Verified']})
df['reviews'] = df['reviews'].apply(lambda x: x.replace('\u2705',''))
print(df)

输出:

reviews
0   Trip Verified
1    Not Verified
2    Not Verified
3   Trip Verified

相关问题