清理数据时,需要识别必须清理的特定列中的任何拼写错误,值为1或0,表示是或否。
查看错别字我尝试print(df["Column Name"].value_counts())
结果是
我尝试对Y使用replace命令,但结果是为一组1添加3,并且只显示1组和单个0组。
为什么相同的类型被分为两种类型?如何将字符串修改为Numbers并得到以下结果
我尽力了
df["Column Name"].str.strip()
df["Column Name"].replace(" 1","1")
df["Column Name"].replace("Y","1")
2条答案
按热度按时间l7mqbcuq1#
转换数据的可靠方法可能是:
输出:
up9lanfz2#
使用
pd.to_numeric
:尝试使用
np.unique
检查 Dataframe :未经修改:
修改后: