我有一个包含权重列的数据集,我希望在调整这些权重以保持其代表原始数据集的同时对其进行子集化。
假设我有一个 Dataframe :
data.frame(Age=c(10,20,30,25,50,60,40),
Country=c("Germany","Germany","Germany","China","China","China","China"),
Class=c("A", "B", NA, NA, "B", "A", "A"),
Weight=c(1.1, 0.8, 1.2, 1.7, 0.7, 1.3, 0.9))
我想删除列Class
中的NA
行,并更新Weight
列,以保持我的样本代表给定列Age
和Country
的原始数据集。(上述 Dataframe 对于此类问题可能太小,但这只是为了说明)。
1条答案
按热度按时间64jmpszr1#
如果要用平均值或其他特定值填充Na值,只需运行以下代码即可。
用于填充Pandas Dataframe 中nan值,您可以放置任何您想要替换的值