我有著名的泰坦尼克号数据集
fr1 = pd.DataFrame({
"class": ["1", "2", "2"],
"survived": [0, 1, 1]})
字符串
我需要得到每个班级幸存者的百分比,所以首先我分开敷面膜,然后分组
fr2 = fr1[fr1["Survived"] == 0]
fr2 = fr2.groupby("Pclass", as_index=False)["Survived"].agg(["count"])
fr3 = fr1[fr1["Survived"] == 1]
fr3 = fr3.groupby("Pclass", as_index=False)["Survived"].agg(["count"])
型
现在,我合并了我得到的 Dataframe ,并创建了百分比列,以了解每个班级有多少人幸存下来
merged = pd.merge(fr2,fr3,left_index=True,right_index=True)
merged.columns = "Survived Died".split()
merged["Percentage"] = merged["Survived"] / (len(fr1))*100
型
1条答案
按热度按时间eyh26e7m1#
非常简单的方法,因为你已经有了0/1,只要得到
groupby.mean
:字符串
变体:
型
输出量:
型