我有一个 Dataframe 如下;
| 身份证|扬|二月|马尔|四月|五月|
| --------------|--------------|--------------|--------------|--------------|--------------|
| 1|10个|三十||||
| 二|10个|二十|五十|五十|六十|
| 三||||七十|五十|
| 四||三十|四十|||
我想得到最后两列的行平均值(仅在数据可用的情况下)
预期产出如下;
| 身份证|扬|二月|马尔|四月|五月|平均|
| --------------|--------------|--------------|--------------|--------------|--------------|--------------|
| 1|10|30人||||二十|
| 二|10个|二十|五十|50|60人|五十五|
| 三||||70|50人|六十|
| 四||**30|**40|||三十五|
我的实际数据框有n个更大的列,我不能硬编码列名。我该如何继续前进呢?
3条答案
按热度按时间63lcw9qa1#
计算掩码以仅保留具有
notna
和cumsum
的相关单元格:您还可以利用
stack
来摆脱NaN,然后获得每个ID的最后N个值:输出:
rseugnpd2#
使用
agg
函数ejk8hzay3#
输出: