我有一个包含员工信息的数据集。我有一列列出了员工的当前年龄,还有一列列出了他们的工资。我想创建一个包含3列的R数据框:一个显示所有不同的年龄,一个计算该年龄的人数,一个给出每个特定年龄的工资中位数。除此之外,我还想将21岁以下和65岁以上的人分组。理想情况下,它应该是这样的:
| 年龄|人数|工资中位数|
| - ------|- ------|- ------|
| 21岁以下|三十六|二万六千三百人|
| 二十二|十五|二万六千三百人|
| 二十三|三十|二万七千零二十人|
| 二十四|四十一|二万六千三百人|
| 等等|||
| 65岁以上|四十七|三万九千一百人|
当前数据集有数百列和数千行,但感兴趣的列如下所示:
| 岁|萨尔22|
| - ------|- ------|
| 四十六|二万八千二百五十人|
| 三十二|二万六千三百人|
| 十九|二万七千零二十人|
| 二十四|二万六千三百人|
| 五十三|三万六千一百零五|
| 四十七|三万九千一百人|
| 四十七|二万六千二百人|
| 七十|六万九千五百人|
| 六十八|七万五千三百一十人|
我有点迷失在做这件事的最佳方式,但假设某种循环将最好的工作?非常感谢任何指导或帮助。
1条答案
按热度按时间gudnpqoy1#