我有一个面板数据,记录了不同年份中个人的雇佣状态。他们中的许多人在我的数据的时间跨度内更换了工作。我希望捕获这些转换并将其合并到字符串序列中。例如:
Year Person Employment_Status
1990 Bob High School Teacher
1991 Bob High School Teacher
1992 Bob Freelancer
1993 Bob High School Teacher
1990 Peter Singer
1991 Peter Singer
1990 James Actor
1991 James Actor
1992 James Producer
1993 James Producer
1994 James Investor
理想的输出应如下所示:
Person Job_Sequence
Bob High School Teacher-Freelancer-High School Teacher
Peter Singer
James Actor-Producer-Investor
本质上,每个人都被减少到一行记录,对我来说的挑战是不同的人有不同数量的转换(从零到十几个不等)。
1条答案
按热度按时间lyr7nygr1#
我们可以对"Employment_Status"应用
rleid
,将相同的相邻元素分组为一个组,获取"Person'、" grp "的distinct
元素,然后按paste
进行分组或者使用
base R
数据