我有一个 Dataframe ,看起来像这样:
data = {'Name': ['Tom', 'Tom', 'Tom', 'Tom'],
'Sequence': [2021, 2022, 2023, 2024],
'Car': ['Ford', 'Chevy', 'Tesla', NaN]}
我想创建一个名为“new_car”的新列,它查找“Chevy”的第一个值,并将其复制到组的其余部分。
因此,如果我按“Name”分组,找到Car = 'Chevy'的第一个示例,列的其余部分被列为' Chevy'。
下面是新列的显示方式:'new_car':[NaN,' Chevy','Chevy','Chevy']
不知道如何在Pandas中实现这一点...有帮助吗?
1条答案
按热度按时间zf9nrax11#
你可以用
where
屏蔽非Chevy值,然后用ffill
:或者,您也可以
ffill
每组:输出: