我有一个列,其中包含可变大小的列表。这些列表包含数量有限的短文本值。总共大约60个独特的值。
0 ["AC","BB"] 1 ["AD","CB", "FF"] 2 ["AA","CC"] 3 ["CA","BB"] 4 ["AA"]
我想在我的数据框中设置此值列,如果值在此行中,则此列的值为1,否则为0。我知道我可以扩展列表,然后调用unique并将其设置为新列。但在那之后我不知道该怎么办?
ds97pgxw1#
这里有一个方法:
df = pd.get_dummies(df.explode('val')).sum(level = 0)
注:这里 (level=0) 有点像分组操作,它使用索引对内容进行分组。所以,我更喜欢在分解 Dataframe 后使用它。
(level=0)
1条答案
按热度按时间ds97pgxw1#
这里有一个方法:
注:这里
(level=0)
有点像分组操作,它使用索引对内容进行分组。所以,我更喜欢在分解 Dataframe 后使用它。