如何在列中创建单词的二进制表示?

ckocjqey  于 2021-09-08  发布在  Java
关注(0)|答案(1)|浏览(310)

我有一个列,其中包含可变大小的列表。这些列表包含数量有限的短文本值。总共大约60个独特的值。

0    ["AC","BB"]
1    ["AD","CB", "FF"]
2    ["AA","CC"]
3    ["CA","BB"]
4    ["AA"]

我想在我的数据框中设置此值列,如果值在此行中,则此列的值为1,否则为0。
我知道我可以扩展列表,然后调用unique并将其设置为新列。但在那之后我不知道该怎么办?

ds97pgxw

ds97pgxw1#

这里有一个方法:

df = pd.get_dummies(df.explode('val')).sum(level = 0)

注:这里 (level=0) 有点像分组操作,它使用索引对内容进行分组。所以,我更喜欢在分解 Dataframe 后使用它。

相关问题