pandas 在python中将标签列表转换为每个ID的标签数组

rpppsulh  于 2023-04-04  发布在  Python
关注(0)|答案(1)|浏览(111)

我有一个包含文本和标签的数据框。每个文本都有多行标签。

dummy_df = pd.DataFrame([['Text1','label1'], ['Text1', 'label2']], columns=["TEXT", "LABELS"])

我想有以下应用MultiLabelBinarizer()函数。

TEXT | LABEL
Text1| [[label1,label2]]

Reference 1Reference 2

xlpyo6sf

xlpyo6sf1#

如果需要嵌套列表,请使用GroupBy.agg中的lambda函数:

df = dummy_df.groupby('TEXT')['LABELS'].agg(lambda x: [x.tolist()]).reset_index()
print (df)
    TEXT              LABELS
0  Text1  [[label1, label2]]

非嵌套列表:

df1 = dummy_df.groupby('TEXT')['LABELS'].agg(list).reset_index()
print (df1)
    TEXT            LABELS
0  Text1  [label1, label2]

相关问题