我可以从一个例子开始来最好地解释我的问题:
df = pd.DataFrame({"ID" : [1, 2, 3, 4],
"age": [46, 48, 55, 55],
"gender": ['female', 'female', 'male', 'male'],
"overweight": ['y', 'n', 'y', 'y']},
index = [0, 1, 2, 3])
现在我想建立一个函数,接收一个 Dataframe (= df)和一个整数(= m)。例如m = 2,现在该函数应该将每两个列的指定组合在一起。输出应该是一个包含这些对的列表。例如m=2 und df:[[ID, age],[ID, gender],[ID, overweight],[age, gender], [age, overweight], [gender, overweight]]
有没有人知道我是怎么做到的?我的问题是m和列的数量是可变的。
2条答案
按热度按时间stszievb1#
您可以直接在 Dataframe 上使用
itertools.combinations
,因为在列名上进行迭代:输出:
dsekswqp2#