有一个 Dataframe :
df = pd.DataFrame.from_dict({
'A': ['A1','A1','A1','A1','A2','A2','A2','A2'],
'B': ['B1','B1','B2','B2','B3','B3','B4','B4'],
'C': ['one','two','one','two','one','two','one','two'],
'D': [0, 0, np.nan, 1, 0, np.nan, 1, 1],
'E': [1, 1, np.nan, 1, 0, np.nan, 1, 1]
})
因此,作为一个表,它看起来像这样:
我尝试将其按A
和B
进行分组,并将列C
移到header,这样列将重命名为('one', 'D'), ('one', 'E'), ('two', 'D'), ('two', 'E')
,它将具有以下外观:
为了实现这一点,我尝试了pivot_table
和group + unstack
方法:
# Method 1
df.pivot_table(index=['A', 'B'], columns='C', values=['D', 'E'], aggfunc='sum', fill_value=0)
# Method 2
df.groupby(['A', 'B', 'C']).agg('sum').unstack(level=['D', 'E'])
这两种方法都返回相同的结果,其中作为列名的值位于最顶端:
如何移动列层或使用非常低的列级别上的值创建透视表?
或者更准确的问题:如何从df
中获取映像2的 Dataframe ,而不是映像3的 Dataframe ?
1条答案
按热度按时间nhhxz33t1#
如果可以使用旋转,则添加
DataFrame.swaplevel
和DataFrame.sort_index
:或者,如果可以使用聚合
sum
,则将DataFrame.stack
与Series.unstack
一起使用: