我有一个类似这样的 Dataframe ,它在key
列中有大约40个唯一值,其中一些是整数。如果可能的话,我不希望任何东西被聚合:
hash ft timestamp id key value
1ab 1 2022-01-02 12:21:11 1 aaa 121289
1ab 1 2022-01-02 12:21:11 1 bbb 13ADF
1ab 1 2022-01-02 12:21:11 2 aaa 13ADH
1ab 1 2022-01-02 12:21:11 2 bbb 13ADH
2ab 2 2022-01-02 12:21:11 3 aaa 121382
2ab 2 2022-01-02 12:21:11 3 bbb 121381
2ab 2 2022-01-02 12:21:11 3 ccc 121389
我试图只透视key
和value
列上的2的数据,同时保留其余相同的列和索引。示例:
当我运行下面的代码时,列名采用分组值,其中columnname为以下各列的值id, ft, value
。实际列名之一,带括号:('id', '1', '121289')
,我被迫选择一个索引,这是我不想做的。
编码:df.pivot_table(index='hash',columns=['ft','key'])
我不知道我做错了什么,我不能使用value
列来表示values
。我得到了一个空的 Dataframe :
df.pivot_table(index='hash',columns=['ft','key'], values='value')
1条答案
按热度按时间lf5gs5x21#
使用
pandas.DataFrame.pivot
的可能解决方案:输出量:
数据来源:
编辑
为了克服下文报告的一个错误,执行主任在一份评论中提出了以下解决办法: