我正在使用一个以宽格式编写的数据框架。每本书都有一些销售额,但有些季度有空值,因为这本书在该季度之前没有发布。
import pandas as pd
data = {'Book Title': ['A Court of Thorns and Roses', 'Where the Crawdads Sing', 'Bad Blood', 'Atomic Habits'],
'Metric': ['Book Sales','Book Sales','Book Sales','Book Sales'],
'Q1 2022': [100000,0,0,0],
'Q2 2022': [50000,75000,0,35000],
'Q3 2022': [25000,150000,20000,45000],
'Q4 2022': [25000,20000,10000,65000]}
df1 = pd.DataFrame(data)
我想要做的是创建一个字段来标识“第一个可用季度的ID”(“First Quarter ID”),另一个字段标识“具有最大销售额的季度的ID”(“Max Quarter ID”)。然后,我想显示两个字段,分别显示第一个可用季度和第二个可用季度的销售额。
提示去做这件事?谢谢!
5条答案
按热度按时间iecba09b1#
可能的解决方案:
另一种可能的解决方案:
输出:
ehxuflar2#
编辑、更新方法,以便在熔化后更好地利用groupby
产出
oymdgrw73#
使用具有整形的自定义
groupby.agg
:输出:
5n0oy7gb4#
也许这就是你要找的。
dbf7pr2w5#
一个选项与麻木: