我有下面的Pandas数据框架,其中有员工的销售数据为10月。
Employee Timerange Dials Conn Conv Mtg Bkd Talk Dial
0 Ricky Ponting 10/3 - 10/7 1,869 102 60.0 2.0 3h:08m 5h:23m
1 Adam Gilchrist 10/3 - 10/7 1,336 53 30.0 1.0 1h:10m 3h:58m
2 Michael Clarke 10/3 - 10/7 1,960 74 42.0 1.0 2h:02m 5h:28m
3 Shane Warne 10/3 - 10/7 1,478 62 45.0 1.0 1h:55m 4h:07m
结构描述-
# Column Non-Null Count Dtype
--- ------ -------------- -----
1 Timerange 40 non-null object
2 Dials 40 non-null object
3 Conn 40 non-null int64
4 Conv 39 non-null float64
5 Mtg Bkd 39 non-null float64
6 Talk 40 non-null object
7 Dial︎ 40 non-null object
我主要想检查整个团队当月的拨号连接和拨号通话平均费率。示例输出如下-
Month Dials Conn Dials -> Conn Dials -> Conv
October 60517 2702 0.045 0.026
我尝试使用pd.DatetimeIndex(df ['Timerange']).Month并分隔列,但它给我错误dateutil.parser._parser.ParserError:未知字符串格式:10/3 - 10/7.请帮帮我伙计们
2条答案
按热度按时间pobjuy321#
下面是一个使用
pandas.DataFrame.groupby
和pandas.DataFrame.apply
的命题:#输出:
hgncfbus2#
我假设你的时间范围总是从你感兴趣的月份开始,并且所有数据都来自同一年(今年)。如果这些假设是合理的,那么这是可行的: