前言:
1.1 定位问题
1.2 排查影响因素
2.1 必备功能(由始至终)
2.2 面向用户(由内而外)
2.3 前后端逻辑
作为一名数据分析师,分析“某某指标下降或者提升”是非常日常的工作。但如果每次一遇到这类问题就一通操作分析,着实有些耽误时间。好在这类“指标异动”的分析通常是有一些固定的套路的,逻辑并不复杂。
因此,咱们尝试抽象出这类问题的解决方法,并做一个「自动分析」的工具,来替代数据分析师的这部分日常工作,解放生产力呀。
本文就拿“GMV异动”举例,来介绍这类指标异动的分析思路、以及如何实现自动化。
其中“分析思路”在业内主要有两种:贡献度和基尼系数。本文主要介绍前者。
即:什么时候相对什么时候的下降?
这里注意,发生期和基准期的天数是否相同?如果是相同,那么直接对比总GMV变化就行;反之可以对比他们的日均GMV变化。为了方便“自动化”,我们暂且都按日均GMV算。
这是我们在收到“GMV异动”时候,第一个要排查的因素!
为什么要把【数据准确性】放到第一个?因为以免我们吭哧吭哧分析半天后发现:“原来只是数据源出问题了”,白白浪费了分析资源!
那么数据准确性可以从以下几个方向确定:
到此,我们进入正题,开始开始定位GMV异动的可能原因。
按GMV公式,我们分3步骤探索:
下面具体展开:
1)定位GMV下降的特征
统计GMV的常见维度,分为固有属性和变化属性,如:
变化属性:(用户在之后的行为里可能会产生变化的)
展开这些维度,计算这些维度下的特征对GMV异动的贡献度,并按贡献度降序排名
记:
发生期各维度的特征为gmv2,总值为sum2
基准期各维度的特征为gmv1,总值为sum1
某特征贡献度=(gmv2-gmv1)/(sum2-sum1)
给贡献度设定阈值,认为超过该阈值就是需要重视的特征,比如“贡献度超过20%”就算它是影响GMV异动的特征
把以上特征分为【固有特征】和【变化特征】
2)是否是由于dau基数影响到gmv
计算两个时期下的【固有特征】的特征的DAU相对差异:
同样还是给差异设定阈值,如果超过该阈值就是dau基数影响了GMV。
比如:
“新增渠道-ios,在发生期的dau比基准期的dau低了50%”,那我们就认为ios的基数变化可能是影响GMV异动的因素之一。
3)定位GMV下降的特征的支付漏斗折损位置
计算两个时期下的【固有特征】和【变化特征】的转化漏斗,来看是哪个位置的上级转化率产生较大差异。
比如:
支付路径为【a-b-c-d-e】,其中发生期和基准期的【a-b-c-d】的各级转化率的相对差异不超过5%,比较稳定;但是发生期【d-e】的上级转化率的比对照期低50%,那我们认为【d-e】是一个对GMV异动折损比较大的位置。
综上,我们基本定位到:
我们再继续从产品内外部寻找可能导致产生“异动特征和折损位置”的事件。
大盘
拉长时间轴到去年/上季度/上月/上周同期,看历史异常还是近期异常?*添加其他产品的同期数据,看是否大家都是异常?
产品
发生期的版本是否有功能调整、样式改版、策略调整?
发生期的版本是否有其他缺陷?
技术
【支付路径】之间哪里有bug?
运营
运营活动、push效果如何?
拉新渠道、投放推广是否发生变化?
用户
用户群是否发生变化?
政治
政策影响、监管
经济
竟品app数据、双11、618
社会
假期效应:开学季、暑期、传统节假日
热点事件:突发热点
综上,我们基本能定位到GMV下降的可能原因:
所谓“自动化”,其实是指:开发一个让“GMV下降”能够一键分析的数据产品。
我们首先需要确认该产品的必备功能;其次是它的面向用户,即“给谁用”;最后确定该产品的前端展示和后端交互逻辑。
把必备功能分为以下3类:
知道用户是谁,才能知道给他具体做什么功能;以及让这些功能的理解成本最低、用起来顺手又方便。
数据人员:
因为原本的“异动分析”工作是咱们数据分析师承担的,因此得要这个产品首先满足咱们自己人,先要让分析师用起来爽;
即使该产品的理解门槛高,分析师也能比较容易的解读。
业务人员:
其次是最关注“异动分析”的是业务同学,业务同学对“分析思路”的理解成本相对分析师要高一些,因此我们要把该产品的理解成本再降低,让业务更快跑起来!
有的业务同学在获取“GMV异动原因”的信息后,需要把这个解读汇报给领导,因此存在“信息二次传递”的情况,我们还需要继续往外考虑。
领导:
最后我们希望该产品能够被领导们用(称)上(赞)呀!让领导们能够自由分析、提高信息传递的效率,因此就更需要让该产品容易用、好用。
根据以上对产品功能、面向用户的明确,我们最后把产品的设计为如下几部分:
1. 前端
筛选区域:
日期:发生期、基准期
各个维度
数据现况展示:(使用GMV分区表)
相对差异:(发生期-基准期)/基准期,也按day1-dayn展开
基准期是20天、发生期是15天
那么横轴上起点是基准期和发生期的第一天的GMV、以此往后推
基准期的是day1-day20、发生期是day1-day15
横轴上先是基准期、再是发生期
拉长自然日期的GMV展示,比如:
合并2个时期的GMV绝对值展示,比如:
合并2个时期的GMV相对差异展示
贡献度分析:(使用GMV分区表)
DAU分析:(使用支付漏斗表)
漏斗分析:(使用支付漏斗表)
以上3个步骤是对应【1.1定位问题:按【GMV=dau转化率客单价】来定位问题所在】
大事件:
大事件是指【排查因素里的内外部事件】,这部分需要人工手动维护。
自动化总结
对以上每个步骤的自动化文字总结,这样更方便用户理解分析过程。
2. 后端数据
到此,实现“自动化GMV异动分析”的讲解就结束啦。总之,本文的分析思路是简化版,具体还需要各位大佬结合实际业务场景做定制化的修改啦~
·················END·················
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/junhongzhang/article/details/122119355
内容来源于网络,如有侵权,请联系作者删除!