1.基本原则
做数据分析工作,一定要遵循一定的原则,这些原则,我简单列了列,属于亮哥比较看重的,但是不一定是通用的。 让我们先来看数据分析的流程。 亮哥认为,数据分析应该遵循下面这个流程: 也就是说,数据分析需要从问题中来回到问题中去。拆解一下其实,数据分析主要要有五个步骤: 问问题、找对象、选数据、做分析、再验证。1、问问题:数据分析必须要有明确目的
数据分析在启动时,一定要有非常明确的目的。 这种目的,可能伴随一次或多次目标明确的测试动作。 譬如说,原先的商品落地页的购买转化率比较低,需要使用新的落地页,以提升流量进入后的购买转化率。 这个时候问的问题,应该有3个:- 当前的商品落地页是值得进行优化的吗?
- 商品落地页的优化是可行的吗?
- 能够优化到什么程度?
2、找对象:明确分析的可行性和分析的范围
对于上面的例子来说,其实是要对着三个问题来进行1by1的解决,需要去弄清楚对象。 问题1:当前的商品落地页是值得进行优化的吗? 这个问题的对象其实不是商品落地页,而是商品落地页的来源渠道的流量情况和流量到来后在商品落地页的行为模式。 因为,如果流量本身进入的就少,可能样本本身就不具备去测试验证的可能性,反而需要我们先去提升流量分发的能力。 问题2:商品落地页的优化是可行的吗? 这个问题的对象既可以是新的落地页,也可以是老的落地页,只要能够通过数据证明,对落地页的调整是否会影响购物转化率,那么就可以得到结论。 问题3:能够优化到什么程度? 这个问题其实现在是回答不了的,要回答这个问题很明显,首先有一个前提,就是商品落地页的调整,对于改进购买转化率来说,是具备可行性的。 这样你就可以把对象识别出来。3、选数据:从已明确对象身上去挖掘相关联的数据
选数据这件事儿,其实后半段不难,但前半段不太容易做。 涉及到选择时间跨度,对象数据的维度等。 一句话,要有逻辑性。4、做分析:客观中立,从数据中洞察
分析这件事情,其实就是讲究,从数据中自然推导出结论,讲究客观中立。 不能带着结论去凑数据,也不能一脸懵比不要知道数据想要和你谈什么。5、再验证:带着数据告诉你的结论,反过来去看待最初的问题
我和小朋友说的是,数据要能够带来:- 结论
- 假设
- 行动项
2.如何建立数据提取的逻辑
逻辑这件事情,非常重要。 重要到何种程度呢? 我见过刚开始做数据分析的小同学的分析报告,基本就是,堆一堆数据,然后说道说道,来了个结论,完。 我就问,为什么要取这些数据?这些数据之间有关联关系吗?是什么样的关系? 前两天,我的好朋友也是知乎大V的三水哥,写了个以毒攻毒去反驳三峡带来的负面影响的专栏文章,很值得一看,看了你就知道,有时候煞有介事堆砌的数据,其实根本就不存在因果关系。 那么,你花了几天时间去取了各种数据之后,堆叠出来的不过就是个你认为是正确的结论而已,这并没有价值。 建立数据提取的逻辑,首先是要训练自己的逻辑思维能力。 比较轻又有点小变态的训练方法是这样的: 随便拎起一个现象,就开始去做「找关系」的训练。 譬如,拿到一杯咖啡,你就可以开始训练了:- 杯咖啡是美式、拿铁还是其他什么类型的饮料?
- 美式和拿铁之间的差别就是拿铁是咖啡里加了奶,美式是咖啡里加水,可是为什么7-11用机器做一杯美式所花费的时间会大于做一杯拿铁所花费的时间,甚至是双倍的时间?
- 多出来的时间究竟是哪一个环节影响导致的?
3.数据分析其实只要三页纸
这个真的不是开玩笑,当然,因为分析工作的深浅不同、所需数据量不同,其实三页纸也可以替换成三个部分。 那么,第一个部分就是,亮哥一再强调的,分析的背景、目的、选择的样本量、参照物,以及希望得出的结论的假设。 譬如说,原先的商品落地页上,用户的购买转化率不到0.01%,需要研究这种情况是否能够得到改善,由此我们选择了2000个用户,随机分为两组,A组看到新的商品落地页,B组维持原有的商品落地页,在30天的时间内,对比这两个小组各1000个用户的购买转化率的变化,参照对象分别是: A组 VS B组在30天内的单人日均转化率; A/B组用户在看到该页面前后各30天的单人日均转化率 假设商品落地页的转化率低是由于页面设计不合理和页面内容不满意,经过对新版落地页的调整,改善了页面设计和页面内容呈现的结果,希望通过本次数据分析,找到优化商品落地页,提升购买转化率的可能性。 第二个部分很简单了,把取到的样本、数据都列出来,进行参考对比,必要的数据解释工作可以先备注好。 第三个部分就更简单了,基于数据分析的结果,去反馈结论、提出假设与组织验证,即可。 所以,实际上每个数据分析的报告,其实就应该是这三个部分就好。4.理解结论、假设与行动项
最后的部分,来举个例子,和大家说说结论、假设与行动项。 数据专员小王做了一份长达26页的数据分析报告,这份报告是围绕现有的内部渠道的运营质量进行的数据抽取和分析。 报告里洋洋洒洒列出了内部已有的多个渠道,在半年多的时间里这些渠道做了哪些内容投放,相关的展现率、点击转化率的统计,然后,结束了。 于是小王的领导老毛就和小王聊天了:「这是你的数据分析报告?你为什么做这样一个分析?」 「因为负责渠道的同事提出了需求,希望了解渠道这半年来的相关数据。」 「是要数据,还是要分析?」 「要数据,但是要协助分析。」 「如果要数据,你提供一张Excel表格就可以了,但如果要分析,这个PPT是不合格的。」 「哪里不合格?我为了这个报告加了3天班……渠道那边说挺好的……」小王很委屈。 「或许他们觉得你帮他们做了数据美化工作,而且他们自己对数据分析的目的性想得不够多,所以才觉得挺好的,但在我这里,是不过关的。」老毛详细给小王解释: 「你看,你列出了这么多渠道的半年数据,拿其中一个渠道来说,我问你几个问题:1、这半年来,通过A渠道,投放了36次,这36次针对的对象、内容有什么样的差别?对谁投放什么内容,在什么时间点投放的效果是最好的?反之,什么时候以什么形式,对什么人投放什么内容效果最差?你的结论在哪里? 2、如果你已经从数据中总结出了,在某个时间对某类人群通过某个形式投放的某一类内容的效果很好,那么,请问,这个渠道是不是只能在这个时间对这类人群用这种形式投放这类内容有效果,能不能在其他时间对其他人群换一种形式去投放不同内容,也能带来效果?你提出的假设是什么? 3、如果你已经提出了假设,你建议渠道那边的同事接下来应该做什么事情?是做一系列的测试回收数据,还是去改善渠道质量,还是在以后投放之前对用户选型和内容筛选先做一轮沟通?你建议的行动项是什么?」 小王越听压力越大,但也慢慢明白了老毛说的「不合格」是什么意思。 我们在做数据分析的时候,要始终有好奇心和责任心,通过一个小数据是可以洞察出很多问题的,而这些问题,不能仅仅限于提出,甚至是看到了但忽略的状况,否则数据分析就没有价值,可以不做。 拿一个实际的例子来说。 企业A的商业模式是按年收取固定单价的会员费,那么企业A的核心数据就是:付费会员率。 拆解这个率的时候,会有2个关联指标:
- 会员首次付费比例
- 会员续费比例
【转载说明】  若上述素材出现侵权,请及时联系我们删除及进行处理:8088013@qq.com