浅谈 AB 测试里常见的辛普森悖论

关注

来源： 2834 2017-03-02

辛普森悖论 (Simpson's Paradox) 是英国统计学家 E.H.辛普森 (E.H.Simpson) 于1951年提出的悖论，即在某个条件下的两组数据，在分别讨论时都会满足某种性质，可是一旦合并起来进行考虑，却可能导致相反的结论。

举一个辛普森悖论的简单小例子：一个大学里有商学院和法学院两个学院。这两个学院的女生都抱怨“男生录取率比女生录取率高”，有性别歧视。但是学校做总录取率统计，却发现总体来说女生录取率远远高于男生录取率！

浅谈 AB 测试里常见的辛普森悖论

商学院男生录取率75%高于女生录取率49%，法学院男生录取率10%也高于女生录取率5%，但是总计来说男生录取率只有21%，只有女生录取率42%的一半。

为什么两个学院都是男生录取率高于女生录取率，但是加起来男生录取率却不如女生录取率呢？主要是因为这两个学院男女比例很不一样，具体的统计学原理我们后面会详细分析。

这个诡异 (Counter intuitive) 的现象在现实生活中经常被忽略，毕竟只是一个统计学现象，一般情况下不会影响到我们的行动。但是对于使用科学的 AB 测试进行试验的企业决策者来说，如果不了解辛普森悖论，就可能会错误的设计试验，盲目的解读试验结论，从而对决策产生不利影响。

我们用一个真实的医学 AB 测试案例来说明这个问题。这是一个肾结石手术疗法的 AB 测试结果：

浅谈 AB 测试里常见的辛普森悖论

看上去无论是对于大型结石还是小型结石，A 疗法都比 B 疗法的疗效好。但是总计而言，似乎 B 疗法比 A 疗法要好。

这个 AB 测试的结论是有巨大问题的，无论是从细分结果看，还是从总计结果看，都无法真正判断哪个疗法好。

那么，问题出在哪里呢？这个 AB 测试的两个试验组的病历选取有问题，都不具有足够的代表性。参与试验的医生人为的制造了两个本身不相似的试验组，因为医生似乎觉得病情较重的患者更适合 A 疗法，病情较轻的患者更适合 B 疗法，所以下意识的在随机分配患者的时候，让 A 组里面大结石病历要多，而 B 组里面小结石病历要多。

更重要的问题是，很有可能影响患者康复率的最重要因素并不是疗法的选择，而是病情的轻重！换句话说，A 疗法之所以看上去不如 B 疗法，主要是因为 A 组病人里重病患者多，并不是因为 A 组病人采用 A 疗法。

所以，这一组不成功的 AB 测试，问题出在试验流量分割的不科学，主要是因为流量分割忽略了一个重要的“隐藏因素”，也就是病情轻重。正确的试验实施方案，两组试验患者里，重病患者的比例应该保持一致。

浅谈 AB 测试里常见的辛普森悖论

因为很多人容易忽略辛普森悖论，以至于有人可以专门利用这个方法来投机取巧。举个例子，比100场球赛以总胜率评价好坏。取巧的人专找高手挑战20场，胜1场，另外80场则找平手挑战，胜40场，结果胜率41%；认真的人则专挑高手挑战80场而胜8场，而剩下20场平手打个全胜，结果胜率为28%，比41%小很多。但仔细观察挑战对象，后者明显更有实力。

从这几个辛普森悖论的例子出发，联想到我们互联网产品运营的实践，一个非常常见的误判例子是这样的：拿1%用户跑了一个试验，发现试验版本购买率比对照版本高，就说试验版本更好，我们要发布试验版本。其实，可能只是我们的试验组里圈中了一些爱购买的用户而已。最后发布试验版本，反而可能降低用户体验，甚至可能造成用户留存和营收数额的下降。

那么，如何才能在 AB 测试的设计、实施，以及分析的时候，规避辛普森悖论造成的各种大坑呢？

最重要的一点是，要得到科学可信的 AB 测试试验结果，就必须合理的进行正确的流量分割，保证试验组和对照组里的用户特征是一致的，并且都具有代表性，可以代表总体用户特征。

作者：王晔

来源：吆喝科技

爱盈利（aiyingli.com）移动互联网最具影响力的盈利指导网站。定位于服务移动互联网创业者，移动盈利指导。我们的目标是让盈利目标清晰可见！降低门槛，让缺乏经验、资金有限的个人和团队获得经验和机会，提高热情，激发产品。

这100句经典文案，能瞬间抓住眼球、扣人心弦（收藏）

好的文案，能瞬间抓住眼球、扣人心弦，勾人思绪。一旦创作者文思如尿崩，往往就能创作出让观众感动，看了就湿的作品。以下由小青记主人（ID：angelinaqing520）整理电子科技1、把1000首歌装到口袋里。苹果MP3iPod2、唯一的不同，是处处都....

「三生三世」给创业公司的营销启示录

每一个想做爆款营销杀出重围的公司，恐怕都不太有耐心。所以今天这篇文章也不写漫长的导语和铺垫了。直接来和你说说，全网播放量超过300亿的2017开年第一神剧「三生三世十里桃花」的营销，并且把一些饭圈、追剧圈的“行话”翻译成创业者听的懂的语言，希望给每一....

提高用户忠诚度高APP留存率的关键在于......

移动互联网不断的发展,让包括智能手机在内的各种智能设备不断深入人们的各种生活。而中国作为世界上最大的应用程序下载市场,是各种APP应用极力争夺的,因为一个App推广最根本的便是用户。不管是做手游的、做工具的还是做社交APP的,用户每天既会不断新增,也....

运营复盘不知道如何做？这是一篇最清晰的教程！

除了复制、粘贴，日常工作中我也会涉及到一些运营，尤其是八戒教育还在我们手中的时候。但是每次做活动基本上从开始就是痛苦的，目的倒是很明确，但是落到目标和执行的时候总是走一步算一步，而且每次活动都从来不会复盘，基本上有种打一枪换一炮的意思，以至于到现在关....

如何写出“带货”的文案？4个压箱底干货奉上

撰写产品文案的最大难点，在于既不能让它像品牌文案那样飘渺，又不能沦为一份枯燥、晦涩的“说明书”。想写出具有“带货”能力的文案，需要妥善处理4个关键点：产品定位、产品功能、使用场景、产品价格针对这4个要点，运用不同的策略和技巧，才能正确地“翻译”产品信....

微信扫码登录

绑定手机号

注册

忘记密码

绑定手机号

浅谈 AB 测试里常见的辛普森悖论

评论

相关文章推荐

这100句经典文案，能瞬间抓住眼球、扣人心弦（收藏）

苹果发布 iOS 11.1 正式版：新增表情、修复wifi漏洞、3Dtouch手势回归

11月1日凌晨苹果发布了iOS11.1正式版,其中当然也包括了是最新款iPhone8、iPhone8Plus和iPhoneX，当然iPhone5、iPhone5c、iPad4则是终止了推送更新。iOS11是一次变化颇大的更新，比如重新设计了控制中心、....

「三生三世」给创业公司的营销启示录

提高用户忠诚度高APP留存率的关键在于......

运营复盘不知道如何做？这是一篇最清晰的教程！

如何写出“带货”的文案？4个压箱底干货奉上

友情链接

微信扫码登录

绑定手机号

注册

忘记密码

绑定手机号

评论

相关文章推荐

这100句经典文案，能瞬间抓住眼球、扣人心弦（收藏）

苹果发布 iOS 11.1 正式版：新增表情、修复wifi漏洞、3Dtouch手势回归

11月1日凌晨苹果发布了iOS11.1正式版,其中当然也包括了是最新款iPhone8、iPhone8Plus和iPhoneX，当然iPhone5、iPhone5c、iPad4则是终止了推送更新。iOS11是一次变化颇大的更新，比如重新设计了控制中心、....

「三生三世」给创业公司的营销启示录

提高用户忠诚度 高APP留存率的关键在于......

运营复盘不知道如何做？这是一篇最清晰的教程！

如何写出“带货”的文案？4个压箱底干货奉上

友情链接

提高用户忠诚度高APP留存率的关键在于......