理论到实践，A/B测试不得不直面的4个统计学问题

snifes 发布于2019-05-29 16:58 / 2810人阅读

摘要：样本均值的方差是总体方差的为样本容量，这个结论是针对有放回抽样的。某些情况下配对样本比较难实现，比如药物双盲试验，患者不能既服用安慰剂又服用药物。样本方差和总体方差的比值，符合分布。

有放回？无放回？

从总体中随机抽取一个容量为n的样本，当样本容量 n足够大(通常要求n ≥30)时，无论总体是否符合正态分布，样本均值都会趋于正态分布。期望和总体相同，方差为总体的1/n。这即是中心极限定理，是A/B测试数据分析的基础。

然而抽样分为有放回和无放回两种。样本均值的方差是总体方差的1/n（n为样本容量），这个结论是针对有放回抽样的。实际试验中，大部分是无放回的，这样流程比较简单。无放回抽样，样本均值方差见下。观察公式可知道，当总体容量比样本容量大很多倍时，样本均值的方差可以近似为总体方差的1/n。

配对样本？独立样本？

当两个样本的获取存在关联时，称为配对样本。例如比较人早晚身高变化，如果早上身高的样本包含了张三，则晚上身高的样本也要包含张三。

某些情况下配对样本比较难实现，比如药物双盲试验，患者不能既服用安慰剂又服用药物。这时只能使用独立样本，随机分配个体进入两个样本，认为2个样本的个体统计上不存在差别。同时患者不知道自己服用的是安慰剂还是药物，消除心理作用的影响。

互联网产品的A/B测试和新药试验类似，理论上说应该让同一组用户同时看到多个版本进行比较，或者是看完一个版本后用时间机器倒回去再看另一个版本。显然无法做到，只能选取试验用户时足够的随机，让两组用户从统计意义上相同，认为偏差都是产品版本造成的。

样本方差？总体方差？
A/B测试计算置信区间的公式：

置信区间计算公式中的方差项，理论上应该使用总体方差。而总体方差没法知道，只能用样本方差来代替了。好在样本方差是总体方差的无偏估计。样本方差和总体方差的比值，符合χ2分布。

时变？时不变？
A/B测试需要假设产品用户的访问习惯不会随着时间的推移而发生变化。很遗憾在某些情况下并不是这样。某些产品存在很明显的季节因素，例如旅游。一般的A/B测试周期会包含休息日和工作日，但很难包含多个季节，在外推测试结论时要十分谨慎。另外强烈的外部事件会对用户产生刺激，要避免在这种情况下进行A/B测试，尽量在平稳时期进行。

本文作者：吆喝科技高级客户成功专家韩刚

云服务器 GPU云服务器致命的8个问题决定云服务器价格的4个关键参数统计数据的问题数据统计的四个步骤

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/8736.html

The Way to TiDB 3.0 and Beyond (下篇)

摘要：本文为我司申砾在上的演讲实录。虽然这个线程做的事情已经足够简单，但是因为上所有的都会通过一个线程来驱动自己的状态机，所以当压力足够大的时候就会成为瓶颈。本文为我司 Engineering VP 申砾在 TiDB DevCon 2019 上的演讲实录。在上篇中，申砾老师重点回顾了 TiDB 2.1 的特性，并分享了我们对「如何做好一个数据库」的看法。本篇将继续介绍 TiDB 3.0...

lpjustdoit 2019-06-25 19:05 评论0 收藏0

发表评论

登陆后可评论

0条评论

snifes

男|高级讲师

我要关注我要私信

TA的文章

如何保证消息队列的可靠性传输？

阅读 3373·2021-11-22 12:04
垂直水平居中的方式总结 +（使用场景）

阅读 2760·2019-08-29 13:49
(a== 1 && a ==2 && a==3) ever eval

阅读 525·2019-08-26 13:45
html+css+js+Hbuilder开发一款安卓APP，根本不用学Android开发！

阅读 2310·2019-08-26 11:56
每周一点canvas动画——《支付宝价格拖动选择》

阅读 1050·2019-08-26 11:43
简单HTML5移动端（客户端）图片上传

阅读 637·2019-08-26 10:45
前端开发面试题链接

阅读 1313·2019-08-23 16:48
小程序显示弹窗时禁止下层的内容滚动

阅读 2219·2019-08-23 16:07

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

理论到实践，A/B测试不得不直面的4个统计学问题

相关文章

The Way to TiDB 3.0 and Beyond (下篇)

发表评论

0条评论

snifes

男|高级讲师

TA的文章

如何保证消息队列的可靠性传输？

垂直水平居中的方式总结 +（使用场景）

(a== 1 && a ==2 && a==3) ever eval

html+css+js+Hbuilder开发一款安卓APP，根本不用学Android开发！

每周一点canvas动画——《支付宝价格拖动选择》

简单HTML5移动端（客户端）图片上传

前端开发面试题链接

小程序显示弹窗时禁止下层的内容滚动

最新活动