- T检验的升级版其实是Z检验,T检验只是Z检验的替代版,但是80%的情况下我们会使用T检验,因为Z检验的使用前提是总体均值已知,但是这个条件在如今情况下几乎是不可能的,(比如全国人民的平均身高,你需要每个人都量一遍吗?)。在总体均值未知,样本量较小的情况下(一般是样本量<30,但这需要根据样本来自的总体大小而定),我们还是使用T检验。
- Z检验与T检验方法能够使用的最重要的前提是一个定理→ 中心极限定理:假设我们从一个总体里抽取一定数量的样本,计算此样本的均值,然后重复100次抽取,那么画出这些样本均值的分布将会是正态的。正是因为这个定理,我们的T检验适用于任何总体。
单样本T检验:(One-Sample t-test)
与他的名称一样,单样本T检验就是我们只有一个样本。 假设样本均值为
1. 提出问题,设定0假设和对立假设
0假设是指我们假设此样本与总体无显著不同;一般为X = μ 对立假设可以根据实际情况定为三种:- 我们假设此样本与总体有显著不同。≠μ
- 我们假设此样本比总体均值要高。≥μ
- 我们假设此样本比总体均值要低。<μ
2. 确定样本均值和样本标准偏差


3. 确定均值标准误差SEM

(n为样本个数)
标准误差用来衡量抽样误差,标准误差越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。4. 确定95%/99%置信水平下t临界值
至于选择95%还是99%置信水平,需要根据实际情况进行选择,一般来说,数值越大,精度越高,95%已经能满足绝大部分数据要求。对于t临界值的确定,我们需要用到T表格,T表格链接(参考百度文库https://wenku.baidu.com/view/c010cdc22cc58bd63186bd84.html)。 如何使用T表格?我们需要根据自由度与显著性水平两个值进行查询,一般自由度df = n – 1 ,根据第一步设置的对立假设,确定为单尾检验还是双尾检验,然后根据95%/99%置信水平求得显著性水平。5. 确定t值
t值求解公式:
6. 得出结论
根据求出的t值与t临界值进行对比,根据t值所在区域判断是否拒绝0假设,接受对立假设。
7. 确定Cohen’s d(可选)
Cohen’s d等于(样本均值 – 总体均值)/样本的标准偏差,它反映的是样本均值和总体均值之间存在多少个标准偏差。8. 确定95%/99%置信区间(可选)
置信区间公式:
具体案例
此案例为定性数据定量化的案例之一。 假设我们现在要判断一款产品的用户体验如何,用户体验这个概念比较主观,我们需要将定性的数据进行定量化处理。 我们一般的用户体验分为以下5种:- 感官体验:呈现给用户视听上的体验,强调舒适性。
- 交互体验:呈现给用户操作上的体验,强调易用/可用性。
- 情感体验:呈现给用户心理上的体验,强调友好性。
- 浏览体验:呈现给用户浏览上的体验,强调吸引性。
- 信任体验:呈现给用户的信任体验,强调可靠性。
分数段 得分 感官体验 0-10 4 交互体验 0-10 7 浏览体验 0-10 6 情感体验 0-10 7 信任体验 0-10 8 平均得分 6.4我们邀请28个目标用户,事先与其沟通好每种体验的正确体验方式,得出了28人的体验平均得分样本:
6.2,5.3,8.7,7.4,5.2,6.9,8.3,4.4,7.8,6.5,5.9,5.3,5.4,7.5,7.4,4.3,8.5,6.9,6.4,4.7,8.7,6.4,9.2,6.3,4.7,6.5,5.4,7.1我们假设用户体验的行业及格平均分的标准为6分。 那么,我们提出的问题是,此产品的用户体验平均得分是否超过行业及格标准分?
1. 提出问题,设定0假设和对立假设
(1)0假设 此产品的用户体验平均得分等于行业及格平均分。

2. 确定样本的均值和样本标准偏差
根据样本数据我们求得:
3. 确定SEM(均值标准误差)

4. 确定95%的置信水平下t临界值
自由度

5. 确定t值

6. 得出结论

7. 确定95%置信区间
根据公式:
【转载说明】  若上述素材出现侵权,请及时联系我们删除及进行处理:8088013@qq.com