问题意识
当我们想要比较不同类别的群体(自变量)(例如:不同性别或不同年龄)在某一特征(因变量)(例如:每天使用社交媒体时间)的 平均数,是否呈现显著差异时,我们经常会使用 平均数差异分析。
自变量如果是一个二分类变量,我们通常会使用 独立样本T检验(Independent T-Test) 进行两组平均数差距是否达到统计显著差异。
自变量如果是一个三分类(含)以上的变量,我们通常会使用 单因素(单因子)方差分析(One Way Anova) 进行多组平均数差距是否达到统计显著差异。
如果我们想要检验 同一群人在前后两次 某一特征(例如:期中成绩与期末成绩)的 平均数 是否是否呈现显著差异时,我们会使用 配对样本T检验(Pair T-Test),进行检验。
如 Table 1
1 独立样本t检验(Independent Sample Test)
使用数据:TCS2015sc_Ch11.sav
1.1 目的
检验两组样本的平均数是否呈现统计上的显著差异。
1.2 基本概念
如 Figure 1
1.3 分析变量
自变量(二分类类别变量)(例如:[sex]性别)
因变量(数字变量)(例如:[smuse_min_day]每天使用社交媒体的时间-分钟数)
1.4 呈现两组平均数
1.4.1 SPSS操作
Analyze -> Compare Means -> Means
如 Figure 2
在弹出的 Means 窗口,将 性别[sex] 变量(自变量),自左边方框移到右边 Layer 1 of 1 方框; 将每天使用社交媒体的时间(分钟数) [smuse_min_day] 变量(因变量), 自左边方框移到右边 Dependent List 方框。然后点击 OK
如 Figure 3
1.4.2 报表解读
输出结果如 Figure 4
1.5 进行独立样本t检验
1.5.1 SPSS操作
Analyze -> Compare Means -> Independent Sample T Test
如 Figure 5
在 弹出的 Independent Sample T Test 窗口, 将 性别[sex] 变量(自变量),自左边方框移到右边 Grouping Variable 方框; 将每天使用社交媒体的时间(分钟数) [smuse_min_day]变量(因变量), 自左边方框移到右边 Test Variable(s) 方框。然后点击 Define Groups
如 Figure 6
在 弹出的 Define Groups窗口,确认自变量(此例为sex)的编码是否正确。 SPSS预设自变量的第一类编码为1(Group1: 1),第二类编码为2 (Group 2: 2)。我们使处所用的自变量为[性别]sex,正好也是使用(1:男, 2:女)编码。所以,不需要做任何改变,直接点击 Continue。
如 Figure 7
回到 Independent Sample T Test 窗口,然后点击 OK
如 Figure 8
1.5.2 报表解读
首先观察 Figure 9 的 Group Statistics,
看一下两组的样本数(n)、平均数(Mean)与标准差(Std Deviation)。
其次查看独立样本t检验分析表,如 Figure 10
Levene’s Test for Equality of Variance 的 F=2.372,对应的 Sig. (P value) = 0.124 > 0.05,表示自变量在因变量的方差,系呈现 等分散(equal variance)。因此,我们只要看 Equal variance assumed 这一行所对应的t值及相关的统计参数即可。
在每天使用社交媒体的时间这个因变量上,男性平均=91.13分钟, 女性平均104.11分钟,两者差距(男-女)= -12.98分钟(91.13 - 104.11) ,此一差距经独立样本t检验结果显示,t= -2.095 , 其所对应的 Sig. = 0.036 < 0.05,表示此一差距已经超过超样误差的范围,达到统计上的显著差异。
另一方面,95% Confidence Interval of the Difference (95%置信水平下的置信区间)显示,如果推论回总体,则平均数差距有 95% 的概率会落在 [-25.14 , -0.83]之间, 此一区间 没有包括0,所以也表示此一平均数差距也已经超过超样误差的范围,达到统计上的显著差异。
2 配对样本t检验(Paired Samples Test)
使用数据:pairtest.sav
2.1 目的
检验 同一群人 在 前后两次 测验成绩的 平均数, 有无呈现统计上的显著差异。
2.2 基本概念
2.3 分析变量
同一群人: t1(第一次测验成绩)(数字变量) t2(第二次测验成绩)(数字变量)
2.4 SPSS操作
Analyze -> Compare Means -> Paired Samples T Test
在 弹出的 Paired Samples T Test 窗口, 将 t1 与 t2 两个变量(皆为连续变量),自左边方框移到右边 Paired Variables 方框;然后点击 OK
2.5 报表解读
首先观察 Paired Samples Statistics 报表,如 Figure 14 告诉我们 t1(前测成绩),t2(后测成绩)的样本数(n)、平均数(Mean)与标准差(Std. Deviation)。
其次检视 Paired Samples Test 报表的 Paired Differences,如 Figure 15。
报表显示,t1-t2的 平均数差异= -1.6 (76.5-78.1), t= -1.986, 对应的 Sig. = 0.078 > 0.05。 另外,95% Confidence Interval of the Difference 的置信区间范围 包括0 [-3.42, 0.22]。
两种方法皆指向同样的结论, 即:我们在样本中所观察到 t1, t2的平均数差距, 如果推论到总体,在95%的置信水平下,此一差距 并没有 达到统计上的显著差异。
3 单因子方差分析(One way ANOVA)
使用数据:TCS2015sc_Ch11.sav
3.1 目的
检验三组(含)以上样本的平均数,两两比较,是否呈现统计上的显著差异。
3.2 基本概念
3.3 分析变量
自变量(三分类以上类别变量)(例如: [age5] 年龄五分类)
因变量(数字变量)(例如: [smuse_min_day] 每天使用社交媒体的时间-分钟数)
3.4 SPSS操作
Analyze -> Compare Means -> One-Way ANOVA
在 弹出的 One-Way ANOVA 窗口,将 每天使用社交媒体的时间-分钟 [smuse_min_day ](连续变量)自左边方框移到右边的 Dependent List, 将 年龄五分类 [age5] 自左边方框移到右边 Factor 方框;然后点击 Options
在弹出的 One-Way ANOVA: Options 窗口,分别点选 Descriptive, Homogeneity of variance test, 以及Means plot,然后点击 Continue
回到 One-Way ANOVA 窗口,点击 Post Hoc 方框,
在弹出的 One Way ANOVA: Post Hoc Multiple Comparisons 窗口的 Equal Variance Assumed 点选 Scheffe; Equal Variance Not Assumed 点选 Dunnett’s T3 然后点击 Continue
回到 One Way ANOVA 窗口,按 OK
3.5 报表解读
首先观察 Descriptive 摘要表。如 Figure 23
该表呈现自变量各类别在因变量的样本数、平均数、标准差等数据。
其次,观察自变量(age5)在因变量(smuse_min_day)的 means plos。如 Figure 24
该图显示,年龄愈大,每天使用社交媒体的时间,就愈少。
第三,观察 ANOVA 摘要报表。如 Figure 25
F=28.696, 其所对应的Sig. < 0.001, 代表至少有两组的平均数呈现显著差异。
至于是哪两组?需要透过事后多重比较检验才可得知,一般可使用 Scheffe法(当方差相等时使用)与 Dunnett T3 法(当方差不相等时使用)。我们可以透过 Levene test 来检验方差是否相等。
第四,观察 Test of Homogrneity of Variances 摘要报表(方差同质性或方差等分散性)。如 Figure 26
报表显示, Levene Statistics (Based on Mean) = 31.505, 其对应的 Sig. < 0.001 , 代表方差非呈等分散(或称方差不同质、方差不相等) ,此时研究者应使用 Dunnett T3 检验法进行事后比较。
如果 Levene Statistics (Based on Mean) 其所对应的 Sig. > 0.05 , 则代表方差呈等分散(或称方差同质,或称方差相等),此时研究者应使用 Scheffe 检验法进行事后比较。
最后,观察 Multiple Comparisons (事后多重比较)摘要报表。如 Figure 27
Multiple Comparisons 报表显示,
就 Dunnett T3 检验法来看, 1829与3039 这两组的平均数差距(Mean Difference)=30.99, 此一差距在95%置信水平下,有达到统计上的显著差异(Sig.=0.010 < 0.05; 置信区间[4.75, 57.23]没有包括0)。 达到显著差异的组别,SPSS会在平均数差异的数据右上方,显示 *。
本例,Dunnett T3 与 Scheffe 两种事后比较检验法, 所得到的结论基本上并没有非常大的差异,大部分都一致; 但在 [4049 vs 5059], [4049 vs 60及以上],这两组,却呈现 不一样 的结论。
就 Dunnett T3检验法来说,[4049 vs 5059] 及 [4049 vs 60及以上] 的平均数差距是 有 达到统计显著差异的,
但就 Scheffe 检验法来说,[4049 vs 5059] 及 [4049 vs 60及以上] 的平均数差距是 没有 达到统计显著差异的,
这是因为 Scheffe 法的置信区间比较 宽,比较不容易达到统计上的显著差异。
说明如下:
[4040 vs 5059]
Dunnett T3 : 平均数差距=18.19, 95%置信区间=[0.88, 35.51]=34.63(较窄),区间没有包括0,有显著差异。
Scheffe : 平均数差距=18.19, 95%置信区间=[-13.68, 50.08]=63.76(较宽),区间包括0,没有显著差异。
[4049 vs 60及以上]
Dunnett T3:平均数差距=23.82 95%置信区间= [4.68, 42.96 ] = 38.28(较窄),区间没有包括0,有显著差异。
Scheffe:平均数差距=23.82, 95%置信区间= [-17.81, 65.45 ] = 83.26(较宽),区间包括0,没有显著差异。
以上分析得知:
只要Scheffe 检验法得出平均数有显著差异的组别,用 Dunnett T3 检验法也必然会得到相同结论;
但用 Dunnett T3 检验方法得到平均数有显著差异的组别, 用Scheffe 法则未必;
Note所以,如果没有任何关于方差是否等分散(同质)的资讯,研究者一般都会使用Scheffe 法进行事后多重比较。因为Scheffe最保守,也最稳健。
附记
阅读本讲讲义,另请参阅:
王晓华、郭良文(2022)[1] 第十一章 (量化资料分析-数字会说话), 页216-224。