SPSS讲义:平均数差异分析

Author
Affiliation

刘念夏教授, PhD

Published

01 November 2025

问题意识

当我们想要比较不同类别的群体(自变量)(例如:不同性别或不同年龄)在某一特征(因变量)(例如:每天使用社交媒体时间)的 平均数,是否呈现显著差异时,我们经常会使用 平均数差异分析

自变量如果是一个二分类变量,我们通常会使用 独立样本T检验(Independent T-Test) 进行两组平均数差距是否达到统计显著差异。

自变量如果是一个三分类(含)以上的变量,我们通常会使用 单因素(单因子)方差分析(One Way Anova) 进行多组平均数差距是否达到统计显著差异。

如果我们想要检验 同一群人在前后两次 某一特征(例如:期中成绩与期末成绩)的 平均数 是否是否呈现显著差异时,我们会使用 配对样本T检验(Pair T-Test),进行检验。

Table 1

Table 1: 双变量分析表

1 独立样本t检验(Independent Samples T Test)

使用数据:TCS2015sc_Ch11.sav

1.1 目的

检验两组样本的 [平均数差距] 是否呈现统计上的显著差异。

1.2 基本概念

Figure 1

Figure 1: 基本概念-独立样本t检验

1.3 分析变量

自变量(二分类类别变量)(例如:[sex]性别)

因变量(数字变量)(例如:[smuse_min_day]每天使用社交媒体的时间-分钟数)

1.4 呈现两组平均数

1.4.1 SPSS操作

Analyze -> Compare Means -> Means

Figure 2

Figure 2: 两组平均数比较操作-1

在弹出的 Means 窗口,将 性别[sex] 变量(自变量),自左边方框移到右边 Layer 1 of 1 方框; 将每天使用社交媒体的时间(分钟数) [smuse_min_day] 变量(因变量), 自左边方框移到右边 Dependent List 方框。然后点击 OK

Figure 3

Figure 3: 两组平均数比较操作-2

1.4.2 报表解读

输出结果如 Figure 4

Figure 4: 两组平均数比较输出结果

1.5 进行独立样本t检验

1.5.1 SPSS操作

Analyze -> Compare Means -> Independent Sample T Test

Figure 5

Figure 5: 独立样本t检验操作-1

在 弹出的 Independent Sample T Test 窗口, 将 性别[sex] 变量(自变量),自左边方框移到右边 Grouping Variable 方框; 将每天使用社交媒体的时间(分钟数) [smuse_min_day]变量(因变量), 自左边方框移到右边 Test Variable(s) 方框。然后点击 Define Groups

Figure 6

Figure 6: 独立样本t检验操作-2

在 弹出的 Define Groups窗口,确认自变量(此例为sex)的编码是否正确。 SPSS预设自变量的第一类编码为1(Group1: 1),第二类编码为2 (Group 2: 2)。我们使处所用的自变量为[性别]sex,正好也是使用(1:男, 2:女)编码。所以,不需要做任何改变,直接点击 Continue

Figure 7

Figure 7: 独立样本t检验操作-3

回到 Independent Sample T Test 窗口,然后点击 OK

Figure 8

Figure 8: 独立样本t检验操作-4

1.5.2 报表解读

首先观察 Figure 9Group Statistics
看一下两组的样本数(n)、平均数(Mean)与标准差(Std Deviation)。

Figure 9: 独立样本t检验输出结果-1

其次查看独立样本t检验分析表,如 Figure 10

Levene’s Test for Equality of VarianceF=2.372,对应的 Sig. (P value) = 0.124 > 0.05,表示自变量在因变量的方差,系呈现 等分散(equal variance)。因此,我们只要看 Equal variance assumed 这一行所对应的t值及相关的统计参数即可。

Figure 10: 独立样本t检验输出结果-2

在每天使用社交媒体的时间这个因变量上,男性平均=91.13分钟, 女性平均104.11分钟,两者差距(男-女)= -12.98分钟(91.13 - 104.11) ,此一差距经独立样本t检验结果显示,t= -2.095 , 其所对应的 Sig. = 0.036 < 0.05,表示此一差距已经超过抽样误差的范围,达到统计上的显著差异。

另一方面,95% Confidence Interval of the Difference (95%置信水平下的置信区间)显示,如果推论回总体,则平均数差距有 95% 的概率会落在 [-25.14 , -0.83]之间, 此一区间 没有包括0,所以也表示此一平均数差距也已经超过抽样误差的范围,达到统计上的显著差异。

Note

★ 检验 [方差是否呈现等分散性] 的方法:

如果 Levene Test for Equality of Variances 中,F 值对应的 Sig. (显着性, P ) > 0.05,表示两组的方差分布呈现 “等分散性”(equal variances)。

如果 F 值对应的 Sig. (显着性, P ) ≦ 0.05,表示两组的方差分布呈现 “非等分散性” (NOT equal variance)。

如 下面兩個圖示例:

方差相等(eaual variance)vs.方差不相等(NOT eaual variacne)示例
Note

★ 检验 [两组平均数差距] 是否达到 [统计显著差异] 的方法:

  • 置信区间法:如果 95% Confidence Interval of Mean Difference 不包括0 ,表示两组平均数差距 达到统计显著差异。如果包括0 ,表示两组平均数差距 没有 达到统计显著差异。

  • P 值检验法:如果 t value 所对应的 Sig.(显着性, P ) ≦ 0.05 ,表示两组平均数差距 达到统计显著差异。如果 > 0.05,表示两组平均数差距 没有 达到统计显著差异。

2 配对样本t检验(Paired Samples Test)

使用数据:pairtest.sav

2.1 目的

检验 同一群人前后两次 测验成绩的 平均数, 有无呈现统计上的显著差异。

2.2 基本概念

Figure 11

Figure 11: 基本概念-配对样本t检验

2.3 分析变量

同一群人: t1(第一次测验成绩)(数字变量) t2(第二次测验成绩)(数字变量)

2.4 SPSS操作

Analyze -> Compare Means -> Paired Samples T Test

Figure 12

Figure 12: 配对样本t检验操作-1

在 弹出的 Paired Samples T Test 窗口, 将 t1 与 t2 两个变量(皆为连续变量),自左边方框移到右边 Paired Variables 方框;然后点击 OK

Figure 13

Figure 13: 配对样本t检验操作-2

2.5 报表解读

首先观察 Paired Samples Statistics 报表,如 Figure 14 告诉我们 t1(前测成绩),t2(后测成绩)的样本数(n)、平均数(Mean)与标准差(Std. Deviation)。

Figure 14: 配对样本t检验输出结果-1

其次检视 Paired Samples Test 报表的 Paired Differences,如 Figure 15

报表显示,t1-t2的 平均数差异= -1.6 (76.5-78.1), t= -1.986, 对应的 Sig. = 0.078 > 0.05。 另外,95% Confidence Interval of the Difference 的置信区间范围 包括0 [-3.42, 0.22]

两种方法皆指向同样的结论, 即:我们在样本中所观察到 t1, t2的平均数差距, 如果推论到总体,在95%的置信水平下,此一差距 并没有 达到统计上的显著差异。

Figure 15: 配对样本t检验输出结果-2
Note

★ 检验 [前後測平均数差距] 是否达到 [统计显著差异] 的方法:

  • 置信区间法:如果 95% Confidence Interval of Mean Difference 不包括0 ,表示前後測平均数差距 达到统计显著差异。如果包括0 ,表示前後測平均数差距 没有 达到统计显著差异。

  • P 值检验法:如果 t value 所对应的 Sig.(显着性, P ) ≦ 0.05 ,表示前後測平均数差距 达到统计显著差异。如果 > 0.05,表示前後測平均数差距 没有 达到统计显著差异。

3 单因子方差分析(One way ANOVA)

使用数据:TCS2015sc_Ch11.sav

3.1 目的

检验三组(含)以上样本的平均数,两两比较,是否呈现统计上的显著差异。

3.2 基本概念

Figure 16

Figure 16: 基本概念-单因子方差分析

3.3 分析变量

自变量(三分类以上类别变量)(例如: [age5] 年龄五分类)

因变量(数字变量)(例如: [smuse_min_day] 每天使用社交媒体的时间-分钟数)

3.4 SPSS操作

Analyze -> Compare Means -> One-Way ANOVA

Figure 17

Figure 17: 单因子方差分析操作-1

在 弹出的 One-Way ANOVA 窗口,将 每天使用社交媒体的时间-分钟 [smuse_min_day ](连续变量)自左边方框移到右边的 Dependent List, 将 年龄五分类 [age5] 自左边方框移到右边 Factor 方框;然后点击 Options

Figure 18

Figure 18: 单因子方差分析操作-2

在弹出的 One-Way ANOVA: Options 窗口,分别点选 Descriptive, Homogeneity of variance test, 以及Means plot,然后点击 Continue

Figure 19

Figure 19: 单因子方差分析操作-3

回到 One-Way ANOVA 窗口,点击 Post Hoc 方框,

Figure 20

Figure 20: 单因子方差分析操作-4

在弹出的 One Way ANOVA: Post Hoc Multiple Comparisons 窗口的 Equal Variance Assumed 点选 ScheffeEqual Variance Not Assumed 点选 Dunnett’s T3 然后点击 Continue

Figure 21

Figure 21: 单因子方差分析操作-5

回到 One Way ANOVA 窗口,按 OK

Figure 22

Figure 22: 单因子方差分析操作-6

3.5 报表解读

首先观察 Descriptive 摘要表。如 Figure 23

该表呈现自变量各类别在因变量的样本数、平均数、标准差等数据。

Figure 23: 单因子方差分析输出结果-1

其次,观察自变量(age5)在因变量(smuse_min_day)的 means plos。如 Figure 24

该图显示,年龄愈大,每天使用社交媒体的时间,就愈少。

Figure 24: 单因子方差分析输出结果-2

第三,观察 ANOVA 摘要报表。如 Figure 25

F=28.696, 其所对应的Sig. < 0.001, 代表至少有两组的平均数呈现显著差异。(如果F值所对应的Sig.(显着性, P ) > 0.05, 表示任何兩组平均数差距都未呈現显著差异)

Figure 25: 单因子方差分析输出结果-3

至于是哪两组?需要透过事后多重比较检验才可得知,一般可使用 Scheffe法(当方差相等时使用)与 Dunnett T3 法(当方差不相等时使用)。我们可以透过 Levene test 来检验方差是否相等。

第四,观察 Test of Homogrneity of Variances 摘要报表(方差同质性或方差等分散性)。如 Figure 26

Figure 26: 单因子方差分析输出结果-4

报表显示, Levene Statistics (Based on Mean) = 31.505, 其对应的 Sig. < 0.001 , 代表方差非呈等分散(或称方差不同质、方差不相等) ,此时研究者应使用 Dunnett T3 检验法进行事后比较。

如果 Levene Statistics (Based on Mean) 其所对应的 Sig. > 0.05 , 则代表方差呈等分散(或称方差同质,或称方差相等),此时研究者应使用 Scheffe 检验法进行事后比较。

最后,观察 Multiple Comparisons (事后多重比较)摘要报表。如 Figure 27

Figure 27: 单因子方差分析输出结果-5

Multiple Comparisons 报表显示,

Dunnett T3 检验法来看, 1829与3039 这两组的平均数差距(Mean Difference)=30.99, 此一差距在95%置信水平下,有达到统计上的显著差异(Sig.=0.010 < 0.05; 置信区间[4.75, 57.23]没有包括0)。 达到显著差异的组别,SPSS会在平均数差异的数据右上方,显示 *。

本例,Dunnett T3 与 Scheffe 两种事后比较检验法, 所得到的结论基本上并没有非常大的差异,大部分都一致; 但在 [4049 vs 5059], [4049 vs 60及以上],这两组,却呈现 不一样 的结论。

Dunnett T3检验法来说,[4049 vs 5059] 及 [4049 vs 60及以上] 的平均数差距是 达到统计显著差异的

但就 Scheffe 检验法来说,[4049 vs 5059] 及 [4049 vs 60及以上] 的平均数差距是 没有 达到统计显著差异的

这是因为 Scheffe 法的置信区间比较 ,比较不容易达到统计上的显著差异。

说明如下:

  • [4040 vs 5059]

Dunnett T3 : 平均数差距=18.19, 95%置信区间=[0.88, 35.51]=34.63(较窄),区间没有包括0,有显著差异。

Scheffe : 平均数差距=18.19, 95%置信区间=[-13.68, 50.08]=63.76(较宽),区间包括0,没有显著差异。

  • [4049 vs 60及以上]

Dunnett T3:平均数差距=23.82 95%置信区间= [4.68, 42.96 ] = 38.28(较窄),区间没有包括0,有显著差异。

Scheffe:平均数差距=23.82, 95%置信区间= [-17.81, 65.45 ] = 83.26(较宽),区间包括0,没有显著差异。

以上分析得知:

  • 只要Scheffe 检验法得出平均数有显著差异的组别,用 Dunnett T3 检验法也必然会得到相同结论;

  • 但用 Dunnett T3 检验方法得到平均数有显著差异的组别, 用Scheffe 法则未必;

Note

ANOVA摘要表中,如果F值所对应的Sig.(显着性, P ) > 0.05, 表示任何兩组平均数差距都未呈現显著差异。如果F值所对应的Sig.(显着性, P ) ≦ 0.05, 表示至少有兩组的平均数差距,呈現显著差异。

Test of Homogeneity of Variances 摘要表中如果 Levene Statistic 数值 所对应的Sig.(显著性, P ) > 0.05(方差等分散),我们可以使用 Scheffe检验法,观察到底是哪兩组的平均数差距呈現显著差异。如果 Levene Statistic 数值 所对应的Sig.(显着性, P ) ≦ 0.05(方差不等分散),我们可以使用 Dunnett T3 检验法,观察到底是哪兩组的平均数差距呈現显著差异。

★ 如果没有任何关于方差是否等分散的资讯,我們一般都会使用Scheffe 法进行事后多重比较。因为Scheffe检验法最严格,也最稳健。

附记

阅读本讲讲义,另请参阅:

王晓华、郭良文(2022)[1] 第十一章 (量化资料分析-数字会说话), 页216-224。

References

[1]
王晓华, 郭良文. 传播学研究方法[M]. 北京: 高等教育出版社, 2022.