SPSS讲义:平均数差异分析

Author
Affiliation

刘念夏教授, PhD

Published

13 November 2025

问题意识

当我们想要比较不同类别的群体(自变量)(例如:不同性别或不同年龄)在某一特征(因变量)(例如:每天使用社交媒体时间)的 平均数,是否呈现显著差异时,我们经常会使用 平均数差异分析

自变量如果是一个二分类变量,我们通常会使用 独立样本T检验(Independent T-Test) 进行两组平均数差距是否达到统计显著差异。

自变量如果是一个三分类(含)以上的变量,我们通常会使用 单因素(单因子)方差分析(One Way Anova) 进行多组平均数差距是否达到统计显著差异。

如果我们想要检验 同一群人在前后两次 某一特征(例如:期中成绩与期末成绩)的 平均数 是否是否呈现显著差异时,我们会使用 配对样本T检验(Pair T-Test),进行检验。

Table 1

Table 1: 双变量分析表

1 独立样本t检验(Independent Samples T Test)

使用数据:TCS2015sc_Ch11.sav

1.1 目的

检验两组样本的 [平均数差距] 是否呈现统计上的显著差异。

1.2 基本概念

Figure 1 (Python绘图)

Figure 1: 基本概念-独立样本t检验

1.3 分析变量

自变量(二分类类别变量)(例如:[sex]性别)

因变量(数字变量)(例如:[smuse_min_day]每天使用社交媒体的时间-分钟数)

1.4 呈现两组平均数

1.4.1 SPSS操作

Analyze -> Compare Means -> Means

Figure 2

Figure 2: 两组平均数比较操作-1

在弹出的 Means 窗口,将 性别[sex] 变量(自变量),自左边方框移到右边 Layer 1 of 1 方框; 将每天使用社交媒体的时间(分钟数) [smuse_min_day] 变量(因变量), 自左边方框移到右边 Dependent List 方框。然后点击 OK

Figure 3

Figure 3: 两组平均数比较操作-2

1.4.2 报表解读

输出结果如 Figure 4

Figure 4: 两组平均数比较输出结果

1.5 进行独立样本t检验

1.5.1 SPSS操作

Analyze -> Compare Means -> Independent Sample T Test

Figure 5

Figure 5: 独立样本t检验操作-1

在 弹出的 Independent Sample T Test 窗口, 将 性别[sex] 变量(自变量),自左边方框移到右边 Grouping Variable 方框; 将每天使用社交媒体的时间(分钟数) [smuse_min_day]变量(因变量), 自左边方框移到右边 Test Variable(s) 方框。然后点击 Define Groups

Figure 6

Figure 6: 独立样本t检验操作-2

在 弹出的 Define Groups窗口,确认自变量(此例为sex)的编码是否正确。 SPSS预设自变量的第一类编码为1(Group1: 1),第二类编码为2 (Group 2: 2)。我们使处所用的自变量为[性别]sex,正好也是使用(1:男, 2:女)编码。所以,不需要做任何改变,直接点击 Continue

Figure 7

Figure 7: 独立样本t检验操作-3

回到 Independent Sample T Test 窗口,然后点击 OK

Figure 8

Figure 8: 独立样本t检验操作-4

1.5.2 报表解读

首先观察 Figure 9Group Statistics
看一下两组的样本数(n)、平均数(Mean)与标准差(Std Deviation)。

Figure 9: 独立样本t检验输出结果-1

其次查看独立样本t检验分析表,如 Figure 10

Levene’s Test for Equality of VarianceF=2.372,对应的 Sig. (P value) = 0.124 > 0.05,表示自变量在因变量的方差,系呈现 等分散(equal variance)。因此,我们只要看 Equal variance assumed 这一行所对应的t值及相关的统计参数即可。

Figure 10: 独立样本t检验输出结果-2

在每天使用社交媒体的时间这个因变量上,男性平均=91.13分钟, 女性平均104.11分钟,两者差距(男-女)= -12.98分钟(91.13 - 104.11) ,此一差距经独立样本t检验结果显示,t= -2.095 , 其所对应的 Sig. = 0.036 < 0.05,表示此一差距已经超过抽样误差的范围,达到统计上的显著差异。

另一方面,95% Confidence Interval of the Difference (95%置信水平下的置信区间)显示,如果推论回总体,则平均数差距有 95% 的概率会落在 [-25.14 , -0.83]之间, 此一区间 没有包括0,所以也表示此一平均数差距也已经超过抽样误差的范围,达到统计上的显著差异。

Note

★ 检验 [方差是否呈现等分散性] 的方法:

如果 Levene Test for Equality of Variances 中,F 值对应的 Sig. (显着性, P ) > 0.05,表示两组的方差分布呈现 “等分散性”(equal variances)。

如果 F 值对应的 Sig. (显着性, P ) ≦ 0.05,表示两组的方差分布呈现 “非等分散性” (NOT equal variance)。

如 下面兩個圖示例:(Python绘图)

方差不相等(NOT eaual variance,左图) vs.方差相等(equal variacne, 右图)示例
Note

★ 检验 [两组平均数差距] 是否达到 [统计显著差异] 的方法:

  • 置信区间法:如果 95% Confidence Interval of Mean Difference 不包括0 ,表示两组平均数差距 达到统计显著差异。如果包括0 ,表示两组平均数差距 没有 达到统计显著差异。

  • P 值检验法:如果 t value 所对应的 Sig.(显着性, P ) ≦ 0.05 ,表示两组平均数差距 达到统计显著差异。如果 > 0.05,表示两组平均数差距 没有 达到统计显著差异。

2 配对样本t检验(Paired Samples Test)

使用数据:pairtest.sav

2.1 目的

检验 同一群人前后两次 测验成绩的 平均数, 有无呈现统计上的显著差异。

2.2 基本概念

Figure 11 (Python绘图)

Figure 11: 基本概念-配对样本t检验

2.3 分析变量

同一群人: t1(第一次测验成绩)(数字变量) t2(第二次测验成绩)(数字变量)

2.4 SPSS操作

Analyze -> Compare Means -> Paired Samples T Test

Figure 12

Figure 12: 配对样本t检验操作-1

在 弹出的 Paired Samples T Test 窗口, 将 t1 与 t2 两个变量(皆为连续变量),自左边方框移到右边 Paired Variables 方框;然后点击 OK

Figure 13

Figure 13: 配对样本t检验操作-2

2.5 报表解读

首先观察 Paired Samples Statistics 报表,如 Figure 14 告诉我们 t1(前测成绩),t2(后测成绩)的样本数(n)、平均数(Mean)与标准差(Std. Deviation)。

Figure 14: 配对样本t检验输出结果-1

其次检视 Paired Samples Test 报表的 Paired Differences,如 Figure 15

报表显示,t1-t2的 平均数差异= -1.6 (76.5-78.1), t= -1.986, 对应的 Sig. = 0.078 > 0.05。 另外,95% Confidence Interval of the Difference 的置信区间范围 包括0 [-3.42, 0.22]

两种方法皆指向同样的结论, 即:我们在样本中所观察到 t1, t2的平均数差距, 如果推论到总体,在95%的置信水平下,此一差距 并没有 达到统计上的显著差异。

Figure 15: 配对样本t检验输出结果-2
Note

★ 检验 [前後測平均数差距] 是否达到 [统计显著差异] 的方法:

  • 置信区间法:如果 95% Confidence Interval of Mean Difference 不包括0 ,表示前後測平均数差距 达到统计显著差异。如果包括0 ,表示前後測平均数差距 没有 达到统计显著差异。

  • P 值检验法:如果 t value 所对应的 Sig.(显着性, P ) ≦ 0.05 ,表示前後測平均数差距 达到统计显著差异。如果 > 0.05,表示前後測平均数差距 没有 达到统计显著差异。

3 单因子方差分析(One way ANOVA)

使用数据:TCS2015sc_Ch11.sav

3.1 目的

检验三组(含)以上样本的平均数,两两比较,是否呈现统计上的显著差异。

3.2 基本概念

Figure 16 (Python绘图)

Figure 16: 基本概念-单因子方差分析

3.3 分析变量

自变量(三分类以上类别变量)(例如: [age5] 年龄五分类)

因变量(数字变量)(例如: [smuse_min_day] 每天使用社交媒体的时间-分钟数)

3.4 SPSS操作

Analyze -> Compare Means -> One-Way ANOVA

Figure 17

Figure 17: 单因子方差分析操作-1

在 弹出的 One-Way ANOVA 窗口,将 每天使用社交媒体的时间-分钟 [smuse_min_day ](连续变量)自左边方框移到右边的 Dependent List, 将 年龄五分类 [age5] 自左边方框移到右边 Factor 方框;然后点击 Options

Figure 18

Figure 18: 单因子方差分析操作-2

在弹出的 One-Way ANOVA: Options 窗口,分别点选 Descriptive, Homogeneity of variance test, 以及Means plot,然后点击 Continue

Figure 19

Figure 19: 单因子方差分析操作-3

回到 One-Way ANOVA 窗口,点击 Post Hoc 方框,

Figure 20

Figure 20: 单因子方差分析操作-4

在弹出的 One Way ANOVA: Post Hoc Multiple Comparisons 窗口的 Equal Variance Assumed 点选 ScheffeEqual Variance Not Assumed 点选 Dunnett’s T3 然后点击 Continue

Figure 21

Figure 21: 单因子方差分析操作-5

回到 One Way ANOVA 窗口,按 OK

Figure 22

Figure 22: 单因子方差分析操作-6

3.5 报表解读

首先观察 Descriptive 摘要表。如 Figure 23

该表呈现自变量各类别在因变量的样本数、平均数、标准差等数据。

Figure 23: 单因子方差分析输出结果-1

其次,观察自变量(age5)在因变量(smuse_min_day)的 means plos。如 Figure 24

该图显示,年龄愈大,每天使用社交媒体的时间,就愈少。

Figure 24: 单因子方差分析输出结果-2

第三,观察 ANOVA 摘要报表。如 Figure 25

F=28.696, 其所对应的Sig. < 0.001, 代表至少有两组的平均数呈现显著差异。(如果F值所对应的Sig.(显着性, P ) > 0.05, 表示任何兩组平均数差距都未呈現显著差异)

Figure 25: 单因子方差分析输出结果-3

至于是哪两组?需要透过事后多重比较检验才可得知,一般可使用 Scheffe法(当方差相等时使用)与 Dunnett T3 法(当方差不相等时使用)。我们可以透过 Levene test 来检验方差是否相等。

第四,观察 Test of Homogrneity of Variances 摘要报表(方差同质性或方差等分散性)。如 Figure 26

Figure 26: 单因子方差分析输出结果-4

报表显示, Levene Statistics (Based on Mean) = 31.505, 其对应的 Sig. < 0.001 , 代表方差非呈等分散(或称方差不同质、方差不相等) ,此时研究者应使用 Dunnett T3 检验法进行事后比较。

如果 Levene Statistics (Based on Mean) 其所对应的 Sig. > 0.05 , 则代表方差呈等分散(或称方差同质,或称方差相等),此时研究者应使用 Scheffe 检验法进行事后比较。

最后,观察 Multiple Comparisons (事后多重比较)摘要报表。如 Figure 27

Figure 27: 单因子方差分析输出结果-5

Multiple Comparisons 报表显示,

Dunnett T3 检验法来看, 1829与3039 这两组的平均数差距(Mean Difference)=30.99, 此一差距在95%置信水平下,有达到统计上的显著差异(Sig.=0.010 < 0.05; 置信区间[4.75, 57.23]没有包括0)。 达到显著差异的组别,SPSS会在平均数差异的数据右上方,显示 *。

本例,Dunnett T3 与 Scheffe 两种事后比较检验法, 所得到的结论基本上并没有非常大的差异,大部分都一致; 但在 [4049 vs 5059], [4049 vs 60及以上],这两组,却呈现 不一样 的结论。

Dunnett T3检验法来说,[4049 vs 5059] 及 [4049 vs 60及以上] 的平均数差距是 达到统计显著差异的

但就 Scheffe 检验法来说,[4049 vs 5059] 及 [4049 vs 60及以上] 的平均数差距是 没有 达到统计显著差异的

这是因为 Scheffe 法的置信区间比较 ,比较不容易达到统计上的显著差异。

说明如下:

  • [4040 vs 5059]

Dunnett T3 : 平均数差距=18.19, 95%置信区间=[0.88, 35.51]=34.63(较窄),区间没有包括0,有显著差异。

Scheffe : 平均数差距=18.19, 95%置信区间=[-13.68, 50.08]=63.76(较宽),区间包括0,没有显著差异。

  • [4049 vs 60及以上]

Dunnett T3:平均数差距=23.82 95%置信区间= [4.68, 42.96 ] = 38.28(较窄),区间没有包括0,有显著差异。

Scheffe:平均数差距=23.82, 95%置信区间= [-17.81, 65.45 ] = 83.26(较宽),区间包括0,没有显著差异。

以上分析得知:

  • 只要Scheffe 检验法得出平均数有显著差异的组别,用 Dunnett T3 检验法也必然会得到相同结论;

  • 但用 Dunnett T3 检验方法得到平均数有显著差异的组别, 用Scheffe 法则未必;

Note

ANOVA摘要表中,如果F值所对应的Sig.(显着性, P ) > 0.05, 表示任何兩组平均数差距都未呈現显著差异。如果F值所对应的Sig.(显着性, P ) ≦ 0.05, 表示至少有兩组的平均数差距,呈現显著差异。

Test of Homogeneity of Variances 摘要表中如果 Levene Statistic 数值 所对应的Sig.(显著性, P ) > 0.05(方差等分散),我们可以使用 Scheffe检验法,观察到底是哪兩组的平均数差距呈現显著差异。如果 Levene Statistic 数值 所对应的Sig.(显着性, P ) ≦ 0.05(方差不等分散),我们可以使用 Dunnett T3 检验法,观察到底是哪兩组的平均数差距呈現显著差异。

★ 如果没有任何关于方差是否等分散的资讯,我們一般都会使用Scheffe 法进行事后多重比较。因为Scheffe检验法最严格,也最稳健。

SPSS 操作

平均数差异分析SPSS操作示例

附记

阅读本讲讲义,另请参阅:

王晓华、郭良文(2022)[1] 第十一章 (量化资料分析-数字会说话), 页216-224。

样本统计量的计算公式(参考)1

独立样本T检验

\(\bar{X}_1\):第一组样本的平均数

\(\bar{X}_2\):第二组样本的平均数

\({s_1^2}\):第一组样本的方差

\({s_2^2}\):第二组样本的方差

\({n_1}\):第一组样本大小

\({n_2}\):第二组样本大小

★ 假设两组方差不相等(Not Equal Variances)

在比较两组独立样本均值时,若假设方差不相等,应使用 Welch’s t 检验。其计算公式如下:

  1. 标准误(Standard Error, s.e)

\[ SE = \sqrt{ \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} } \]

  1. t 值计算公式(t-value)

\[ t = \frac{\bar{X}_1 - \bar{X}_2}{SE} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{ \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} }} \]

  1. 自由度(Degrees of Freedom, df)

\[ df = \frac{ \left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2 }{ \frac{ \left( \frac{s_1^2}{n_1} \right)^2 }{n_1 - 1} + \frac{ \left( \frac{s_2^2}{n_2} \right)^2 }{n_2 - 1} } \]

  1. p 值计算公式(p-value)(双尾检验)

\[ p = 2 \cdot P(T_{df} > |t|) \]

其中 \(T_{df}\) 表示自由度为 dft 分布,p 值表示观察到的 t 值在该分布下的双尾概率。

  1. 信赖区间/置信区间(双尾)(95% Confidence Interval, CI)

\[ CI = (\bar{X}_1 - \bar{X}_2) \pm t_{(df, 0.975)} \cdot SE \]

例如 Figure 10 中的数据:

Welch’s t 检验

  1. 标准误(Standard Error)

\[ SE = \sqrt{ \frac{112.74^2}{655} + \frac{110.21^2}{640} } = 6.1954 \]

  1. t 值计算(t-value)

\[ t = \frac{91.13 - 104.11}{6.1954} = -2.0951 ,绝对值2.0951 > 临界值1.96\\(有显著差异) \]

t分布临界值(双尾, 95%CI) : 1.96

  1. 自由度(df)(Welch 方法)

\[ df = \frac{ \left( \frac{112.74^2}{655} + \frac{110.21^2}{640} \right)^2 }{ \frac{ \left( \frac{112.74^2}{655} \right)^2 }{654} + \frac{ \left( \frac{110.21^2}{640} \right)^2 }{639} } = 1293.00 \]

  1. p 值计算公式(p-value)

\[ p = 2 \cdot P(T_{1293} > |{-2.0951}|) = 0.0364 < 0.05\\(有显著差异) \]

  1. 95% 信赖区间/置信区间(双尾)(95% Confidence Interval, CI)

\[ CI = (91.13 - 104.11) \pm t_{(1293, 0.975)} \cdot 6.1954 = -12.98 \pm 1.962 \cdot 6.1954 \]

\[ CI = [-25.1342,\ -0.8258]\\(区间不包含0, 有显著差异) \]

★ 假设两组方差相等(Equal Variances)

在比较两组独立样本均值时,若假设方差相等,則应使用 student’s t 检验。其计算公式如下:

  1. Sp (合并标准差)

\[ S_p = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}} \]

  1. t 值计算公式(t-value)

\[ t = \frac{(\bar{X}_1 - \bar{X}_2)}{S_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \]

  1. 自由度(Degrees of Freedom, df)

\[ df = n_1 + n_2 - 2 \]

  1. p 值计算公式(p-value)(双尾检验)

\[ p = 2 \cdot P(T_{df} > |t|) \]

其中 \(T_{df}\) 表示自由度为 dft 分布,p 值表示观察到的 t 值在该分布下的双尾概率。

  1. 信赖区间/置信区间(双尾)(95% Confidence Interval, CI)

\[ CI = (\bar{X}_1 - \bar{X}_2) \pm t_{(df, 0.975)} \cdot SE \]

配对样本T检验

\(\bar{X}_{pre}\):前测样本的平均数

\(\bar{X}_{post}\):后测样本的平均数

\({s_{pre}^2}\):前测样本的方差

\({s_{post}^2}\):后测样本的方差

\({s_{pre}}\):前测样本的标准差

\({s_{post}}\):后测样本的标准差

\({n_{pre}}\):前测样本大小

\({n_{post}}\):后测样本大小

在配对样本 t 检验中,

  1. 差值平均数

\[ \bar{D} = \bar{X}_{post} - \bar{X}_{pre} \]

2a. 标准误(1):如果已知差值的方差 \({s_D}\),则:

\[ SE = \frac{s_D}{\sqrt{n_{pre}}} \]

2b. 标准误(2):如果不知差值的方差 \({s_D}\),改用近似估计

\[ SE \approx \sqrt{ \frac{s_{pre}^2 + s_{post}^2}{n} } \]

  1. t 值

\[ t = \frac{\bar{X}_{post} - \bar{X}_{pre}}{SE} \]

  1. 自由度

\[ df = n_{pre} - 1 \]

  1. p 值

\[ p = 2 \cdot P(T_{df} > |t|) \]

  1. 95% 置信区间

\[ CI = (\bar{X}_{post} - \bar{X}_{pre}) \pm t_{(df, 0.975)} \cdot SE \]

例如,Figure 15 中的数据:

  • 前測平均数:\(\bar{X}_{pre} = 76.5\),标准差 \(s_{pre} = 9.44\),标准误 \(SE_{pre} = 2.98\),样本数 \(n_{pre} = 10\)

  • 後測平均数:\(\bar{X}_{post} = 78.1\),标准差 \(s_{post} = 7.09\),标准误 \(SE_{post} = 2.24\),样本数 \(n_{post} = 10\)

  • 差值平均数(前测− 后测):\(\bar{D} = \bar{X}_{pre} - \bar{X}_{post} = -1.6\)

  • 差值标准误(已提供):\(SE = 0.80554\)

  1. t value

\[ t = \frac{\bar{X}_{pre} - \bar{X}_{post}}{SE} = \frac{-1.6}{0.80554} = -1.986 绝对值1.986 < 临界值2.26\\(无显著差异) \]

t分布临界值(双尾, 95%CI)

  1. 自由度

\[ df = n - 1 = 10 - 1 = 9 \]

  1. p value(双尾)

\[ p = 2 \cdot P(T_9 > |{-1.986}|) = 0.078 > 0.05\\(无显著差异)。 \]

  1. 95% 置信区间(双尾)

查表得 \(t_{(9, 0.975)} = 2.262\)

\[ 因此:CI = -1.6 \pm 2.262 \cdot 0.80554 = [-3.422,\ 0.222]\\ (区间包含0,无显著差异) \]

单因子方差分析

数据如 Figure 23 所示:

組1:\(\bar{X}_1\) = 137.19, \({s_1}\) = 134.67, \({n_1}\) = 383

組2:\(\bar{X}_2\) = 106.19, \({s_2}\) = 122.42, \({n_2}\) = 374

組3:\(\bar{X}_3\) = 72.70, \({s_3}\) = 74.57, \({n_3}\) = 283

組4:\(\bar{X}_4\) = 54.51, \({s_4}\) = 56.24, \({n_3}\) = 173

組5:\(\bar{X}_5\) = 48.88, \({s_5}\)= 46.09, \({n_5}\) = 81

Total: \(\bar{X}_{grand}\) = 97.54, \(s\) = 111.64, \(n\) = 1295

\(\bar{X}_1\):第一组样本的平均数; \({s_1}\):第一组样本的标准差; \({n_1}\):第一组样本大小

\(\bar{X}_2\):第二组样本的平均数; \({s_2^2}\):第二组样本的方差; \({n_2}\):第二组样本大小

\(\bar{X}_3\):第三组样本的平均数; \({s_3^2}\):第三组样本的方差; \({n_3}\):第三组样本大小

\(\bar{X}_4\):第四组样本的平均数; \({s_4^2}\):第二四样本的方差; \({n_4}\):第四组样本大小

\(\bar{X}_5\):第五组样本的平均数; \({s_5^2}\):第五组样本的方差; \({n_5}\):第五组样本大小

\(\bar{X}_{grand}\):总平均数; \(s\) : 总方差; \(n\) : 总样本数

  1. 组间方差(Sum of Square Between groups, SSB)

\[ SSB = \sum_{i=1}^{5} n_i (\bar{X}_i - \bar{X}_{\text{grand}})^2 = 1328173.4 \]

  1. 组内方差(Sum of Square Within groups, SSW)

\[ SSW = \sum_{i=1}^{5} (n_i - 1) \cdot s_i^2 = 14787145.5 \]

  1. 自由度 (degree of freedom, df)

\[ df_B = 5 - 1 = 4,\quad df_W = 1295 - 5 - 1 = 1289 \]

  1. Mean Square of Between Groups(MSB)

\[ MSB = \frac{SSB}{df_B} = \frac{1328173.4}{4} = 332043.4 \]

  1. Mean Square of Within Groups(MSE)

\[ MSW = \frac{SSW}{df_W} = \frac{14787145.5}{1289} = 11471.9 \]

  1. F value

\[ F = \frac{MSB}{MSW} = \frac{332043.4}{11471.9} \approx 28.93 \]

(在 \({df_B=4}\) , \({df_W=1289}\)的情况,以及 95%置信水平 的设定下,F 分布的临界值 = 2.379)。

现 F = 28.96, 远大于临界值 2.379, 表示至少有两组平均数差距呈现显著差异。

  1. P value

\[ p =0.000 < 0.001 \]

假设任何两组的平均数差距皆无显著差异(原假设:\(H_0\)), 则得到 F= 28.96的概率, 几乎等于0 。

由于概率如此之低,所以我们拒绝原假设\(H_0\), 进一步接受替代假设\(H_1\)(即:至少有两组的平均数差距呈现显著差异)。

1 这个仅供参考用,适合想进一步了解统计学的学习者

References

[1]
王晓华, 郭良文. 传播学研究方法[M]. 北京: 高等教育出版社, 2022.