问题意识
当我们想要比较不同类别的群体(例如:不同教育水平)在特定类别(例如:感到生活不快乐)的百分比分布状况时,经常会使用交叉分析。如果进一步要比较两个类别变量(例如:教育水平与生活快乐感)之间是否有呈现统计上的显著差异, 则会使用卡方检验 (Chi-Square Test)进行检验。交叉分析与卡方检验适用于类别变量(因子变量)之间的关系分析。
本讲将介绍如何在SPSS中进行交叉分析与卡方检验。分为两种呈现方式:
- 自变量在 行(row) ,因变量在 列(column)
- 自变量在 列(column) ,因变量在 行(row)
使用数据:TCS2015sc_Ch11.sav
1 自变量(例如:edu5)放在row(行), 因变量(例如;V1.5r)放在column(列)
1.1 呈现频数
选择菜单栏:Analyze-->Descriptive Statistics-->Crosstabs
在弹出的 Crosstabs 窗口, 将教育五分类[edu5]变量(自变量),自左边方框移到右边 Rows 方框;将快乐三分类[V1.5r]变量(因变量),自左边方框移到右边 Columns 方框。然后点击 OK 按钮。
输出结果如下:
这个结果只有频数,无法直接比较不同教育程度在快乐感的比例分布状况,还需要加上百分比。
1.2 呈现频数+百分比
黄金标准:呈现以自变量所在位置为基础所计算的百分比。
如果你将自变量设置在 行 (row),则应设置呈现 row %。 在 Crosstabs 窗口,设置好分析变量后,鼠标点击 Cells
在弹出的 Crosstabs: Cell Display 窗口,勾选 Row percentages 选项,然后点击 Continue 按钮。
回到 Crosstabs 窗口,点击 OK 按钮。
输出结果如下:
和全体相较,
初中 教育程度 似乎有较高 的 不快乐 比例 (19.2 % vs .12.7%)
初中 教育程度 似乎有较低 的 快乐 比例 (78.1 % vs.84.5%)
小学及以下 教育程度 似乎有较低 的 无法选择 比例(1.4 % vs. 2.8%)
本科及以上 教育程度 似乎有较低 的 不快乐 比例(10.6 % vs. 12.7%)
本科及以上 教育程度 似乎有较高 的 无法选择 比例(3.6 % vs. 2.8%)
这里说 似乎 是因为这只是我们从样本中所观察到的现象, 如果要观察样本中所观察到的现象能否推论到总体,我们必须进一步进行 卡方检验 (Chi-Square Test)分析。
1.3 呈现频数+百分比+卡方检验
在 Crosstabs 窗口,点选 Statistics
在弹出的 Crosstabs: Statistics 窗口,勾选 Chi-square 选项,然后点击 Continue 按钮。
回到 Crosstabs 窗口,点击 OK 按钮。
输出结果如下:
卡方检验显示,Pearson Chi-Suare 的值=15.320,df=8, Asymp. Sig.=0053 (P=0.053),约略等于0.05。 此一结果表示,如果从样本推论总体,因变量(V1.5r)确实会因为自变量(edu5)的不同水准,呈现显著差异
注:
P ≦ 0.05 => 有显著差异; P > 0.05 => 没有显著差异
1.4 呈现频数+百分比+卡方检验+调整后标准化残差
如果有显著差异,进一步要问的问题是,到底是在哪些 细格(Cell) 呈现显著差异呢?
我们需要进一步透过 调整后的标准化残差 (Adj. Std. Residuals, ASR) 这个指标,来做判断。
判断准则是:
=>该细格即为显著差异之所在(细格内的百分比显著高于或低于某一类目在全体的比例)。
=>该细格无显著差异(细格内的百分比贴近某一类目全体的比例)。
如何呈现这个 调整后标准化残差(ASR)呢?
在 Crosstabs 窗口,点击 Cell 按钮。
在弹出的 Crosstabs: Cell Display 窗口,勾选 Residuals 框内的 Adjusted standardized 选项,然后点击 Continue 按钮。
回到 Crosstabs 窗口,点击 OK 按钮。
输出结果如下:
根据 调整后标准化残差(ASR) 的判断准则,我们可以发现:
- 初中 教育程度在 不快乐 细格的 ASR= +3.1,绝对值 > 1.96 => 该细格的百分比 (19.2 %) 显著高于全体 (12.7 %)(ASR的 ” + ” 代表高于全体)
- 初中 教育程度在 快乐 细格的 ASR= -2.8,绝对值 > 1.96 => 该细格的百分比 (78.1 %) 显著低于全体 (84.5 %)( ASR的” - ” 代表低于全体)
- 本科及以上 教育程度在 不快乐 细格的 ASR= -2.1,绝对值 > 1.96 => 该细格的百分比 (10.6 %) 显著低于全体 (12.7 %)( ASR 的” - ” 代表低于全体)
综上所述,如果从样本推论到总体,真正的显著差异,只发生在;
- 初中 教育程度者,有较高 的 不快乐 比例(ASR=+3.1)。
- 初中 教育程度者,有较低 的 快乐 比例(ASR= -2.8)。
- 本科及以上 教育程度者,有较低的 不快乐 比例(ASR= -2.1)。
我们可以将交叉分析的结果(只根据样本 vs. 从样本推论总体) 整理如下表:
我们可以用一些符号,将有显著差异的结果(▲:显著高于,▼:显著低于),用人工方式直接标示在交叉分析表格中,方便阅读与理解。
2 自变量(例如:edu5)放在 column(列),因变量(例如;V1.5r)放在 row(行)
2.1 呈现频数+百分比+卡方检验+调整后标准化残差
Analyze-->Descriptive Statistics-->Crosstabs
在弹出的 Crosstabs 窗口, 将教育五分类[edu5]变量(自变量),自左边方框移到右边 Columns 方框;将快乐三分类[V1.5r]变量(因变量),自左边方框移到右边 Rows 方框。然后点击 Cells 按钮。
在弹出的 Crosstabs: Cell Display 窗口,勾选 Column percentages 选项,再勾选 Residuals 框内的 Adjusted standardized 选项,然后点击 Continue 按钮。
回到 Crosstabs 窗口,点击 Statistics 按钮。
在弹出的 Crosstabs: Statistics 窗口,勾选 Chi-square 选项,然后点击 Continue 按钮。
回到 Crosstabs 窗口,点击 OK 按钮。
输出结果如下:
可以根据前述的分析步骤与判断准则,得到一样的分析结果。
附记
阅读本讲讲义,另请参阅:
王晓华、郭良文(2022)[1] 第十一章 (量化资料分析-数字会说话), 页212-216。