问题意识
在拿到一个数据后,研究者通常会先做描述统计 (Descriptive Statistics), 以了解数据的基本情况。 描述统计通常包括:类别变量的描述统计与数字变量的描述统计两大类。我们通常如何进行这些描述统计呢?此处以 Figure 1 做个整理:
使用数据:TCS2015sc_Ch11.sav
1 类别变量(定类、定序变量)的描述统计
1.1 单选题频数分布
我们先来看一个单选题的频数分布。 例如,TCS2015sc_Ch11.sav数据档中, V1.1变量(整体而言,你对你的生活满不满意意?)的频数分布。 这个问题的变量名称为 V1.1, 其变量值为: 1= “非常不满意”, 2= “不满意”, 3= “满意”, 4= “非常满意”。
SPSS的菜单操作如下:
Analyze-> Descriptive Statistics -> Frequencies
在Frequencies
窗口,將V1.1变量(整体而言,你对你的生活满不满意)從左边方框移到右边的Variable(s)
方框,然後点击 OK
。
输出结果如下:
1.2 多选题频数分布
我们再来看一个多选题的频数分布。
1.2.1 先做多选题的集合
Analyze-->Multiple Response--->Define Variable Sets
将I3.1~I3.88共15题,从 左边 Set Definition
方框移到右边 Variables in Set
方框。 这15题的题目与选项分别是:
I3.1哪一项是当前最重要的问题?(经济) (1, 0)
I3.2哪一项是当前最重要的问题?(两岸关系) (1, 0)
I3.3哪一项是当前最重要的问题?(教育) (1, 0)
I3.4哪一项是当前最重要的问题?(医疗) (1, 0)
I3.5哪一项是当前最重要的问题?(治安) (1, 0)
I3.6哪一项是当前最重要的问题?(环保) (1, 0)
I3.7哪一项是当前最重要的问题?(司法) (1, 0)
I3.8哪一项是当前最重要的问题?(社会伦理与价值)(1, 0)
I3.9哪一项是当前最重要的问题?(地方建设) (1, 0)
I3.10哪一项是当前最重要的问题?(国家认同) (1, 0)
I3.11哪一项是当前最重要的问题?(食品安全) (1, 0)
I3.12哪一项是当前最重要的问题?(薪资所得) (1, 0)
I3.13哪一项是当前最重要的问题?(水土保持) (1, 0)
I3.14哪一项是当前最重要的问题?(政党对立) (1, 0)
I3.88哪一项是当前最重要的问题?(其他)
“1” 代表受访者有选择该题, “0” 代表受访者没有选择该题
在 Variables Are Coded As
,点选 Dichotomies
前面的圆圈,并在 Counted value
的方框内,输入 1 。
在 Name
方框内,输入多选题集合的变量名称(自行定义,例如:I3m); 在 Label
方框内,输入多选题集合的变量标签(自行定义,例如:哪一项是当前最重要的问题?)
然后点击 Add
,
此时,在最右边的 Multiple Response Sets
方框内, 就会出现刚才自订的多选题集合变量名称。 最后,点击 Close
。
1.2.2 再做多选题的频数分布
接下来,选择:
Analyze -> Multiple Response -> Frequencies
在 Multiple Response Frequencies
窗口, Multiple Response Sets
会呈现刚才我们所做的多选题集合,选中它,然后将其移到右边的 Table(s) for
方框内,最后点击 OK
。
输出结果就会出现在 output
(输出)窗口。
数据分析结果显示, 经济(59.5%)、教育(32.4%)与 食品安全 (44.5%) 是某地民众认为当前最重要的问题。
1.3 类别变量的众数与中位数
我们再来看类别变量的众数与中位数,图示如下:
1.4 频数分布条形图
我们再来看类别变量的频数分布条形图。
1.4.1 方法一
Analyze -> Descriptive Statistics -> Frequencies
在 Frequencies
窗口, 选中V1.1变量(整体而言,你对你的生活满不满意),从左边的方框移到右边 Variables(s)
方框内,并用鼠标点击 Charts
。
在 Frequencies:Charts
窗口的 Chart Type
选项, 点选 Bar charts
前面的圆圈; 在 Chart Values
选项,点选 Percentages
前面的圆圈, 然后点击 Continue
。
返回到 Frequencies
窗口,点击 OK
输出结果就会出现在 output
(输出)窗口。
接下来,使用鼠标在条形图的任一条形停留数秒,会出现 Double click to activate
,请依该指示,用鼠标左键双击条形。
双击条形后,会出现一个 Chart Editor
,找到 Show Data Labels
快捷图标,然后点击该快捷图标。
点击后,会出现一个 Properties
窗口,请移动 卷轴, 找到 Number Format
分页标签,在 Decimal Places
方框内,填入你想要呈现的小数点位数。
如果你想呈现小数点一位数值,就在方框内输入 1; 不想呈现小数点,就在方框内输入 0; 默认是呈现小数点二位数值(2)。 然后点击 Apply
,再点击 Close
最后,修改后的条形图就会呈现如下图。注意,百分比数值已经呈现为小数点一位的样式。
1.4.2 方法二
Graph -> Legacy Dialogs -> Bar
在 Bar Charts
窗口,选择 Simple
图标, 然后在 Data in Chart Are
点选 Summaries for group of cases
前面的圆圈,然后点击 Define
在 Define Simple Bar
窗口, 先将分析变量(例如:V1.1)从左边方框移到右边 Category Axis
方框内,并在 Bars Represent
方框,点选 % of cases
前面的圆圈,最后点击 OK
条形图结果会呈现在 output
(输出)视窗。 可继续双击任一条形,依循前面方法一所讲的步骤,进行图形的编辑(例如,呈现条形图的百方比数值,并设置小数点位数)。
1.5 頻数分布圆饼图
1.5.1 方法一
Analyze -> Descriptive Statistics -> Frequencies
将分析变量(例如:V1.1)从左边的方框移到右边 Variable(s)
方框内,并用鼠标点击 Charts
在 Frequencies:Charts
窗口的 Chart Type
选项,点选 Pie charts
前面的圆圈; 在 Chart Values
选项,点选 Percentages
前面的圆圈, 然后点击 Continue
返回到 Frequencies
窗口,点击 OK
初步的圆饼图,会呈现在SPSS的 Output
窗口。 我们可以进一步编辑。
使用鼠标在园饼图的任一分块(slice)停留数秒,会出现 Double click to activate
, 请依该指示,用鼠标左键双击圆饼分块。
双击圆饼分块后,会出现一个 Chart Editor
,找到 Show Data Labels
快捷图标,然后点击该快捷图标。
点击后,会出现一个 Properties
窗口,请移动 卷轴, 找到 Number Format
分页标签,在 Decimal Places
方框内,填入你想要呈现的小数点位数。
如果你想呈现小数点一位数值,就在方框内输入 1; 不想呈现小数点,就在方框内输入 0; 默认是呈现小数点二位数值(2)。 然后点击 Apply
,再点击 Close
最后,修改后的圆饼图就会呈现如下图。注意,百分比数值已经呈现为小数点一位的样式。
1.5.2 方法二
Graphs -> Legacy Dialogs ->Pie
在 Pie Charts
窗口的 Data in Chart Are
方框内, 点选Summaries for group of cases
前面的圆圈, 然后点击 Define
在 Define Pie
窗口,先将分析变量(例如:V1.1)从左边方框移到右边 Define Slices by
方框内,并在 Slices Represent
方框,点选 % of cases
前面的圆圈, 最后点击 OK
初步圆饼图结果会呈现在 output
(输出)视窗。 可继续双击任一圆饼分块,依循前面所讲的步骤,进行图形的编辑(例如,呈现圆饼图的百方比数值,并设置小数点位数)。
2 数字(连续)变量(定距、定比变量)的描述統計
2.1 频数分布
Analyze -> Descriptive Statistics -> Frequencies
在Frequencies
窗口,將分析变量(例如:G4.2)從左边方框移到右边的 Variable(s)
方框,然後点击 OK
输出结果如下:
2.2 集中趋势与离散趋势
Analyze -> Descriptive Statistics -> Frequencies
在 Frequencies
窗口,将分析变量(例如:G4.2)从左边方框移到右边 Variable(s)
的方框内,并点击 Statistics
在 Frequencies:Statistics
窗口, 全部点选 Central Tendency
(集中趋势)下所有的选项; 全部点选 Dispersion
(离散趋势)下所有的选项; 全部点选 Distribution
下(分布形状)所有的选项; 在 Percentile Value
,点选 Quartiles
(四分位数); 并点选 Cut points for....equal groups
并在方框内填写你想要分割的百分位(例如; 10,代表想要呈现第10,20,30,40,50,60,70,80,90百分位)。 然后点击 Continue
分析结果如下(呈现在 Output窗口)。
注:IQR(Interquartile Range,四分位距)= Q3 - Q1
2.3 直方图
2.3.1 方法一
Analyze -> Descriptive Statistics -> Frequencies
在 Frequencies
窗口, 将分析变量(例如:G4.2)从左边方框移到右边 Variable(s)
方框内,并用鼠标点击 Charts
在 Frequencies: Charts
窗口的 Chart Type
选项, 点选 Histograms
前面的圆圈,并点选 Show normal curve on histogram
(呈现正态分布曲线),然后点击 Continue
返回到 Frequencies
窗口,点击 OK
, 输出结果就会出现在 output
(输出)窗口。
初步的直方图会呈现在Output
窗口。接下来,我们要进一步编修。同样的,将鼠标停留在直方图的任一直方条形上,停留数秒,会出现 Double click to activate
的文字, 请依指示用鼠标左键双击直方条。
双击直方条后,会出现一个 Chart Editor
,找到 Show Data Labels
快捷图标,然后点击该快捷图标。
点击后,会出现一个 Properties
窗口,请移动 卷轴, 找到 Number Format
分页标签,在 Decimal Places
方框内,填入0,表示我们不希望呈现小数点 。然后点击 Apply
,再点击 Close
接着双击X轴数值处(例如: 0 ),会出现一个 Properties
窗口,请找到 Scale
分页标签,在 Major Increment
方框内,输入 0.5 , 表示X轴每隔0.5个单位呈现数值标记(0, 0.5, 1.0, 1.5, 2.0…)。然后点击 Apply
再点击 Close
最后,修改后的直方图就会呈现如下图。注意,X轴数值每隔0.5个单位呈现数值标记,且直方条上已呈现频率数值(无小数点)。
对照看一下课本的直方图(经过编辑修饰)
2.3.2 方法二
Graphs -> Legacy Dialogs -> Histogram
在 Histogram
窗口, 将分析变量(例如:G4.2)从左边方框移到右边 Variable
方框内,然后点击 OK
初步的直方图结果会呈现在 output
(输出)视窗。 后续再根据前面所讲的步骤,进行图形编修即可。
附记
阅读本讲讲义,另请参阅:
王晓华、郭良文(2022)[1] 第十一章 (量化资料分析-数字会说话), 页200-207。