1.数据处理

西站地铁站原始数据示例

##   性别    年龄 背包等级
## 4 女性   45+岁        1
## 5 女性   45+岁        3
## 6 女性 18-45岁        1
## 7 女性 18-45岁        1
## 8 男性 18-45岁        2
## 9 男性 18-45岁        1

南站进站口原始数据示例

##   性别    年龄 背包等级
## 4 女性 18-45岁        1
## 5 男性 18-45岁        3
## 6 男性 18-45岁        1
## 7 女性 18-45岁        3
## 8 女性 18-45岁        3
## 9 男性 18-45岁        0

南站地铁站原始数据示例

##   性别    年龄 背包等级
## 4 女性 18-45岁        4
## 5 女性 18-45岁        3
## 6 男性 18-45岁        3
## 7 女性 18-45岁        1
## 8 男性 18-45岁        3
## 9 女性   45+岁        1

备注:背包等级
level1:无行李
level2:随身小包
level3:大挎包或双肩背包
level4:拉杆箱
level5:多于2件行李

2.数值统计

2.1单变量数值统计

西站地铁站单变量统计

##   性别 Freq
## 1 女性  116
## 2 男性  177
##      年龄 Freq
## 1  0-18岁   31
## 2 18-45岁  217
## 3   45+岁   45
##   背包等级 Freq
## 1        0   74
## 2        1   88
## 3        2   61
## 4        3   57
## 5        4   13

南站进站口单变量统计

##   性别 Freq
## 1 女性 1025
## 2 男性  908
##      年龄 Freq
## 1 18-45岁 1856
## 2   45+岁   77
##   背包等级 Freq
## 1        0  147
## 2        1  133
## 3        2  613
## 4        3  892
## 5        4  148

南站地铁站单变量统计

##   性别 Freq
## 1 女性  142
## 2 男性  135
##      年龄 Freq
## 1  0-18岁   15
## 2 18-45岁  245
## 3   45+岁   17
##   背包等级 Freq
## 1        0   27
## 2        1   54
## 3        2   74
## 4        3  103
## 5        4   19

性别统计

##   性别 Freq
## 1 女性 1283
## 2 男性 1220

背包等级统计

##   背包等级 Freq
## 1        0  248
## 2        1  275
## 3        2  748
## 4        3 1052
## 5        4  180

2.2 交叉变量统计

西站地铁站交叉变量统计

##      背包等级  0  1  2  3  4
## 性别                        
## 女性          21 51 16 20  8
## 男性          53 37 45 37  5
##         背包等级  0  1  2  3  4
## 年龄                           
## 0-18岁           10  6  9  6  0
## 18-45岁          59 66 42 43  7
## 45+岁             5 16 10  8  6
##              背包等级  0  1  2  3  4
## 性别 年龄                           
## 女性 0-18岁            3  5  4  2  0
##      18-45岁          16 34  9 14  5
##      45+岁             2 12  3  4  3
## 男性 0-18岁            7  1  5  4  0
##      18-45岁          43 32 33 29  2
##      45+岁             3  4  7  4  3

南站进站口交叉变量统计

##      背包等级   0   1   2   3   4
## 性别                             
## 女性           82  87 282 503  71
## 男性           65  46 331 389  77
##         背包等级   0   1   2   3   4
## 年龄                                
## 18-45岁          135 133 601 860 127
## 45+岁             12   0  12  32  21
##              背包等级   0   1   2   3   4
## 性别 年龄                                
## 女性 18-45岁           82  87 270 491  59
##      45+岁              0   0  12  12  12
## 男性 18-45岁           53  46 331 369  68
##      45+岁             12   0   0  20   9

南站地铁站交叉变量统计

##      背包等级  0  1  2  3  4
## 性别                        
## 女性          14 42 30 50  6
## 男性          13 12 44 53 13
##         背包等级  0  1  2  3  4
## 年龄                           
## 0-18岁            2  7  2  4  0
## 18-45岁          24 43 70 95 13
## 45+岁             1  4  2  4  6
##              背包等级  0  1  2  3  4
## 性别 年龄                           
## 女性 0-18岁            1  3  1  2  0
##      18-45岁          13 35 27 44  3
##      45+岁             0  4  2  4  3
## 男性 0-18岁            1  4  1  2  0
##      18-45岁          11  8 43 51 10
##      45+岁             1  0  0  0  3

3.绘图

3.1 西站地铁口

3.1.1频率分布

3.1.2人数分布

##              背包等级  0  1  2  3  4
## 性别 年龄                           
## 女性 0-18岁            1  3  1  2  0
##      18-45岁          13 35 27 44  3
##      45+岁             0  4  2  4  3
## 男性 0-18岁            1  4  1  2  0
##      18-45岁          11  8 43 51 10
##      45+岁             1  0  0  0  3

3.2 南站进站口

3.2.1频率分布

3.2.2人数分布

##              背包等级   0   1   2   3   4
## 性别 年龄                                
## 女性 18-45岁           82  87 270 491  59
##      45+岁              0   0  12  12  12
## 男性 18-45岁           53  46 331 369  68
##      45+岁             12   0   0  20   9

3.3 南站地铁内

3.3.1频率分布

3.3.2人数分布

##              背包等级  0  1  2  3  4
## 性别 年龄                           
## 女性 0-18岁            1  3  1  2  0
##      18-45岁          13 35 27 44  3
##      45+岁             0  4  2  4  3
## 男性 0-18岁            1  4  1  2  0
##      18-45岁          11  8 43 51 10
##      45+岁             1  0  0  0  3

4.数据检验:卡方检验

4.1 西站地铁站

## Call: xtabs(formula = ~性别 + 背包等级, data = ws)
## Number of cases in table: 293 
## Number of factors: 2 
## Test for independence of all factors:
##  Chisq = 23.953, df = 4, p-value = 8.163e-05
## Call: xtabs(formula = ~年龄 + 背包等级, data = ws)
## Number of cases in table: 293 
## Number of factors: 2 
## Test for independence of all factors:
##  Chisq = 17.602, df = 8, p-value = 0.02441
##  Chi-squared approximation may be incorrect
## Call: xtabs(formula = ~性别 + 年龄 + 背包等级, data = ws)
## Number of cases in table: 293 
## Number of factors: 3 
## Test for independence of all factors:
##  Chisq = 49.45, df = 22, p-value = 0.0006955
##  Chi-squared approximation may be incorrect

4.2 南站地铁站

## Call: xtabs(formula = ~性别 + 背包等级, data = ss)
## Number of cases in table: 277 
## Number of factors: 2 
## Test for independence of all factors:
##  Chisq = 21.856, df = 4, p-value = 0.0002141
## Call: xtabs(formula = ~年龄 + 背包等级, data = ss)
## Number of cases in table: 277 
## Number of factors: 2 
## Test for independence of all factors:
##  Chisq = 32.9, df = 8, p-value = 6.431e-05
##  Chi-squared approximation may be incorrect
## Call: xtabs(formula = ~性别 + 年龄 + 背包等级, data = ss)
## Number of cases in table: 277 
## Number of factors: 3 
## Test for independence of all factors:
##  Chisq = 65.01, df = 22, p-value = 3.94e-06
##  Chi-squared approximation may be incorrect

4.3 南站进站口

## Call: xtabs(formula = ~性别 + 背包等级, data = se)
## Number of cases in table: 1933 
## Number of factors: 2 
## Test for independence of all factors:
##  Chisq = 26.349, df = 4, p-value = 2.69e-05
## Call: xtabs(formula = ~年龄 + 背包等级, data = se)
## Number of cases in table: 1933 
## Number of factors: 2 
## Test for independence of all factors:
##  Chisq = 59.48, df = 4, p-value = 3.731e-12
## Call: xtabs(formula = ~性别 + 年龄 + 背包等级, data = se)
## Number of cases in table: 1933 
## Number of factors: 3 
## Test for independence of all factors:
##  Chisq = 131.25, df = 13, p-value = 1.179e-21
##  Chi-squared approximation may be incorrect

4.4 结论

结论:同一性别或/和同一年龄内部背包等级都存在明显差异,但西站地铁站同一性别内部的背包 数量差异最明显,建议优先使用性别分析;南站进站口和南站地铁站建议优先使用年龄分析。

应用:男性主要无行李,携带大挎包或双肩背包;女性主要携带随身小包。 青少年主要无行李或携带双肩包,青年主要携带随身小包,老年人主要携带随身小包。 南站进站口和南站地铁站直接看18-45岁人数分布图即可。