## 该程序对数据进行方差分析
## 加载所需要的包
library(readr)
## 读取数据
AQIdata <- read_csv("License number.csv")
## Parsed with column specification:
## cols(
## Date = col_character(),
## `Days of week` = col_character(),
## `Restricted liscense number` = col_character(),
## AQI = col_integer()
## )
names(AQIdata) <- c("date","week","Rln","AQI")
## 首先对数据是查看星期和限行方式
table(AQIdata$week)
##
## Friday Monday Saturday Sunday Thursday Tuesday Wednesday
## 165 166 165 165 165 166 165
table(AQIdata$Rln)
##
## 1, 6 2, 7 3, 8 4, 9 5, 0
## 166 166 165 165 165
table(AQIdata$week,AQIdata$Rln)
##
## 1, 6 2, 7 3, 8 4, 9 5, 0
## Friday 31 26 26 39 43
## Monday 44 31 26 26 39
## Saturday 0 0 0 0 0
## Sunday 0 0 0 0 0
## Thursday 26 26 39 43 31
## Tuesday 39 44 31 26 26
## Wednesday 26 39 43 31 26
# 从上面的结果可以看出,星期几和限行方式并不是一一对应的
## 对比限行和不限行的差异
AQIdata$group1 <- ifelse(is.na(AQIdata$Rln),"不限行","限行")
AQIdata$group1 <- factor(AQIdata$group1)
## 方差齐性检验
bartlett.test(AQI~group1,data = AQIdata)
##
## Bartlett test of homogeneity of variances
##
## data: AQI by group1
## Bartlett's K-squared = 2.0352, df = 1, p-value = 0.1537
## p-value = 0.1537 >0.05,所以接受元假设,认为各组方差相等,可以进行方差分析
## 方差分析
aovyn <- aov(AQI~group1,data = AQIdata)
summary(aovyn)
## Df Sum Sq Mean Sq F value Pr(>F)
## group1 1 9901 9901 1.635 0.201
## Residuals 1155 6995983 6057
## 我们可以看到方差分析结果表,p值 = 0.201 >0.05,不能拒绝元假设,认为两种方式是没有差异的。
## 使用盒形图查看
par(family = "STKaiti")
plot(AQIdata$AQI~AQIdata$group1,xlab = "是否限行",ylab = "AQI",
main = "是否限行的AQI")

## 分析不同限号组合以及没有限号的方差分析
AQIdata$Rln[is.na(AQIdata$Rln)] <- "不限行"
table(AQIdata$Rln)
##
## 1, 6 2, 7 3, 8 4, 9 5, 0 不限行
## 166 166 165 165 165 330
AQIdata$Rln <- factor(AQIdata$Rln)
## 方差齐性检验
bartlett.test(AQI~Rln,data = AQIdata)
##
## Bartlett test of homogeneity of variances
##
## data: AQI by Rln
## Bartlett's K-squared = 3.4899, df = 5, p-value = 0.6249
## p-value = 0.6249 >0.05,所以接受元假设,认为各组方差相等,可以进行方差分析
## 方差分析
aovRln <- aov(AQI~Rln,data = AQIdata)
summary(aovRln)
## Df Sum Sq Mean Sq F value Pr(>F)
## Rln 5 17506 3501 0.577 0.718
## Residuals 1151 6988378 6072
## 我们可以看到方差分析结果表,p值 = 0.718 >0.05,不能拒绝元假设,
## 认为各种限行方式以及不限行是没有差异的。
## 使用盒形图查看
par(family = "STKaiti")
plot(AQIdata$AQI~AQIdata$Rln,xlab = "限行方式",ylab = "AQI",
main = "限行方式的AQI")

## 从图示也可以看出,均值几乎是一样的,是否限行以及限行方式效果相同