Quan sát dữ liệu doanh thu của 2 năm 2013, 2014
library(ggplot2)
par(mfrow=c(2,2))
# 2013
plot(density(v1),main = "Chua Logarit")
v11 <- log(v1)
plot(density(v11),main = "Co Logarit",frame = FALSE)
polygon(density(v11), col = "steelblue")
#2014
plot(density(v2),main = "Chua Logarit")
v21 <- log(v2)
plot(density(v21),main = "Co Logarit",frame = FALSE)
polygon(density(v11), col = "steelblue")
Chúng ta quan tâm xem liệu phân bố của 2013 có khác với 2014 không hoặc Trung bình của 2013 có khác Trung bình của 2014 không với dữ liệu của hai mẫu trên chúng ta cần thực hiện một phép kiểm định. Do số quan sát của 2 năm tương đối lớn nên có thể sử dụng kiểm định T-Student:
##
## Two Sample t-test
##
## data: kqkd1 by nam
## t = 0.57447, df = 14450, p-value = 0.5657
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -1111.663 2033.413
## sample estimates:
## mean in group 2013 mean in group 2014
## 5864.394 5403.519
##
## Two Sample t-test
##
## data: kqkd1 by nam
## t = -1.323, df = 14708, p-value = 0.1859
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -3694.7415 717.0517
## sample estimates:
## mean in group 2013 mean in group 2015
## 5864.394 7353.239
Giá trị P = 0.5657> 0.05 là khá lớn không đủ cơ sở bác bỏ giả thiết H0 chưa thể khảng định Trung bình doanh thu của năm 2013 khác với trung bình doanh thu năm 2014. Điều này chứng tỏ doanh thu hai năm có hiện tượng tự tương quan với nhau.
Ở phép kiểm định T-Student cho hai mẫu thứ 2 ta cũng có kết quả P = 0.1859 kết quả này cũng không bác bỏ giả thiết H0 được như vậy tổng thể không có sự thay đổi trong 3 năm điều này phù hợp với quan sát phân bố hình dáng của hai đường cong mật độ cũng không khác nhau