Thong ke suy dien

ATPSdata <- (AirTrafficPassengerStatistics) head(ATPSdata,3) str(ATPSdata) Newdata <- subset(ATPSdata, GEO.Region == 'Asia') head(Newdata,3) Newdata<- New_data[c("Operating.Airline.IATA.Code","Price.Category.Code","Activity.Type.Code","Passenger.Count","Year","Month")]

Hoi quy tuyen tinh da bien

Y=B0+B1.X1 + B2.X2 +....+ Bn.Xn + epsilon

Trong do Y là bien phu thuoc Adjusted.Passenger.Count

Tất cả các biến còn lại là biến độc lập

Mô Hình 1

Model1 <- lm(Passenger.Count~Operating.Airline.IATA.Code+Price.Category.Code+Activity.Type.Code+Year+Month,Newdata) summary(Model_1)

Kiểm định các hệ số Bi

H0: B1=0 (Y không phụ thuộc vào X1)

H1: B1 kh?c 0 (Y phụ thuộc vào X1)

C?ch 1: p~value ( Pr(>|t|)) > mức ý nghia 5%, chưa bác bỏ H0 => B1=0 => X1 ko ảnh hưởng Y

p~value (Pr(>|t|))< mức ý nghia 5%, chưa bác bỏ H0 => B1=! 0 => X1 có ảnh hưởng Y

Cách 2: t~value: thống kê kiểm định

RR=(-vc, -talpha/2, n-k-1) U (talpha/2, n-k-1; +vc )=(-v; -1.961642) U (1.961642; +vc )

talpha/2, n-k-1 = t0.025, 1415 =

qt(p=0.025, df=3267, lower.tail=FALSE)# ngu???ng 2 ph?a

U???c lu???ng (Estimate) | Sai s??? chu???n (Std. Error)| Th???ng k? ki???m d???nh (t value) | Gi? tr??? p (Pr(>|t|)) |

t value=Estimate/Std. Error

N???i dung: Ki???m d???nh du???ng h???i quy

H0: B1=B2=0 (R^2=0) => pt ko c? ? nghia (ko th?ch h???p)

H1: t???n t???i Bi kh?c 0 => pt c? ? nghia ( th?ch h???p)

F-statistic: 1684

RR= (Falpha;k;n-k-1; +vc)= (F0.05;5;3267;+vc)

qf(p=0.05, df1=5, df2= 3267, lower.tail=FALSE)

??y l? h??? s??? x?c d???nh (R?) c???a m? h?nh h???i quy tuy???n t?nh. N? do lu???ng t??? l??? bi???n thi?n c???a bi???n ph??? thu???c (AdjustedPassengerCount) du???c gi???i th?ch b???i c?c bi???n d???c l???p (Month v? Year) trong m? h?nh.

??y l? h??? s??? x?c d???nh di???u ch???nh (Adjusted R?). N? di???u ch???nh gi? tr??? R? d??? ph???n ?nh s??? lu???ng bi???n d???c l???p trong m? h?nh v? k?ch thu???c m???u. Adjusted R? thu???ng du???c s??? d???ng d??? so s?nh c?c m? h?nh v???i s??? lu???ng bi???n d???c l???p kh?c nhau.

(R?) thu???c kho???ng t??? 0 d???n 1

Residual standard error: sai s??? chu???n du???ng h???i quy ( l? sicma)

s=\sqrt(SSE/(n-k-1))

Residuals: sai s??? ng???u nhi?n, sai s??? h???i quy (epsilon_i=Y-Y^)

B??? Month,Price.Category.Code do Pr l???n hon 0.05

M? H?nh 2

Model2 <-lm(Passenger.Count~Operating.Airline.IATA.Code+Activity.Type.Code+Year,Newdata) summary(Model_2)

=> R^2 hi???u ch???nh tang l?n n?n m? h?nh t???t hon, ph? h???p hon

anova(Model1, Model2) par(mfrow=c(2,2)) plot(Model2) library(car) vif(Model2) X <- data.frame( Operating.Airline.IATA.Code = "CA", Activity.Type.Code = "Enplaned", Year = 2015 ) predict(Model_2, X, interval = "confidence", level = 0.98 )