Data yang akan dianalisis adalah data konsumsi rokok oleh 51 orang di sebuah negara pada tahun 1970.
library(readxl)
data <- read_excel("D:/Semester5/AnReg/Sales-Age.xlsx")
colnames(data) <- c("x","y")
x = Umur dan y = Sales
model.reg <- lm(y~x, data=data)
summary(model.reg)
##
## Call:
## lm(formula = y ~ x, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -39.090 -17.755 -7.721 5.135 142.108
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 15.011 65.434 0.229 0.820
## x 3.878 2.377 1.631 0.109
##
## Residual standard error: 31.55 on 49 degrees of freedom
## Multiple R-squared: 0.05152, Adjusted R-squared: 0.03217
## F-statistic: 2.662 on 1 and 49 DF, p-value: 0.1092
Model yang didapat adalah: \(Y = 15.228 + 3.871X\)
Interpretasi:
Dugaan rata-rata jumlah bungkus rokok yang dijual berdasarkan jika umur seseorang diketahui = 0 sebesar 15.228 per kapita.
Setiap kenaikan satu satuan umur akan meningkatkan dugaan rataan bungkus rokok yang terjual sebesar 3.871 per kapita.
confint(model.reg, "(Intercept)", 0.95)
## 2.5 % 97.5 %
## (Intercept) -116.4842 146.5069
Diharapkan 95% nilai penduga parameter Intersep berada pada selang kepercayaan -116.2878 sampai 146.7447.
confint(model.reg, "x", 0.95)
## 2.5 % 97.5 %
## x -0.8986652 8.654408
Diharapkan 95% nilai penduga parameter Umur berada pada selang kepercayaan -0.9066075 sampai 8.647969.
alpha = 0.05
n = dim(data)[1]
summary(model.reg)
##
## Call:
## lm(formula = y ~ x, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -39.090 -17.755 -7.721 5.135 142.108
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 15.011 65.434 0.229 0.820
## x 3.878 2.377 1.631 0.109
##
## Residual standard error: 31.55 on 49 degrees of freedom
## Multiple R-squared: 0.05152, Adjusted R-squared: 0.03217
## F-statistic: 2.662 on 1 and 49 DF, p-value: 0.1092
t value = 0.229
t_tabel <- abs(qt(alpha/2, 1))
t table = 12.7062
t tab > thit = terima H0. Tidak cukup bukti untuk menyatakan bahwa ada nilai penjualan rokok yang tidak dapat dijelaSelang Kepercayaanan oleh umur pada taraf nyata 5%.
t value = 1.631
t_tabel2 <- abs(qt(alpha/2, n-2))
t table = 2.009575
t tab > thit = terima H0. Tidak cukup bukti untuk menyatakan bahwa umur memengaruhi penjualan rokok pada taraf nyata 5%
newdata <- data.frame(x=30)
predict(model.reg, newdata, interval = "prediction")
## fit lwr upr
## 1 131.3475 66.1998 196.4951
Dugaan y=121.6528 dengan Selang Kepercayaan 95% dari 57.63857 sampai 185.667.
predict(model.reg, newdata, interval = "confidence")
## fit lwr upr
## 1 131.3475 116.3399 146.355
Dugaan y=121.6528 dengan Selang Kepercayaan 95% dari 112.7742 sampai 130.5314.
anova(model.reg)
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 2649 2649.0 2.6618 0.1092
## Residuals 49 48765 995.2
jkg <- 48765
jkr <- 2649
r_squared <- 1-(jkg/(jkg+jkr))
r_squared
## [1] 0.05152293
Model yang dibentuk menghasilkan nilai Rsquared = 0.05152293.
Note: Proyek analisis ini adalah hasil tugas kelompok tengah semester untuk mata kuliah Analisis Regresi.