Data yang akan dianalisis adalah data konsumsi rokok oleh 51 orang di sebuah negara pada tahun 1970.

Memanggil library dan dataset

library(readxl)
data <- read_excel("D:/Semester5/AnReg/Sales-Age.xlsx")
colnames(data) <- c("x","y")

x = Umur dan y = Sales

Membuat Model Regresi

model.reg <- lm(y~x, data=data)
summary(model.reg)
## 
## Call:
## lm(formula = y ~ x, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -39.090 -17.755  -7.721   5.135 142.108 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)   15.011     65.434   0.229    0.820
## x              3.878      2.377   1.631    0.109
## 
## Residual standard error: 31.55 on 49 degrees of freedom
## Multiple R-squared:  0.05152,    Adjusted R-squared:  0.03217 
## F-statistic: 2.662 on 1 and 49 DF,  p-value: 0.1092

Model yang didapat adalah: \(Y = 15.228 + 3.871X\)

Interpretasi:

  1. Dugaan rata-rata jumlah bungkus rokok yang dijual berdasarkan jika umur seseorang diketahui = 0 sebesar 15.228 per kapita.

  2. Setiap kenaikan satu satuan umur akan meningkatkan dugaan rataan bungkus rokok yang terjual sebesar 3.871 per kapita.

Membuat Selang Kepercayaan Parameter

Intersep

confint(model.reg, "(Intercept)", 0.95)
##                 2.5 %   97.5 %
## (Intercept) -116.4842 146.5069

Diharapkan 95% nilai penduga parameter Intersep berada pada selang kepercayaan -116.2878 sampai 146.7447.

Umur

confint(model.reg, "x", 0.95)
##        2.5 %   97.5 %
## x -0.8986652 8.654408

Diharapkan 95% nilai penduga parameter Umur berada pada selang kepercayaan -0.9066075 sampai 8.647969.

Uji Hipotesis Parameter

alpha = 0.05
n = dim(data)[1]
summary(model.reg)
## 
## Call:
## lm(formula = y ~ x, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -39.090 -17.755  -7.721   5.135 142.108 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)   15.011     65.434   0.229    0.820
## x              3.878      2.377   1.631    0.109
## 
## Residual standard error: 31.55 on 49 degrees of freedom
## Multiple R-squared:  0.05152,    Adjusted R-squared:  0.03217 
## F-statistic: 2.662 on 1 and 49 DF,  p-value: 0.1092

H0 : b0 = 0

t value = 0.229

t_tabel <- abs(qt(alpha/2, 1))

t table = 12.7062

t tab > thit = terima H0. Tidak cukup bukti untuk menyatakan bahwa ada nilai penjualan rokok yang tidak dapat dijelaSelang Kepercayaanan oleh umur pada taraf nyata 5%.

H1 : b1 = 0

t value = 1.631

t_tabel2 <- abs(qt(alpha/2, n-2))

t table = 2.009575

t tab > thit = terima H0. Tidak cukup bukti untuk menyatakan bahwa umur memengaruhi penjualan rokok pada taraf nyata 5%

Memasukkan x tertentu di antara min sampai max

newdata <- data.frame(x=30)

Selang Kepercayaan bagi individu y

predict(model.reg, newdata, interval = "prediction")
##        fit     lwr      upr
## 1 131.3475 66.1998 196.4951

Dugaan y=121.6528 dengan Selang Kepercayaan 95% dari 57.63857 sampai 185.667.

Selang Kepercayaan bagi rerata y

predict(model.reg, newdata, interval = "confidence")
##        fit      lwr     upr
## 1 131.3475 116.3399 146.355

Dugaan y=121.6528 dengan Selang Kepercayaan 95% dari 112.7742 sampai 130.5314.

Ukuran Kebaikan Model

anova(model.reg)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value Pr(>F)
## x          1   2649  2649.0  2.6618 0.1092
## Residuals 49  48765   995.2
jkg <- 48765
jkr <- 2649
r_squared <- 1-(jkg/(jkg+jkr))
r_squared
## [1] 0.05152293

Model yang dibentuk menghasilkan nilai Rsquared = 0.05152293.

Note: Proyek analisis ini adalah hasil tugas kelompok tengah semester untuk mata kuliah Analisis Regresi.