library(readxl)
datauts <- read_excel("C:/Users/ASUS/Downloads/datauts.xlsx")
data.frame(datauts)
##       x  y
## 1  1500 55
## 2  1800 60
## 3  2100 65
## 4  2400 70
## 5  2700 75
## 6  1600 57
## 7  1900 62
## 8  2200 67
## 9  2500 72
## 10 2800 77

Eksplorasi Data

summary(datauts)
##        x              y       
##  Min.   :1500   Min.   :55.0  
##  1st Qu.:1825   1st Qu.:60.5  
##  Median :2150   Median :66.0  
##  Mean   :2150   Mean   :66.0  
##  3rd Qu.:2475   3rd Qu.:71.5  
##  Max.   :2800   Max.   :77.0

Plot Regresi

modeluts <- lm(y~x, data=datauts)
summary(modeluts)
## 
## Call:
## lm(formula = y ~ x, data = datauts)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.1918 -0.1610  0.0000  0.1610  0.1918 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 30.068493   0.300278   100.1 1.10e-13 ***
## x            0.016712   0.000137   122.0 2.28e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1851 on 8 degrees of freedom
## Multiple R-squared:  0.9995, Adjusted R-squared:  0.9994 
## F-statistic: 1.488e+04 on 1 and 8 DF,  p-value: 2.278e-14
plot(datauts$x,datauts$y, main="Scatterplot",xlab="konsumsi kalori",ylab="berat badan",pch=16)
abline(modeluts, col="blue")

Interpretasi secara visualisasi:

semua titik-titik pada scatterplot di atas terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon.

Mencari Koefisien Determinasi (r^2)

JKG <- sum((datauts$y-modeluts$fitted.values)^2)
JKG
## [1] 0.2739726
JKR <- sum(((modeluts$fitted.values-mean(datauts$y))^2))
JKR
## [1] 509.726
JKT <- sum((datauts$y-mean(datauts$y))^2)
JKT
## [1] 510
# Koefisien determinasi
r2 <- (JKT-JKG)/JKT
r2
## [1] 0.9994628

Mencari Koefisien Korelasi (r)

# Mencari koefisien korelasi menggunakan koefisien determinasi
sqrt(r2)
## [1] 0.9997314
# Mencari koefisien korelasi menggunakan fungsi cor.test
cor.test(datauts$x, datauts$y)
## 
##  Pearson's product-moment correlation
## 
## data:  datauts$x and datauts$y
## t = 122, df = 8, p-value = 2.278e-14
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9988186 0.9999389
## sample estimates:
##       cor 
## 0.9997314

Interpretasi:

0.9997314 merupakan nilai koefisien korelasi yang mendekati 1, sehingga terdapat hubungan linear yang kuat antara peubah bebas dan peubah respon.

Persamaan Regresi menggunakan fungsi lm pada program R

modeluts <- lm(y~x, data=datauts)
summary(modeluts)
## 
## Call:
## lm(formula = y ~ x, data = datauts)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.1918 -0.1610  0.0000  0.1610  0.1918 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 30.068493   0.300278   100.1 1.10e-13 ***
## x            0.016712   0.000137   122.0 2.28e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1851 on 8 degrees of freedom
## Multiple R-squared:  0.9995, Adjusted R-squared:  0.9994 
## F-statistic: 1.488e+04 on 1 and 8 DF,  p-value: 2.278e-14
# Berdasarkan Persamaan Regresi menggunakan fungsi lm pada R diperoleh
b1 <- 0.016712
b0 <- 30.068493

Persamaan Regresi Dugaan:

yhat = (30.068493) + (0.016712)x

Interpretasi:

Analisis Variansi (Anova)

anova(modeluts)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## x          1 509.73  509.73   14884 2.278e-14 ***
## Residuals  8   0.27    0.03                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi:

Berdasarkan hasil di atas diperoleh nilai SSR(Sum square residuals) = JKG (jumlah kuadrat galat) = 0.27

Pengujian hipotesis bagi regresi linear

Hipotesis:

H0: Tidak ada hubungan linear yang signifikan antara x dan y (𝛽1 = 0)

H1: Ada hubungan linear yang signifikan antara x dan y (𝛽1 ≠ 0)

Taraf Signifikansi:

𝛼 = 0.1

Statistik Uji:

Uji F

Kriteria Keputusan:

H0 ditolak jika 𝐹-value > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼

Perhitungan:

F-value = 14884

p-value = 2.278e-14

# Mencari F-value dan p-value menggunakan fungsi anova
anova(modeluts)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## x          1 509.73  509.73   14884 2.278e-14 ***
## Residuals  8   0.27    0.03                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

F tabel = 3.457919

# Mencari F tabel
qf(0.9,df1=1, df2=8)
## [1] 3.457919

Kesimpulan:

karena F-value = 14884 > 3.457919 atau p-value = 2.278e-14 < 0.1 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.1 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara konsumsi kalori (x) dan berat badan (y).

Inferensi dalam Regresi Linier Sederhana

Interval Kepercayaan untuk β1 dan β0

confint(modeluts, level = 0.90)
##                    5 %        95 %
## (Intercept) 29.5101114 30.62687493
## x            0.0164576  0.01696706

Selang Kepercayaan β0:

29.5101114 < β0 < 30.62687493

Selang Kepercayaan β1:

0.0164576 < β1 < 0.01696706

Selang Kepercayaan E{Yh}

gausah

Asumsi 1: Rata-rata galat diasumsikan bernilai nol

plot(datauts$x,modeluts$residuals,
xlab="konsumsi kalori (x)",ylab="Residuals",
main="Plot Uji Asumsi Rata-rata Galat bernilai nol")
abline(h=0,col="blue",lty=2)

Analisis dengan Visualisasi:

Pada plot Uji Asumsi 1 di atas dapat diamati bahwa titik-titik tidak menyebar secara acak (membentuk pola tertentu) di sekitar galat sama dengan nol. Dengan demikian, memungkinkan asumsi rata-rata galat bernilai 0 tidak terpenuhi.

Asumsi 2 : Galat Saling Bebas (Independen)

c<-(1:10)
datauts<-cbind(datauts,c)
head(datauts)
##      x  y c
## 1 1500 55 1
## 2 1800 60 2
## 3 2100 65 3
## 4 2400 70 4
## 5 2700 75 5
## 6 1600 57 6
plot(datauts$c,modeluts$residuals,
xlab="Amatan",ylab="Residuals",
main="Plot Uji Asumsi Galat Saling Bebas")
abline(h=0,col="blue",lty=2)

Analisis dengan visualisasi:

pada plot amatan vs residual di atas dapat diamati bahwa titik-titiknya tidak menyebar secara acak (membentuk pola tertentu), maka galat tidak saling bebas (dependen). Dengan demikian, asumsi Galat Saling Bebas (Independen) tidak terpenuhi.

Analisis dengan pengujian hipotesis

Hipotesis:

H0: Galat saling bebas

H1: Galat tidak saling bebas

Kriteria keputusan:

H0 ditolak jika p-value < 0.05

Perhitungan:

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(modeluts) # p-value < 0.05 H0 ditolak atau terjadi autokorelasi (Galat tidak saling bebas)
## 
##  Durbin-Watson test
## 
## data:  modeluts
## DW = 0.54247, p-value = 0.0006323
## alternative hypothesis: true autocorrelation is greater than 0
library(car)
## Warning: package 'car' was built under R version 4.3.2
## Loading required package: carData
dwt(modeluts)
##  lag Autocorrelation D-W Statistic p-value
##    1        0.660274     0.5424658   0.006
##  Alternative hypothesis: rho != 0

Kesimpulan asumsi 2:

dari perhitungan diatas diperoleh p-value = 0.0006323 < 0.1 dan p-value = 0.16 < 0.1 maka H0 ditolak. Sehingga pada taraf signifikansi 0.1 dapat disimpulkan bahwa galat tidak saling bebas (dependen) atau terjadi autokorelasi. Dengan demikian, asumsi independen tidak terpenuhi.

Asumsi 3 = Galat berdistribusi normal (Normalitas)

qqnorm(modeluts$residuals,ylab = "Raw Residuals")
qqline(modeluts$residuals)

Analisis secara Visualisasi:

Pada Normal Q-Q plot di atas terlihat bahwa mayoritas titik-titik tidak terletak di sekitar garis regresi. Dengan demikian, asumsi normalitas tidak terpenuhi.

Analisis dengan pengujian hipotesis

Hipotesis:

H0:Galat berdistribusi normal

H1:Galat tidak bersistribusi normal

Kriteria keputusan:

H0 ditolak jika p-value < 0.05

Perhitungan:

shapiro.test(modeluts$residuals) 
## 
##  Shapiro-Wilk normality test
## 
## data:  modeluts$residuals
## W = 0.75791, p-value = 0.004455
library(nortest)
ad.test(modeluts$residuals)
## 
##  Anderson-Darling normality test
## 
## data:  modeluts$residuals
## A = 1.1191, p-value = 0.003379
lillie.test(modeluts$residuals)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  modeluts$residuals
## D = 0.28381, p-value = 0.02181

Kesimpulan asumsi 3:

pada ketiga perhitungan diatas diperoleh p-value = 0.004455 < 0.1, p-value = 0.003379 < 0.1, dan p-value = 0.02181 < 0.1 maka H0 ditolak Sehingga, pada taraf signifikansi 0.1 dapat disimpulkan bahwa galat tidak berdistribusi normal. Dengan demikian, asumsi normalitas tidak terpenuhi.

Asumsi 4: Ragam galat konstan atau homoskedastisitas (Homogenitas variansi)

plot(modeluts$fitted.values,modeluts$residuals,
xlab="Fitted Values",ylab="Residuals",
main="Plot Uji Ragam Galat konstan")
abline(h=0,col="blue",lty=2)

Analisis secara Visualisasi:

Pada plot uji ragam galat konstan di atas dapat diamati bahwa titik-titiknya tidak menyebar (membentuk pola tertentu) di sekitar sumbu 𝑌 = 0 (dalam pita horizontal), maka ragam galat tidak konstan (heterokedastisitas). Dengan demikian, asumsi Homogenitas variansi tidak terpenuhi.

Asumsi 5: X dan Y berhubungan linear

modeluts <- lm(y~x, data=datauts)
summary(modeluts)
## 
## Call:
## lm(formula = y ~ x, data = datauts)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.1918 -0.1610  0.0000  0.1610  0.1918 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 30.068493   0.300278   100.1 1.10e-13 ***
## x            0.016712   0.000137   122.0 2.28e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1851 on 8 degrees of freedom
## Multiple R-squared:  0.9995, Adjusted R-squared:  0.9994 
## F-statistic: 1.488e+04 on 1 and 8 DF,  p-value: 2.278e-14
plot(datauts$x,datauts$y, main="Scatterplot",xlab="konsumsi kalori",ylab="berat badan",pch=16)
abline(modeluts, col="blue")

Analisis secara visualisasi:

Pada scatterplot di atas dapat diamati titik-titiknya terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon. Dengan demikian, asumsi Linearitas terpenuhi.

Analisis dengan pengujian hipotesis

Pengujian hipotesis bagi regresi linear

Hipotesis:

H0: Tidak ada hubungan linear yang signifikan antara x dan y (𝛽1 = 0)

H1: Ada hubungan linear yang signifikan antara x dan y (𝛽1 ≠ 0)

Taraf Signifikansi:

𝛼 = 0.1

Statistik Uji:

Uji F

Kriteria Keputusan:

H0 ditolak jika 𝐹-value > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼

Perhitungan:

F-value = 14884

p-value = 2.278e-14

# Mencari F-value dan p-value menggunakan fungsi anova
anova(modeluts)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## x          1 509.73  509.73   14884 2.278e-14 ***
## Residuals  8   0.27    0.03                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

F tabel = 3.457919

# Mencari F tabel
qf(0.9,df1=1, df2=8)
## [1] 3.457919

Kesimpulan:

karena F-value = 14884 > 3.457919 atau p-value = 2.278e-14 < 0.1 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.1 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara konsumsi kalori (x) dan berat badan (y).

Asumsi 6: Tidak ada outlier

plot(datauts$x,datauts$y,main="Plot Data")

Interpretasi secara Visualisasi: Pada plot data diatas dapat diamati bahwa tidak ditemukan adanya outlier (nilai yang jauh berbeda dari nilai lainnya dalam kumpulan data). Dengan demikian, asumsi tidak adanya outlier terpenuhi.