library(readxl)
datauts <- read_excel("C:/Users/ASUS/Downloads/datauts.xlsx")
data.frame(datauts)
## x y
## 1 1500 55
## 2 1800 60
## 3 2100 65
## 4 2400 70
## 5 2700 75
## 6 1600 57
## 7 1900 62
## 8 2200 67
## 9 2500 72
## 10 2800 77
summary(datauts)
## x y
## Min. :1500 Min. :55.0
## 1st Qu.:1825 1st Qu.:60.5
## Median :2150 Median :66.0
## Mean :2150 Mean :66.0
## 3rd Qu.:2475 3rd Qu.:71.5
## Max. :2800 Max. :77.0
modeluts <- lm(y~x, data=datauts)
summary(modeluts)
##
## Call:
## lm(formula = y ~ x, data = datauts)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.1918 -0.1610 0.0000 0.1610 0.1918
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 30.068493 0.300278 100.1 1.10e-13 ***
## x 0.016712 0.000137 122.0 2.28e-14 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1851 on 8 degrees of freedom
## Multiple R-squared: 0.9995, Adjusted R-squared: 0.9994
## F-statistic: 1.488e+04 on 1 and 8 DF, p-value: 2.278e-14
plot(datauts$x,datauts$y, main="Scatterplot",xlab="konsumsi kalori",ylab="berat badan",pch=16)
abline(modeluts, col="blue")
Interpretasi secara visualisasi:
semua titik-titik pada scatterplot di atas terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon.
JKG <- sum((datauts$y-modeluts$fitted.values)^2)
JKG
## [1] 0.2739726
JKR <- sum(((modeluts$fitted.values-mean(datauts$y))^2))
JKR
## [1] 509.726
JKT <- sum((datauts$y-mean(datauts$y))^2)
JKT
## [1] 510
# Koefisien determinasi
r2 <- (JKT-JKG)/JKT
r2
## [1] 0.9994628
# Mencari koefisien korelasi menggunakan koefisien determinasi
sqrt(r2)
## [1] 0.9997314
# Mencari koefisien korelasi menggunakan fungsi cor.test
cor.test(datauts$x, datauts$y)
##
## Pearson's product-moment correlation
##
## data: datauts$x and datauts$y
## t = 122, df = 8, p-value = 2.278e-14
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9988186 0.9999389
## sample estimates:
## cor
## 0.9997314
Interpretasi:
0.9997314 merupakan nilai koefisien korelasi yang mendekati 1, sehingga terdapat hubungan linear yang kuat antara peubah bebas dan peubah respon.
modeluts <- lm(y~x, data=datauts)
summary(modeluts)
##
## Call:
## lm(formula = y ~ x, data = datauts)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.1918 -0.1610 0.0000 0.1610 0.1918
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 30.068493 0.300278 100.1 1.10e-13 ***
## x 0.016712 0.000137 122.0 2.28e-14 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1851 on 8 degrees of freedom
## Multiple R-squared: 0.9995, Adjusted R-squared: 0.9994
## F-statistic: 1.488e+04 on 1 and 8 DF, p-value: 2.278e-14
# Berdasarkan Persamaan Regresi menggunakan fungsi lm pada R diperoleh
b1 <- 0.016712
b0 <- 30.068493
Persamaan Regresi Dugaan:
yhat = (30.068493) + (0.016712)x
Interpretasi:
Makna B1 = 0.016712, jika konsumsi kalori (x) meningkat sebesar 1 kkal, maka rata-rata berat badan (y) meningkat sebesar 0.016712 kg.
Makna B0 = 30.068493, jika konsumsi kalori (x) sebesar 0 persen maka rata-rata berat badan sebesar 30.068493 kg. (tidak bermakna karena konsumsi kalori tidak mungkin, sehingga Bo tidak bermakna)
anova(modeluts)
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 509.73 509.73 14884 2.278e-14 ***
## Residuals 8 0.27 0.03
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interpretasi:
Berdasarkan hasil di atas diperoleh nilai SSR(Sum square residuals) = JKG (jumlah kuadrat galat) = 0.27
Hipotesis:
H0: Tidak ada hubungan linear yang signifikan antara x dan y (𝛽1 = 0)
H1: Ada hubungan linear yang signifikan antara x dan y (𝛽1 ≠ 0)
Taraf Signifikansi:
𝛼 = 0.1
Statistik Uji:
Uji F
Kriteria Keputusan:
H0 ditolak jika 𝐹-value > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼
Perhitungan:
F-value = 14884
p-value = 2.278e-14
# Mencari F-value dan p-value menggunakan fungsi anova
anova(modeluts)
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 509.73 509.73 14884 2.278e-14 ***
## Residuals 8 0.27 0.03
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
F tabel = 3.457919
# Mencari F tabel
qf(0.9,df1=1, df2=8)
## [1] 3.457919
Kesimpulan:
karena F-value = 14884 > 3.457919 atau p-value = 2.278e-14 < 0.1 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.1 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara konsumsi kalori (x) dan berat badan (y).
confint(modeluts, level = 0.90)
## 5 % 95 %
## (Intercept) 29.5101114 30.62687493
## x 0.0164576 0.01696706
Selang Kepercayaan β0:
29.5101114 < β0 < 30.62687493
Selang Kepercayaan β1:
0.0164576 < β1 < 0.01696706
gausah
plot(datauts$x,modeluts$residuals,
xlab="konsumsi kalori (x)",ylab="Residuals",
main="Plot Uji Asumsi Rata-rata Galat bernilai nol")
abline(h=0,col="blue",lty=2)
Analisis dengan Visualisasi:
Pada plot Uji Asumsi 1 di atas dapat diamati bahwa titik-titik tidak menyebar secara acak (membentuk pola tertentu) di sekitar galat sama dengan nol. Dengan demikian, memungkinkan asumsi rata-rata galat bernilai 0 tidak terpenuhi.
c<-(1:10)
datauts<-cbind(datauts,c)
head(datauts)
## x y c
## 1 1500 55 1
## 2 1800 60 2
## 3 2100 65 3
## 4 2400 70 4
## 5 2700 75 5
## 6 1600 57 6
plot(datauts$c,modeluts$residuals,
xlab="Amatan",ylab="Residuals",
main="Plot Uji Asumsi Galat Saling Bebas")
abline(h=0,col="blue",lty=2)
Analisis dengan visualisasi:
pada plot amatan vs residual di atas dapat diamati bahwa titik-titiknya tidak menyebar secara acak (membentuk pola tertentu), maka galat tidak saling bebas (dependen). Dengan demikian, asumsi Galat Saling Bebas (Independen) tidak terpenuhi.
Analisis dengan pengujian hipotesis
Hipotesis:
H0: Galat saling bebas
H1: Galat tidak saling bebas
Kriteria keputusan:
H0 ditolak jika p-value < 0.05
Perhitungan:
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
dwtest(modeluts) # p-value < 0.05 H0 ditolak atau terjadi autokorelasi (Galat tidak saling bebas)
##
## Durbin-Watson test
##
## data: modeluts
## DW = 0.54247, p-value = 0.0006323
## alternative hypothesis: true autocorrelation is greater than 0
library(car)
## Warning: package 'car' was built under R version 4.3.2
## Loading required package: carData
dwt(modeluts)
## lag Autocorrelation D-W Statistic p-value
## 1 0.660274 0.5424658 0.006
## Alternative hypothesis: rho != 0
Kesimpulan asumsi 2:
dari perhitungan diatas diperoleh p-value = 0.0006323 < 0.1 dan p-value = 0.16 < 0.1 maka H0 ditolak. Sehingga pada taraf signifikansi 0.1 dapat disimpulkan bahwa galat tidak saling bebas (dependen) atau terjadi autokorelasi. Dengan demikian, asumsi independen tidak terpenuhi.
qqnorm(modeluts$residuals,ylab = "Raw Residuals")
qqline(modeluts$residuals)
Analisis secara Visualisasi:
Pada Normal Q-Q plot di atas terlihat bahwa mayoritas titik-titik tidak terletak di sekitar garis regresi. Dengan demikian, asumsi normalitas tidak terpenuhi.
Analisis dengan pengujian hipotesis
Hipotesis:
H0:Galat berdistribusi normal
H1:Galat tidak bersistribusi normal
Kriteria keputusan:
H0 ditolak jika p-value < 0.05
Perhitungan:
shapiro.test(modeluts$residuals)
##
## Shapiro-Wilk normality test
##
## data: modeluts$residuals
## W = 0.75791, p-value = 0.004455
library(nortest)
ad.test(modeluts$residuals)
##
## Anderson-Darling normality test
##
## data: modeluts$residuals
## A = 1.1191, p-value = 0.003379
lillie.test(modeluts$residuals)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modeluts$residuals
## D = 0.28381, p-value = 0.02181
Kesimpulan asumsi 3:
pada ketiga perhitungan diatas diperoleh p-value = 0.004455 < 0.1, p-value = 0.003379 < 0.1, dan p-value = 0.02181 < 0.1 maka H0 ditolak Sehingga, pada taraf signifikansi 0.1 dapat disimpulkan bahwa galat tidak berdistribusi normal. Dengan demikian, asumsi normalitas tidak terpenuhi.
plot(modeluts$fitted.values,modeluts$residuals,
xlab="Fitted Values",ylab="Residuals",
main="Plot Uji Ragam Galat konstan")
abline(h=0,col="blue",lty=2)
Analisis secara Visualisasi:
Pada plot uji ragam galat konstan di atas dapat diamati bahwa titik-titiknya tidak menyebar (membentuk pola tertentu) di sekitar sumbu 𝑌 = 0 (dalam pita horizontal), maka ragam galat tidak konstan (heterokedastisitas). Dengan demikian, asumsi Homogenitas variansi tidak terpenuhi.
modeluts <- lm(y~x, data=datauts)
summary(modeluts)
##
## Call:
## lm(formula = y ~ x, data = datauts)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.1918 -0.1610 0.0000 0.1610 0.1918
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 30.068493 0.300278 100.1 1.10e-13 ***
## x 0.016712 0.000137 122.0 2.28e-14 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1851 on 8 degrees of freedom
## Multiple R-squared: 0.9995, Adjusted R-squared: 0.9994
## F-statistic: 1.488e+04 on 1 and 8 DF, p-value: 2.278e-14
plot(datauts$x,datauts$y, main="Scatterplot",xlab="konsumsi kalori",ylab="berat badan",pch=16)
abline(modeluts, col="blue")
Analisis secara visualisasi:
Pada scatterplot di atas dapat diamati titik-titiknya terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon. Dengan demikian, asumsi Linearitas terpenuhi.
Analisis dengan pengujian hipotesis
Hipotesis:
H0: Tidak ada hubungan linear yang signifikan antara x dan y (𝛽1 = 0)
H1: Ada hubungan linear yang signifikan antara x dan y (𝛽1 ≠ 0)
Taraf Signifikansi:
𝛼 = 0.1
Statistik Uji:
Uji F
Kriteria Keputusan:
H0 ditolak jika 𝐹-value > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼
Perhitungan:
F-value = 14884
p-value = 2.278e-14
# Mencari F-value dan p-value menggunakan fungsi anova
anova(modeluts)
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 509.73 509.73 14884 2.278e-14 ***
## Residuals 8 0.27 0.03
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
F tabel = 3.457919
# Mencari F tabel
qf(0.9,df1=1, df2=8)
## [1] 3.457919
Kesimpulan:
karena F-value = 14884 > 3.457919 atau p-value = 2.278e-14 < 0.1 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.1 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara konsumsi kalori (x) dan berat badan (y).
plot(datauts$x,datauts$y,main="Plot Data")
Interpretasi secara Visualisasi: Pada plot data diatas dapat diamati bahwa tidak ditemukan adanya outlier (nilai yang jauh berbeda dari nilai lainnya dalam kumpulan data). Dengan demikian, asumsi tidak adanya outlier terpenuhi.