Tugas Individu Analisis Regresi
Library
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ lubridate 1.9.3 ✔ tibble 3.2.1
## ✔ purrr 1.0.1 ✔ tidyr 1.3.0
## ✔ readr 2.1.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
##
## Attaching package: 'plotly'
##
## The following object is masked from 'package:ggplot2':
##
## last_plot
##
## The following object is masked from 'package:stats':
##
## filter
##
## The following object is masked from 'package:graphics':
##
## layout
## Loading required package: zoo
##
## Attaching package: 'zoo'
##
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: carData
##
## Attaching package: 'car'
##
## The following object is masked from 'package:purrr':
##
## some
##
## The following object is masked from 'package:dplyr':
##
## recode
Data
tugas <- read_excel("/Users/user/Downloads/Anreg Individu.xlsx")
y <- tugas$Y
x <- tugas$X
n <- nrow(tugas)
n## [1] 15
## # A tibble: 6 × 3
## No X Y
## <dbl> <dbl> <dbl>
## 1 1 2 54
## 2 2 5 50
## 3 3 7 45
## 4 4 10 37
## 5 5 14 35
## 6 6 19 25
Model Regresi (awal)
##
## Call:
## lm(formula = y ~ x, data = tugas)
##
## Coefficients:
## (Intercept) x
## 46.4604 -0.7525
##
## Call:
## lm(formula = y ~ x, data = tugas)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7.1628 -4.7313 -0.9253 3.7386 9.0446
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 46.46041 2.76218 16.82 3.33e-10 ***
## x -0.75251 0.07502 -10.03 1.74e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.891 on 13 degrees of freedom
## Multiple R-squared: 0.8856, Adjusted R-squared: 0.8768
## F-statistic: 100.6 on 1 and 13 DF, p-value: 1.736e-07
Didapatkan model regresi sebegai berikut:
\[ \hat Y = 46.46041 - 0.75251X + e \]
Persamaan Model di atas belum dapat dianggap sebagai model terbaik karena belum mengikuti serangkaian uji untuk memenuhi asumsi Gauss-Markov dan normalitas, yang merupakan prasyarat untuk mendapatkan model terbaik. Oleh karena itu, diperlukan serangkaian uji untuk menilai kualitas model. Jika uji tersebut menunjukkan bahwa asumsi belum terpenuhi, maka akan dilakukan transformasi pada data untuk memastikan kualitas model yang lebih baik.
Eksplorasi Data
Uji Normalitas
\[ H_0 = \text {residual menyebar normal} \]
\[ H_1 = \text {residual tidak menyebar normal} \]
Uji Kolmogorov-Smirnov
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: model$residuals
## D = 0.12432, p-value = 0.9521
## alternative hypothesis: two-sided
Hasil p-value dari uji Kolmogorov-Smirnov lebih besar dari 0.05, maka dapat disimpulkan bahwa data dalam model menyebar secara normal
Pemeriksaan Asumsi
Uji Formal Kondisi Gauss-Markov
Uji-t
\[ H_0 = \text {Nilai harapan residual sama dengan 0} \]
\[ H_1 = \text {Nilai harapan residual tidak sama dengan 0} \]
##
## One Sample t-test
##
## data: model$residuals
## t = -1.6158e-16, df = 14, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -3.143811 3.143811
## sample estimates:
## mean of x
## -2.368476e-16
Dapat dilihat berdasarkan uji t bahwa p-value lebih dari 0.05 maka tak tolak H0, yaitu nilai harapan rasidual sama dengan nol. Asumsi terpenuhi.
Uji Autokorelasi
\[ H_0 = \text {residual saling bebas} \]
\[ H_1 = \text {residual tak saling bebas} \]
Pada plot ACF diatas, terlihat bahwa nilai autokorelasi pada lag 1 sebesar 0.5 dan pada lag 2 sekitar 0.4. Kedua nilai ini berada di luar batas kepercayaan 95%, menunjukkan bahwa autokorelasi pada kedua lag tersebut signifikan. Keberadaan autokorelasi yang signifikan menunjukkan bahwa asumsi Gauss-Markov tidak terpenuhi.
Uji Durbin Watson
##
## Durbin-Watson test
##
## data: model
## DW = 0.48462, p-value = 1.333e-05
## alternative hypothesis: true autocorrelation is greater than 0
Hasil p-value dari uji Durbin-Watson lebih rendah daripada 0.05 hal tersebut menunjukkan adanya autokorelasi positif dalam data, oleh karena itu uji Durbin Watson ini menguatkan tidak terpenuhnya asumsi Gauss-Markov, yaitu non-autokorelasi.
Uji Homoskedastisitas
\[ H_0 = \text {Ragam residual homogen} \]
\[ H_1 = \text {ragam residual tidak homogen} \]
Uji Breusch-Pagan
##
## Call:
## lm(formula = abs(model$residuals) ~ X, data = tugas)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2525 -1.7525 0.0235 2.0168 4.2681
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.45041 1.27241 4.284 0.00089 ***
## X -0.01948 0.03456 -0.564 0.58266
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.714 on 13 degrees of freedom
## Multiple R-squared: 0.02385, Adjusted R-squared: -0.05124
## F-statistic: 0.3176 on 1 and 13 DF, p-value: 0.5827
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 0.52819, df = 1, p-value = 0.4674
Dihasilkan bahwa p-value dari uji Breusch-Pagan lebih besar daripada 0.05 sehingga tak tolak H0. Residual dari sisaan bersifat homogen atau terdapat kehomogenan dalam variabilitas residual. Asumsi terpenuhi.
Berdasarkan grafik diatas, dapat diperhatikan bahwa variabilitas residual tetap konstan pada berbagai tingkat nilai prediksi, menunjukkan homogenitas dalam ragam residual. Namun, terdapat tren peningkatan varian residual seiring dengan peningkatan nilai prediksi (berbentuk kurva), mengindikasikan adanya heteroskedastisitas dalam data. Meskipun demikian, hasil uji kehomogenan menunjukkan bahwa ragam residual bersifat homogen. Discrepancy antara grafik dan hasil uji dapat disebabkan oleh subyektivitas dalam penafsiran visual terhadap bentuk grafik yang mungkin tidak sepenuhnya mencerminkan keadaan sebenernya.
Transformasi
Karena serangkaian uji telah menunjukkan bahwa model tersebut tidak memenuhi asumsi yang diinginkan, maka dilakukan transformasi dengan memperkecil skala variabel independen (x) dan/atau variabel dependen (y) agar mendapatkan model yang lebih baik dan memenuhi asumsi.
transformasi x diperkecil
akar_x<-sqrt(x)
dtrans1<-data.frame(akar_x,y)
ggplot(tugas = dtrans1)+
geom_point(aes(x=akar_x, y=y),col="blue")+
labs(title = "Transformasi memperkecil X")Uji lanjutan
Diperlukan uji lanjutan untuk mengetahui model transformasi mana yang lebih baik
Uji Durbin Watson
X dipekerkecil
##
## Call:
## lm(formula = y ~ akar_x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.4518 -2.8559 0.7657 2.0035 5.2422
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 63.2250 2.2712 27.84 5.67e-13 ***
## akar_x -7.7481 0.4097 -18.91 7.68e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.262 on 13 degrees of freedom
## Multiple R-squared: 0.9649, Adjusted R-squared: 0.9622
## F-statistic: 357.7 on 1 and 13 DF, p-value: 7.684e-11
Persamaan model dengan X diperkecil:
\[ \hat Y = 63.2250 - 7.7481X^{\frac{1}{2}} + e \]
##
## Durbin-Watson test
##
## data: model_trans1
## DW = 1.1236, p-value = 0.01422
## alternative hypothesis: true autocorrelation is greater than 0
Diketahui p-value dari uji Durbin Watson lebih kecil daripada 0.05 maka tolak H0. Model transformasi dengan memperkecil X masih memilki autokorelasi dan sisaan tidak saling bebas sehingga belum bisa dikatakan model yang paling baik
Y diperkecil
##
## Call:
## lm(formula = akar_y ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.53998 -0.38316 -0.01727 0.36045 0.70199
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.015455 0.201677 34.79 3.24e-14 ***
## x -0.081045 0.005477 -14.80 1.63e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4301 on 13 degrees of freedom
## Multiple R-squared: 0.9439, Adjusted R-squared: 0.9396
## F-statistic: 218.9 on 1 and 13 DF, p-value: 1.634e-09
Persamaan model dengan Y diperkecil:
\[ \hat Y = 7.015455 - 0.081045X + e \]
##
## Durbin-Watson test
##
## data: model_trans2
## DW = 1.2206, p-value = 0.02493
## alternative hypothesis: true autocorrelation is greater than 0
Diketahui p-value dari uji Durbin Watson juga lebih kecil daripada 0.05 maka tolak H0. Model transformasi dengan memperkecil Y masih memilki autokorelasi dan sisaan tidak saling bebas sehingga belum bisa dikatakan model yang paling baik
X dan Y diperkecil
##
## Call:
## lm(formula = akar_y ~ akar_x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.42765 -0.17534 -0.05753 0.21223 0.46960
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.71245 0.19101 45.61 9.83e-16 ***
## akar_x -0.81339 0.03445 -23.61 4.64e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2743 on 13 degrees of freedom
## Multiple R-squared: 0.9772, Adjusted R-squared: 0.9755
## F-statistic: 557.3 on 1 and 13 DF, p-value: 4.643e-12
Persamaan model dengan X dan Y diperkecil:
\[ \hat Y = 8.71245 - 0.81339X^{\frac{1}{2}} + e \]
##
## Durbin-Watson test
##
## data: model_trans3
## DW = 2.6803, p-value = 0.8629
## alternative hypothesis: true autocorrelation is greater than 0
Didapatkan hasil p-value dari Uji Durbin-Watson lebih besar daripada 0.05 maka dapat disimpulkan bahwa data saling bebas atau tidak memiliki tidak autokorelasi, namun untuk mengetahui transformasi dengan memperkecil X dan Y ini adalah model terbaik maka diperlukan serangkaian uji ulang lagi terhadap model baru yang telah di transformasi.
Uji Ulang
Melakukan uji ulang untuk mengetahu apakah nilai harapan residual sama dengan 0 atau tidak dan apakah model tersebut memiliki ragam residual homogen atau tidak.
Uji t
\[ H_0 = \text {Nilai harapan residual sama dengan 0} \]
\[ H_1 = \text {Nilai harapan residual tidak sama dengan 0} \]
##
## One Sample t-test
##
## data: model_trans3$residuals
## t = 1.6267e-16, df = 14, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -0.1463783 0.1463783
## sample estimates:
## mean of x
## 1.110223e-17
Didapatkan p-value dari Uji t lebih besar daripada 0.05 maka tak tolak H0. Nilai harapan residual dari model yang telah di transformasi terhadap X dan Y sama dengan nol maka asumsi terpenuhi.
Uji NCV
\[ H_0 = \text {Ragam residual homogen} \]
\[ H_1 = \text {ragam residual tidak homogen} \]
## Non-constant Variance Score Test
## Variance formula: ~ fitted.values
## Chisquare = 2.160411, Df = 1, p = 0.14161
Didapatkan p-value dari Uji NCV juga lebih besar daripada 0.05 maka tak tolak H0. Ragam residual dari model yang telah di transformasi terhadap X dan Y adalah homogen maka asumsi terpenuhi.
Kesimpulan
Berdasarkan perbandingan hasil uji sebelum dan sesudah transformasi, didapatkan kesimpulan bahwa model setelah transformasi lebih baik daripada model sebelum ditransformasi karena menghasilkan model yang lebih efektif dan memenuhi semua asumsi dalam regresi linear sederhana Oleh karena itu, didapatkan model terbaik yaitu:
\[ \hat Y^{\frac{1}{2}} = 8.71245 - 0.81339X^{\frac{1}{2}} + e \]
Transformasi Balik
Untuk menjelaskan variabel respons asli sebelum dilakukan transformasi, model hasil transformasi harus dilakukan transformasi balik dengan cara pengubahan variabel respons terlebih dahulu sebelum variabel lainnya.
didapatkan model hasil transformasi balik, yaitu:
\[ \hat Y = (8.71245 - 0.81339X^{\frac{1}{2}} + e)^2 \] Model regresi tersebut menjelaskan bahwa ketika nilai \(X^{\frac{1}{2}}\) meningkat maka nilai dugaan Y menurun dengan kenaikan 1 satuan \(X^{\frac{1}{2}}\) menurunkan Y dugaan rataan sebesar 0.81339. Selain itu, nilai Y ketika \(X^{\frac{1}{2}}\) sama dengan 0 didapatkan hasil 8.71245. Diketahui juga dalam persamaan tersebut terdapat hubungan kuadratik negatif antar peubah Y dan X.