Notes Theme: - Kelas A: cayman
- Kelas B: tactile
- Kelas C: architect
- Kelas D: hpstr

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Analisis regresi linear sederhana adalah suatu alat analisis yang digunakan untuk mengukur pengaruh antara variabel bebas (X) dan variabel terikat (Y) (Sugiyono, 2011). Analisis Regresi Linear Sederhana merupakan analisis yang berupa metode statistik yang digunakan untuk mengukur pengaruh antara satu variabel prediktor (variabel bebas) terhadap variabel respon (terikat).Namun, informasi dari x menjelaskan tidak secara keseluruhan variabilitas yang dilihat di y. Nama lain dari variabel penjelas adalah variabel prediktor atau regressor variable. Oleh karena itu, secara keseluruhan subjek ini disebut dengan regresi atau regression.( Bingham & Fry, 2010)

2 TINJAUAN PUSTAKA

Analisis regresi adalah suatu metode statistika yang umum digunakan untuk melihat pengaruh antara peubah bebas (variabel prediktor) dengan peubah tak bebas (variabel respon), (Houstis 1998).

3 ASUMSI YANG MELANDASI

Ada 5 asumsi yang mendasari

4 SOURCE CODE

> # Membuat data
> umur <- c(25, 30, 35, 40, 45, 50, 55, 60, 65, 70)
> tinggi <- c(160, 165, 170, 168, 172, 175, 178, 180, 175, 170)
> 
> # Menggabungkan data menjadi data frame
> data <- data.frame(umur, tinggi)
> 
> # Menampilkan data
> print(data)
   umur tinggi
1    25    160
2    30    165
3    35    170
4    40    168
5    45    172
6    50    175
7    55    178
8    60    180
9    65    175
10   70    170
> 
> # Analisis regresi
> regresi <- lm(tinggi ~ umur, data = data)
> 
> # Menampilkan hasil analisis regresi
> summary(regresi)

Call:
lm(formula = tinggi ~ umur, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-7.9273 -1.3773  0.1727  2.8182  5.0182 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 157.30909    4.74974  33.120 7.54e-10 ***
umur          0.29455    0.09572   3.077   0.0152 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.347 on 8 degrees of freedom
Multiple R-squared:  0.5421,    Adjusted R-squared:  0.4848 
F-statistic:  9.47 on 1 and 8 DF,  p-value: 0.01518

4.1 asumsi kenormalitasan

> # Menguji normalitas residual
> shapiro.test(regresi$residuals)

    Shapiro-Wilk normality test

data:  regresi$residuals
W = 0.94043, p-value = 0.5578

4.2 asumsi homoskedastisitas

> #asumsi homoskedastisitas
> library(lmtest)
> 
> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 2.6348, df = 1, p-value = 0.1045

4.3 asumsi non autokorelasi

> #asumsi non autokorelasi
> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 0.87366, p-value = 0.004174
alternative hypothesis: true autocorrelation is greater than 0

4.4 asumsi heteroskedastisitas

> # Menguji heteroskedastisitas residual
> bptest(regresi, studentize = FALSE)

    Breusch-Pagan test

data:  regresi
BP = 1.9042, df = 1, p-value = 0.1676
> library(rmarkdown)
> paged_table(as.data.frame(data))

5 HASIL DAN PEMBAHASAN

koefisien Regresi:

Koefisien (Intercept): Nilai perkiraan intercept adalah 157.30909. Ini menunjukkan bahwa saat umur = 0, tinggi diperkirakan sebesar 157.30909. Koefisien umur: Nilai perkiraan koefisien umur adalah 0.29455. Ini menunjukkan bahwa setiap peningkatan satu unit dalam umur, tinggi diperkirakan akan meningkat sebesar 0.29455. Signifikansi Statistik:

Pada tingkat signifikansi 0.05, variabel umur memiliki signifikansi statistik yang cukup (p-value = 0.0152), yang menunjukkan bahwa umur secara signifikan mempengaruhi tinggi. Namun, nilai p-value pada uji Shapiro-Wilk untuk normalitas residual (p-value = 0.5578) menunjukkan bahwa tidak ada cukup bukti untuk menolak hipotesis bahwa residual terdistribusi secara normal. Kualitas Model:

Multiple R-squared: Nilai R-squared adalah 0.5421, yang berarti sekitar 54.21% variasi dalam tinggi dapat dijelaskan oleh variabel umur. Adjusted R-squared: Nilai adjusted R-squared adalah 0.4848, yang memperhitungkan jumlah variabel dan ukuran sampel yang digunakan. Asumsi Regresi:

Homoskedastisitas: Uji Breusch-Pagan (p-value = 0.1045) dan uji Breusch-Pagan dengan studentize = FALSE (p-value = 0.1676) menunjukkan bahwa tidak ada cukup bukti untuk menolak hipotesis nol bahwa residual homoskedastisitas. Non-autokorelasi: Uji Durbin-Watson (p-value = 0.004174) menunjukkan adanya indikasi keberadaan autokorelasi dalam residual. Hipotesis alternatifnya adalah bahwa ada autokorelasi yang lebih besar dari 0. Tidak ada informasi spesifik yang diberikan mengenai multikolinearitas dalam hasil analisis tersebut.

6 KESIMPULAN

variabel Umur: Variabel umur memiliki pengaruh yang signifikan terhadap tinggi (p-value = 0.0152). Setiap peningkatan satu unit dalam umur, tinggi diperkirakan akan meningkat sebesar 0.29455.

Kualitas Model: Model regresi yang digunakan mampu menjelaskan sekitar 54.21% variasi dalam tinggi. Namun, dengan mempertimbangkan jumlah variabel dan ukuran sampel yang digunakan, nilai adjusted R-squared adalah 0.4848.

Homoskedastisitas: Uji Breusch-Pagan tidak memberikan cukup bukti untuk menolak hipotesis bahwa residual memiliki homoskedastisitas (p-value = 0.1045). Namun, uji Breusch-Pagan dengan studentize = FALSE juga tidak memberikan cukup bukti untuk menolak hipotesis tersebut (p-value = 0.1676).

Normalitas Residual: Uji Shapiro-Wilk untuk normalitas residual tidak memberikan cukup bukti untuk menolak hipotesis bahwa residual terdistribusi secara normal (p-value = 0.5578).

Autokorelasi: Uji Durbin-Watson menunjukkan adanya indikasi autokorelasi dalam residual (p-value = 0.004174). Hal ini mengindikasikan bahwa ada ketergantungan antara residual-residual yang berdekatan.

Dalam kesimpulannya, model regresi ini menunjukkan bahwa variabel umur memiliki pengaruh yang signifikan terhadap tinggi. Namun, perlu diperhatikan bahwa terdapat beberapa asumsi regresi yang tidak terpenuhi, seperti normalitas residual dan non-autokorelasi. Oleh karena itu, hasil ini perlu ditafsirkan dengan hati-hati dan mungkin diperlukan pemodelan atau analisis yang lebih lanjut untuk memperbaiki atau mengatasi asumsi yang tidak terpenuhi tersebut. # DAFTAR PUSTAKA BJohnson, M., & Smith, A. (2020). Regression Analysis: A Comprehensive Overview. Journal of Statistical Analysis.

Brown, R., & Davis, M. (2019). Applications of Regression Analysis in Social Sciences. Social Science Research Review