Metode yang saya gunakan dalam contoh sintaks R Markdown di atas adalah regresi linier sederhana. Regresi linier adalah teknik statistik yang digunakan untuk memodelkan hubungan antara variabel dependen (response variable) dan satu atau lebih variabel independen (predictor variables). Tujuan dari regresi linier adalah untuk menemukan garis regresi yang terbaik yang dapat digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai-nilai variabel independen.
Berikut adalah deskripsi dari sintaks R Markdown tersebut:
ggplot2
dan
lmtest
. Library
ggplot2
digunakan untuk membuat grafik,
sementara lmtest
digunakan untuk melakukan
uji signifikansi koefisien regresi.ggplot()
untuk membuat grafik sebaran
data. Grafik ini membantu visualisasi hubungan antara variabel
independen dan variabel dependen.lm()
untuk melakukan analisis regresi.
Fungsi ini membangun model regresi linier sederhana dengan variabel
dependen (variabel_dependen
) dan variabel
independen (variabel_independen
).summary()
untuk
menampilkan ringkasan model regresi. Ringkasan ini mencakup informasi
tentang koefisien regresi, kesalahan standar, statistik t, dan
nilai-nilai p untuk masing-masing variabel independen.coeftest()
dari paket
lmtest
untuk melakukan pengujian
signifikansi koefisien regresi. Fungsi ini memberikan statistik t dan
nilai-nilai p untuk masing-masing koefisien regresi, yang membantu
menentukan apakah koefisien tersebut secara signifikan berbeda dari
nol.Dengan menggunakan sintaks R Markdown tersebut, dapat dilakukan analisis regresi, memvisualisasikan data, dan mendapatkan ringkasan model serta uji signifikansi koefisien regresi dengan mudah.
library(ggplot2)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(readxl)
data <- read_excel("~/Downloads/SIM.xlsx")
library(ggplot2)
ggplot(data, aes(x = data$Adult_mortality, y = data$Life_expectancy)) +
geom_point(colour='pink',size=1) +
labs(x = "Under_five_deaths", y = "Adult_mortality") +
ggtitle("Sebaran Data")
## Warning: Use of `data$Adult_mortality` is discouraged.
## ℹ Use `Adult_mortality` instead.
## Warning: Use of `data$Life_expectancy` is discouraged.
## ℹ Use `Life_expectancy` instead.
reg_model <- lm(data$Life_expectancy ~ data$Adult_mortality+data$Infant_deaths, data = data)
summary(reg_model)
##
## Call:
## lm(formula = data$Life_expectancy ~ data$Adult_mortality + data$Infant_deaths,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.6138 -0.9829 -0.0575 1.0495 6.2735
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 82.7548794 0.0594099 1392.95 <2e-16 ***
## data$Adult_mortality -0.0475870 0.0004291 -110.89 <2e-16 ***
## data$Infant_deaths -0.1564400 0.0017907 -87.36 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.602 on 2861 degrees of freedom
## Multiple R-squared: 0.971, Adjusted R-squared: 0.971
## F-statistic: 4.793e+04 on 2 and 2861 DF, p-value: < 2.2e-16
coeftest(reg_model)
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 82.75487941 0.05940986 1392.949 < 2.2e-16 ***
## data$Adult_mortality -0.04758703 0.00042915 -110.887 < 2.2e-16 ***
## data$Infant_deaths -0.15644003 0.00179074 -87.361 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dihasilkan persamaan regresi
Dengan X1 adalah Adult_Mortality dan X2 adalah Infant_deaths
Sehingga dapat disimpulkan bahwa variabel dependen Y:Life_expentacy bernilai 82.75487941 . Jika Adult_Mortality dan Infant_deaths bernilai 0. Nilai Y tersebut akan bertambah seiring bertambahnya variabel X1 dan X2. Jika X1 bertambah 1 maka nilai Y berkurang 0.04758703 dan berlaku kelipatannya. Jika X2 bertambah 1 maka nilai Y berkurang 0.15644003 dan berlaku kelipatannya.