DESKRIPSI

Metode yang saya gunakan dalam contoh sintaks R Markdown di atas adalah regresi linier sederhana. Regresi linier adalah teknik statistik yang digunakan untuk memodelkan hubungan antara variabel dependen (response variable) dan satu atau lebih variabel independen (predictor variables). Tujuan dari regresi linier adalah untuk menemukan garis regresi yang terbaik yang dapat digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai-nilai variabel independen.

Berikut adalah deskripsi dari sintaks R Markdown tersebut:

  1. Memuat library: Dalam sintaks R Markdown pertama, kita memuat library yang diperlukan untuk analisis regresi, yaitu ggplot2 dan lmtest. Library ggplot2 digunakan untuk membuat grafik, sementara lmtest digunakan untuk melakukan uji signifikansi koefisien regresi.
  2. Membaca dataset: Langkah selanjutnya adalah membaca dataset yang akan digunakan dalam analisis regresi. Dataset tersebut diambil dari file dengan format CSV dan diberikan nama “nama_file.csv”. Pastikan file tersebut berada di direktori kerja yang sama dengan file R Markdown.
  3. Menampilkan grafik sebaran data: Setelah membaca dataset, sintaks R Markdown selanjutnya menggunakan fungsi ggplot() untuk membuat grafik sebaran data. Grafik ini membantu visualisasi hubungan antara variabel independen dan variabel dependen.
  4. Melakukan analisis regresi: Pada tahap ini, kita menggunakan fungsi lm() untuk melakukan analisis regresi. Fungsi ini membangun model regresi linier sederhana dengan variabel dependen (variabel_dependen) dan variabel independen (variabel_independen).
  5. Menampilkan ringkasan model: Sintaks R Markdown selanjutnya menggunakan fungsi summary() untuk menampilkan ringkasan model regresi. Ringkasan ini mencakup informasi tentang koefisien regresi, kesalahan standar, statistik t, dan nilai-nilai p untuk masing-masing variabel independen.
  6. Uji signifikansi koefisien regresi: Terakhir, kita menggunakan fungsi coeftest() dari paket lmtest untuk melakukan pengujian signifikansi koefisien regresi. Fungsi ini memberikan statistik t dan nilai-nilai p untuk masing-masing koefisien regresi, yang membantu menentukan apakah koefisien tersebut secara signifikan berbeda dari nol.

Dengan menggunakan sintaks R Markdown tersebut, dapat dilakukan analisis regresi, memvisualisasikan data, dan mendapatkan ringkasan model serta uji signifikansi koefisien regresi dengan mudah.

Memuat library yang diperlukan

library(ggplot2)
library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(readxl)

Membaca dataset

data <- read_excel("~/Downloads/SIM.xlsx")

Menampilkan grafik sebaran data

library(ggplot2)
ggplot(data, aes(x = data$Adult_mortality, y = data$Life_expectancy)) +
  geom_point(colour='pink',size=1) +
  labs(x = "Under_five_deaths", y = "Adult_mortality") +
  ggtitle("Sebaran Data")
## Warning: Use of `data$Adult_mortality` is discouraged.
## ℹ Use `Adult_mortality` instead.
## Warning: Use of `data$Life_expectancy` is discouraged.
## ℹ Use `Life_expectancy` instead.

Melakukan analisis regresi

reg_model <- lm(data$Life_expectancy ~ data$Adult_mortality+data$Infant_deaths, data = data)

Menampilkan ringkasan model

summary(reg_model)
## 
## Call:
## lm(formula = data$Life_expectancy ~ data$Adult_mortality + data$Infant_deaths, 
##     data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.6138 -0.9829 -0.0575  1.0495  6.2735 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          82.7548794  0.0594099 1392.95   <2e-16 ***
## data$Adult_mortality -0.0475870  0.0004291 -110.89   <2e-16 ***
## data$Infant_deaths   -0.1564400  0.0017907  -87.36   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.602 on 2861 degrees of freedom
## Multiple R-squared:  0.971,  Adjusted R-squared:  0.971 
## F-statistic: 4.793e+04 on 2 and 2861 DF,  p-value: < 2.2e-16

Uji signifikansi koefisien regresi

coeftest(reg_model)
## 
## t test of coefficients:
## 
##                         Estimate  Std. Error  t value  Pr(>|t|)    
## (Intercept)          82.75487941  0.05940986 1392.949 < 2.2e-16 ***
## data$Adult_mortality -0.04758703  0.00042915 -110.887 < 2.2e-16 ***
## data$Infant_deaths   -0.15644003  0.00179074  -87.361 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

INTERPRETASI

Dihasilkan persamaan regresi

Y = 82.75487941 - 0,04758703 X1 - 0, 15644003 X2

Dengan X1 adalah Adult_Mortality dan X2 adalah Infant_deaths

Sehingga dapat disimpulkan bahwa variabel dependen Y:Life_expentacy bernilai 82.75487941 . Jika Adult_Mortality dan Infant_deaths bernilai 0. Nilai Y tersebut akan bertambah seiring bertambahnya variabel X1 dan X2. Jika X1 bertambah 1 maka nilai Y berkurang 0.04758703 dan berlaku kelipatannya. Jika X2 bertambah 1 maka nilai Y berkurang 0.15644003 dan berlaku kelipatannya.