Analisis Regresi dan Uji Asumsi Pengaruh Konsumsi Alkohol Terhadap Prevelensi Obesitas Pada Usia Umur 18 Tahun

Dyah Kusumawardani

1 Juni 2023


1 PENDAHULUAN

1.1 Latar Belakang

Obesitas merupakan masalah kesehatan global yang semakin meningkat, termasuk pada usia muda. Tingginya prevalensi obesitas pada usia 18 tahun dapat berdampak negatif pada kesehatan dan kualitas hidup individu tersebut. Oleh karena itu, penting untuk memahami faktor-faktor yang dapat mempengaruhi prevalensi obesitas pada kelompok usia ini.

Konsumsi alkohol telah dikaitkan dengan peningkatan risiko obesitas pada populasi umum. Alkohol mengandung kalori tinggi dan dapat menyebabkan peningkatan asupan energi, yang pada gilirannya dapat berkontribusi pada peningkatan berat badan dan risiko obesitas. Namun, penelitian yang khusus mempelajari hubungan antara konsumsi alkohol dan prevalensi obesitas pada usia 18 tahun masih terbatas.

Penelitian ini memiliki implikasi penting dalam bidang kesehatan masyarakat. Jika hubungan antara konsumsi alkohol dan prevalensi obesitas pada usia 18 tahun dapat dikonfirmasi, langkah-langkah pencegahan yang lebih efektif dapat diambil untuk mengurangi risiko obesitas di kalangan remaja. Dengan memahami peran konsumsi alkohol, pengembangan program intervensi yang ditargetkan dapat dilakukan untuk mencegah atau mengurangi kejadian obesitas pada kelompok usia ini.

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis regresi adalah metode statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen (variabel penjelas) dengan variabel dependen (variabel yang ingin diprediksi atau dijelaskan). Tujuan analisis regresi adalah untuk mengidentifikasi dan mengukur sejauh mana variabel penjelas mempengaruhi atau menjelaskan variasi dalam variabel dependen.

Dalam analisis regresi, variabel dependen dianggap sebagai variabel respon atau variabel terikat, sedangkan variabel independen dianggap sebagai variabel penjelas atau variabel bebas. Analisis regresi bertujuan untuk mengestimasi parameter-parameter regresi yang menunjukkan seberapa besar pengaruh variabel penjelas terhadap variabel dependen.

Ada beberapa jenis analisis regresi yang umum digunakan, termasuk regresi linear sederhana, regresi linear berganda, regresi logistik, regresi nonparametrik, dan sebagainya. Di bawah ini adalah penjelasan singkat tentang analisis regresi linear sederhana, yang merupakan salah satu jenis yang paling umum:

Analisis Regresi Linear Sederhana: Dalam analisis regresi linear sederhana, terdapat satu variabel independen (X) dan satu variabel dependen (Y). Tujuan adalah untuk menemukan garis regresi yang paling baik mewakili hubungan linier antara X dan Y.

Rumus Analisis Regresi Linear Sederhana: Model regresi linear sederhana dinyatakan dalam persamaan umum:

Y = a + bX + ε

  • Y adalah variabel dependen (variabel yang ingin diprediksi atau dijelaskan).

  • X adalah variabel independen (variabel penjelas).

  • a adalah intercept (nilai Y ketika X = 0).

  • b adalah koefisien regresi (menunjukkan perubahan dalam Y yang terkait dengan perubahan dalam X).

  • ε adalah galat (perbedaan antara nilai aktual Y dan nilai yang diprediksi oleh model).

2.2 Uji Asumsi Shapiro-Wilk

Uji asumsi Shapiro-Wilk adalah uji statistik yang digunakan untuk menguji asumsi normalitas pada sampel data. Uji ini secara khusus digunakan untuk menguji apakah sampel data berasal dari populasi yang terdistribusi secara normal.

Uji Shapiro-Wilk didasarkan pada statistik uji yang menggunakan koefisien korelasi antara variabel asli dan variabel yang diurutkan. Uji ini menguji hipotesis nol bahwa sampel data berasal dari populasi yang terdistribusi normal.

Rumusnya adalah sebagai berikut:

  1. Menyusun hipotesis nol (H0) dan hipotesis alternatif (H1):

    • H0: Sampel data berasal dari populasi yang terdistribusi normal.
    • H1: Sampel data tidak berasal dari populasi yang terdistribusi normal.
  2. Mengurutkan data:

    • Urutkan data secara ascending (dari terkecil ke terbesar).
  3. Menghitung koefisien korelasi antara variabel asli dan variabel yang diurutkan:

    • Hitung nilai Z untuk setiap observasi dengan menggunakan formula

    Z = Φ^-1[(i - 0.375) / (n + 0.25)],

    di mana Φ^-1 adalah fungsi invers dari fungsi distribusi normal standar, i adalah urutan observasi, dan n adalah ukuran sampel.

    • Hitung koefisien korelasi (r) antara data asli dan nilai Z yang telah dihitung.
  4. Menghitung statistik uji Shapiro-Wilk (W):

    • Hitung W dengan menggunakan rumus

    W = (Σa_iZ_i)^2 / Σ(Z_i - Z_bar)^2, di mana a_i adalah koefisien dari matriks untuk sampel dengan ukuran tertentu,

    Z_i adalah nilai Z yang telah dihitung untuk setiap observasi,

    Z_bar adalah nilai rata-rata dari Z_i.

  5. Membandingkan statistik uji dengan nilai kritis:

    • Nilai kritis untuk uji Shapiro-Wilk harus dicari dari tabel distribusi Shapiro-Wilk sesuai dengan ukuran sampel dan tingkat signifikansi yang ditentukan sebelumnya.
    • Jika nilai statistik uji (W) lebih kecil dari nilai kritis, maka hipotesis nol diterima, yang berarti data cukup konsisten dengan distribusi normal.
    • Jika nilai statistik uji (W) lebih besar dari nilai kritis, maka hipotesis nol ditolak, yang berarti terdapat cukup bukti untuk menyimpulkan bahwa data tidak mengikuti distribusi normal.

2.3 Uji Korelasi Rank Spearman

Uji Rank Spearman adalah metode statistik nonparametrik yang digunakan untuk mengukur hubungan monoton antara dua variabel. Ini adalah alternatif nonparametrik untuk uji korelasi Pearson yang digunakan untuk data berdistribusi tidak normal atau ketika asumsi tentang linearitas dan homoskedastisitas tidak terpenuhi.

Untuk melakukan uji korelasi rank Spearman dengan menggunakan uji t untuk mendeteksi heteroskedastisitas, berikut adalah langkah-langkah yang dapat Anda ikuti:

  1. Dapatkan data Anda yang terdiri dari pasangan pengamatan untuk variabel prediktor (X) dan variabel respons (Y).

  2. Hitung peringkat untuk kedua variabel (X dan Y) menggunakan metode peringkat yang sesuai. Jika ada nilai yang sama, berikan peringkat rata-rata.

  3. Hitung nilai Ŷ (nilai prediksi) menggunakan model regresi yang sesuai. Ini melibatkan mengestimasi koefisien regresi dan mengalikan setiap nilai X dengan koefisien regresi yang sesuai, kemudian menjumlahkannya.

  4. Hitung residual (e) dengan mengurangi nilai Y yang diamati dengan nilai Ŷ yang diprediksi. Residual adalah selisih antara nilai observasi dan nilai prediksi.

    e = Y - Ŷ

  5. Ambil nilai absolut dari setiap residual untuk mendapatkan nilai residual yang dimutlakkan.

  6. Urutkan nilai residual yang telah dimutlakkan dari yang terkecil hingga yang terbesar.

  7. Hitung koefisien korelasi Spearman (ρ) antara nilai residual yang telah dimutlakkan dan variabel prediktor (X) menggunakan rumus yang telah dijelaskan sebelumnya.

  8. Gunakan uji t untuk menguji hipotesis nol (H0: tidak terjadi heteroskedastisitas) melawan hipotesis alternatif (H1: terjadi heteroskedastisitas). Anda akan membandingkan statistik uji t yang dihitung dengan nilai kritis dari distribusi t dengan derajat kebebasan yang sesuai. Nilai kritis dapat ditemukan dalam tabel distribusi t.

  9. Jika nilai statistik uji t yang dihitung lebih besar dari nilai kritis dari distribusi t, maka H0 ditolak, yang menunjukkan adanya heteroskedastisitas.

Harap dicatat bahwa uji korelasi rank Spearman tidak secara langsung menguji heteroskedastisitas. Langkah-langkah di atas menggabungkan uji korelasi rank Spearman dengan pengujian heteroskedastisitas menggunakan uji t berdasarkan residual.

2.4 Uji Asumsi Non Autokorelasi Breusch-Godfrey

Uji Asumsi Non Autokorelasi Breusch-Godfrey adalah metode statistik yang digunakan untuk mendeteksi keberadaan autokorelasi pada residual dalam model regresi. Autokorelasi terjadi ketika ada ketergantungan antara residual pada waktu sekarang dengan residual pada waktu sebelumnya.

Hipotesis untuk Uji Breusch-Godfrey:

  • Hipotesis Nol (H0): Tidak ada autokorelasi pada residual.

  • Hipotesis Alternatif (H1): Terdapat autokorelasi pada residual.

Fungsi Uji Breusch-Godfrey: Uji Breusch-Godfrey digunakan untuk menguji hipotesis tentang keberadaan autokorelasi dengan memperluas model regresi asli dengan menambahkan variabel dummy yang merupakan hasil regresi residual sebelumnya.

Rumus Uji Breusch-Godfrey:

  1. Lakukan estimasi regresi model asli dan peroleh residual (ê).

  2. Estimasi regresi residual (ê) menggunakan variabel dummy yang merupakan hasil regresi residual sebelumnya. Misalnya, jika model asli adalah Y = β0 + β1X1 + β2X2 + ε, tambahkan variabel dummy ê = δ0 + δ1ê_1 + δ2X1 + δ3X2 + ν, di mana ê_1 adalah residual sebelumnya.

  3. Hitung nilai statistik uji chi-square dengan rumus:

    chi-square = n * R^2

    Di mana:

    • n adalah jumlah pengamatan atau ukuran sampel.

    • R^2 adalah koefisien determinasi dari regresi residual tambahan.

  4. Bandingkan nilai statistik uji chi-square yang dihitung dengan nilai kritis dari distribusi chi-square dengan derajat kebebasan yang sesuai. Nilai kritis dapat ditemukan dalam tabel distribusi chi-square.

  5. Jika nilai statistik uji chi-square yang dihitung lebih besar dari nilai kritis dari distribusi chi-square, maka H0 ditolak, yang menunjukkan adanya autokorelasi pada residual.

Uji Breusch-Godfrey merupakan salah satu metode yang umum digunakan untuk mendeteksi autokorelasi pada residual dalam model regresi.

2.5 Uji Asumsi Non Multikolinearitas Matriks Korelasi

Uji Asumsi Non Multikolinearitas menggunakan Matriks Korelasi adalah metode statistik yang digunakan untuk mendeteksi keberadaan multikolinearitas antara variabel independen dalam model regresi. Multikolinearitas terjadi ketika terdapat korelasi tinggi antara dua atau lebih variabel independen.

Hipotesis untuk Uji Asumsi Non Multikolinearitas:

  • Hipotesis Nol (H0): Tidak ada multikolinearitas antara variabel independen.

  • Hipotesis Alternatif (H1): Terdapat multikolinearitas antara variabel independen.

Fungsi Uji Asumsi Non Multikolinearitas Matriks Korelasi:

Uji ini digunakan untuk memeriksa hubungan linier antara setiap pasang variabel independen dengan menghitung matriks korelasi. Korelasi yang tinggi antara variabel independen menunjukkan adanya multikolinearitas.

Rumus Uji Asumsi Non Multikolinearitas Matriks Korelasi:

  1. Dapatkan data Anda yang terdiri dari variabel independen (X1, X2, …, Xn) dan variabel dependen (Y).

  2. Hitung matriks korelasi antara variabel independen menggunakan rumus korelasi Pearson:

    Corr(Xi, Xj) = Cov(Xi, Xj) / (SD(Xi) * SD(Xj))

    Di mana:

    • Corr(Xi, Xj) adalah koefisien korelasi antara variabel independen Xi dan Xj.
    • Cov(Xi, Xj) adalah kovarians antara variabel independen Xi dan Xj.
    • SD(Xi) dan SD(Xj) adalah simpangan baku (standar deviation) dari variabel independen Xi dan Xj, masing-masing.
  3. Periksa matriks korelasi untuk menemukan nilai korelasi yang tinggi antara pasangan variabel independen. Korelasi yang tinggi biasanya didefinisikan sebagai nilai yang melebihi ambang batas tertentu (misalnya, 0.7 atau 0.8).

Cara Pengambilan Keputusan:

  • Jika tidak ada nilai korelasi yang tinggi antara pasangan variabel independen (semua koefisien korelasi rendah), maka H0 (tidak ada multikolinearitas) diterima.

  • Jika terdapat nilai korelasi yang tinggi antara pasangan variabel independen, maka ada indikasi adanya multikolinearitas.

    • Dapat mengambil keputusan untuk menghilangkan salah satu variabel yang korrelasinya paling tinggi atau melakukan transformasi variabel untuk mengurangi multikolinearitas.

    • Jika multikolinearitas terlalu kuat atau mengganggu interpretasi hasil, mungkin perlu merevisi model regresi atau mencari variabel yang lebih independen.

Uji Asumsi Non Multikolinearitas menggunakan Matriks Korelasi adalah salah satu metode yang umum digunakan untuk mendeteksi multikolinearitas dalam model regresi. Keputusan tentang keberadaan multikolinearitas harus dipertimbangkan dengan hati-hati dan dapat melibatkan modifikasi model regresi untuk memastikan hasil yang akurat dan dapat diinterpretasikan dengan baik.

3 SOURCE CODE

3.1 Analisis Regresi

# Membuat dataframe dari data
data <- data.frame(
  Klasifikasi = c("Perkotaan", "Perdesaan", "Perkotaan+Perdesaan"),
  Prevalensi_Obesitas = c(39.7, 30.0, 35.4),
  Konsumsi_Alkohol = c(0.28, 0.72, 0.48)
)
data
##           Klasifikasi Prevalensi_Obesitas Konsumsi_Alkohol
## 1           Perkotaan                39.7             0.28
## 2           Perdesaan                30.0             0.72
## 3 Perkotaan+Perdesaan                35.4             0.48
# Menjalankan analisis regresi
regression_model <- lm(Prevalensi_Obesitas ~ Konsumsi_Alkohol, data = data)

# Menampilkan ringkasan hasil analisis regresi
summary(regression_model)
## 
## Call:
## lm(formula = Prevalensi_Obesitas ~ Konsumsi_Alkohol, data = data)
## 
## Residuals:
##        1        2        3 
## -0.03956 -0.03297  0.07253 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)   
## (Intercept)       45.9165     0.1499  306.28  0.00208 **
## Konsumsi_Alkohol -22.0604     0.2855  -77.27  0.00824 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08895 on 1 degrees of freedom
## Multiple R-squared:  0.9998, Adjusted R-squared:  0.9997 
## F-statistic:  5970 on 1 and 1 DF,  p-value: 0.008239

Pada syntax di atas, kita membuat dataframe data yang berisi variabel Klasifikasi, Prevalensi_Obesitas, dan Konsumsi_Alkohol. Kemudian, kita menjalankan analisis regresi dengan menggunakan fungsi lm() yang mengambil variabel dependen (Prevalensi_Obesitas) dan variabel independen (Konsumsi_Alkohol) serta data dari dataframe data. Hasil analisis regresi disimpan dalam objek regression_model. Terakhir, kita menampilkan ringkasan hasil analisis regresi dengan menggunakan fungsi summary().

3.2 Uji Asumsi Shapiro-Wilk

# Membuat dataframe dari data
data <- data.frame(
  Klasifikasi = c("Perkotaan", "Perdesaan", "Perkotaan+Perdesaan"),
  Prevalensi_Obesitas = c(39.7, 30.0, 35.4),
  Konsumsi_Alkohol = c(0.28, 0.72, 0.48)
)
data
##           Klasifikasi Prevalensi_Obesitas Konsumsi_Alkohol
## 1           Perkotaan                39.7             0.28
## 2           Perdesaan                30.0             0.72
## 3 Perkotaan+Perdesaan                35.4             0.48
# Melakukan uji Shapiro-Wilk pada variabel Prevalensi_Obesitas
shapiro_test <- shapiro.test(data$Prevalensi_Obesitas)

# Menampilkan hasil uji Shapiro-Wilk
print(shapiro_test)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Prevalensi_Obesitas
## W = 0.99573, p-value = 0.8751

Pada syntax di atas, kita membuat dataframe data yang berisi variabel Klasifikasi, Prevalensi_Obesitas, dan Konsumsi_Alkohol. Kemudian, kita melakukan uji Shapiro-Wilk pada variabel Prevalensi_Obesitas menggunakan fungsi shapiro.test(), dengan argumen data$Prevalensi_Obesitas untuk mengambil kolom yang sesuai dari dataframe data. Hasil uji Shapiro-Wilk disimpan dalam objek shapiro_test. Terakhir, kita menampilkan hasil uji Shapiro-Wilk dengan menggunakan fungsi print().

3.3 Uji Korelasi Rank Spearman

# Membuat data frame
data <- data.frame(
  Klasifikasi = c("Perkotaan", "Perdesaan", "Perkotaan+Perdesaan"),
  Prevalensi_Obesitas = c(39.7, 30.0, 35.4),
  Konsumsi_Alkohol = c(0.28, 0.72, 0.48)
)
data
##           Klasifikasi Prevalensi_Obesitas Konsumsi_Alkohol
## 1           Perkotaan                39.7             0.28
## 2           Perdesaan                30.0             0.72
## 3 Perkotaan+Perdesaan                35.4             0.48
# Melakukan uji korelasi Rank Spearman
result <- cor.test(data$Prevalensi_Obesitas, data$Konsumsi_Alkohol, method = "spearman")

# Menampilkan hasil uji korelasi
print(result)
## 
##  Spearman's rank correlation rho
## 
## data:  data$Prevalensi_Obesitas and data$Konsumsi_Alkohol
## S = 8, p-value = 0.3333
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho 
##  -1

Pada contoh di atas, data frame dibuat terlebih dahulu dengan menggunakan fungsi data.frame() dan kemudian dijalankan uji korelasi Rank Spearman dengan fungsi cor.test() dengan argumen method = "spearman". Hasil uji korelasi akan disimpan dalam variabel result. Terakhir, hasil uji korelasi dapat ditampilkan dengan menggunakan fungsi print().

Dalam output uji korelasi, Anda akan melihat nilai statistik uji (Spearman’s rho), nilai p-value, dan hipotesis nol (H0) yang dapat digunakan untuk mengambil kesimpulan tentang signifikansi korelasi.

3.4 Uji Asumsi Non Autokorelasi Breusch-Godfrey

# Memuat paket lmtest
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
# Membuat data frame
data <- data.frame(
  Klasifikasi = c("Perkotaan", "Perdesaan", "Perkotaan+Perdesaan"),
  Prevalensi_Obesitas = c(39.7, 30.0, 35.4),
  Konsumsi_Alkohol = c(0.28, 0.72, 0.48)
)

# Membuat model regresi
model <- lm(Prevalensi_Obesitas ~ Konsumsi_Alkohol, data = data)

# Melakukan uji Breusch-Godfrey
result <- bgtest(model, order = 1)

# Menampilkan hasil uji Breusch-Godfrey
print(result)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  model
## LM test = 3, df = 1, p-value = 0.08326

Pada contoh di atas, data frame data dibuat terlebih dahulu dengan menggunakan fungsi data.frame(). Selanjutnya, model regresi dibuat dengan menggunakan fungsi lm() dengan variabel dependen Prevalensi_Obesitas dan variabel independen Konsumsi_Alkohol. Setelah itu, fungsi bgtest() dari paket lmtest digunakan untuk melakukan uji Breusch-Godfrey pada model regresi dengan menggunakan argumen order = 1 untuk menguji autokorelasi hingga lag 1. Hasil uji Breusch-Godfrey akan disimpan dalam variabel result. Terakhir, hasil uji Breusch-Godfrey dapat ditampilkan dengan menggunakan fungsi print().

Output dari uji Breusch-Godfrey akan menampilkan nilai statistik uji Breusch-Godfrey dan p-value. Jika p-value signifikan, artinya terdapat bukti statistik yang cukup untuk menolak hipotesis nol dan menyimpulkan adanya autokorelasi pada residu model regresi.

3.5 Uji Non Multikolinearitas Matriks Korelasi

# Membuat data frame
data <- data.frame(
  Klasifikasi = c("Perkotaan", "Perdesaan", "Perkotaan+Perdesaan"),
  Prevalensi_Obesitas = c(39.7, 30.0, 35.4),
  Konsumsi_Alkohol = c(0.28, 0.72, 0.48)
)
data
##           Klasifikasi Prevalensi_Obesitas Konsumsi_Alkohol
## 1           Perkotaan                39.7             0.28
## 2           Perdesaan                30.0             0.72
## 3 Perkotaan+Perdesaan                35.4             0.48
# Menghitung matriks korelasi
cor_matrix <- cor(data[, c("Prevalensi_Obesitas", "Konsumsi_Alkohol")])

# Menampilkan matriks korelasi
print(cor_matrix)
##                     Prevalensi_Obesitas Konsumsi_Alkohol
## Prevalensi_Obesitas           1.0000000       -0.9999163
## Konsumsi_Alkohol             -0.9999163        1.0000000

Pada contoh di atas, data frame data dibuat terlebih dahulu dengan menggunakan fungsi data.frame(). Selanjutnya, matriks korelasi dihitung dengan menggunakan fungsi cor() pada subset data yang terdiri dari variabel Prevalensi_Obesitas dan Konsumsi_Alkohol. Hasil matriks korelasi akan disimpan dalam variabel cor_matrix. Terakhir, hasil matriks korelasi dapat ditampilkan dengan menggunakan fungsi print().

Output dari uji matriks korelasi akan menampilkan angka korelasi antara variabel-variabel yang ada. Nilai korelasi berkisar antara -1 hingga 1, di mana nilai 1 menunjukkan korelasi positif sempurna, nilai -1 menunjukkan korelasi negatif sempurna, dan nilai 0 menunjukkan tidak adanya korelasi linier antara variabel tersebut.

4 HASIL DAN PEMBAHASAN

4.1 Analisis Regresi

Perhitungan manual analisis regresi:

  1. Membuat Tabel Data:
Klasifikasi Prevalensi Obesitas Konsumsi Alkohol
Perkotaan 39.7 0.28
Perdesaan 30.0 0.72
Perkotaan+Perdesaan 35.4 0.48
  1. Menghitung Rata-rata:

    • Rata-rata Prevalensi Obesitas (Ȳ) = (39.7 + 30.0 + 35.4) / 3 = 35.03
    • Rata-rata Konsumsi Alkohol (X̄) = (0.28 + 0.72 + 0.48) / 3 = 0.4933
  2. Menghitung Variasi dan Kovarian:

    • Variasi Prevalensi Obesitas (SYY) = [(39.7 - 35.03)^2 + (30.0 - 35.03)^2 + (35.4 - 35.03)^2] / 2 = 68.0706
    • Variasi Konsumsi Alkohol (SXX) = [(0.28 - 0.4933)^2 + (0.72 - 0.4933)^2 + (0.48 - 0.4933)^2] / 2 = 0.0352413
    • Kovarian (SXY) = [(39.7 - 35.03)(0.28 - 0.4933) + (30.0 - 35.03)(0.72 - 0.4933) + (35.4 - 35.03)(0.48 - 0.4933)] / 2 = -1.2966
  3. Menghitung Koefisien Regresi:

    • Koefisien Regresi (b1) = SXY / SXX = -1.2966 / 0.0352413 = -36.8176
  4. Menghitung Konstanta:

    • Konstanta (b0) = Ȳ - b1 * X̄ = 35.03 - (-36.8176 * 0.4933) = 53.0015
  5. Persamaan Regresi:

    • Persamaan Regresi Y = b0 + b1 * X = 53.0015 - 36.8176 * X

Dengan demikian, hasil perhitungan analisis regresi untuk data yang diberikan adalah persamaan regresi Y = 53.0015 - 36.8176 * X, di mana Y adalah Prevalensi Obesitas dan X adalah Konsumsi Alkohol.

4.2 Uji Asumsi Shapiro-Wilk

Perhitungan manual uji asumsi Shapiro-Wilk:

    1. Membuat Tabel Data dan Mengurutkan Data:
Klasifikasi Prevalensi Obesitas Konsumsi Alkohol
Perkotaan 39.7 0.28
Perdesaan 30.0 0.72
Perkotaan+Perdesaan 35.4 0.48
  • Prevalensi Obesitas: 30.0, 35.4, 39.7
  • Konsumsi Alkohol: 0.28, 0.48, 0.72
  1. Menghitung Rata-rata dan Deviasi Standar:

    • Rata-rata Prevalensi Obesitas (Ȳ) = (30.0 + 35.4 + 39.7) / 3 = 35.03

    • Deviasi Standar Prevalensi Obesitas (sY) = √[((30.0 - 35.03)^2 + (35.4 - 35.03)^2 + (39.7 - 35.03)^2) / 2] = 4.421

    • Rata-rata Konsumsi Alkohol (X̄) = (0.28 + 0.48 + 0.72) / 3 = 0.4933

    • Deviasi Standar Konsumsi Alkohol (sX) = √[((0.28 - 0.4933)^2 + (0.48 - 0.4933)^2 + (0.72 - 0.4933)^2) / 2] = 0.2287

  2. Menghitung Peringkat:

    • Prevalensi Obesitas: 1, 2, 3
    • Konsumsi Alkohol: 1, 3, 2
  3. Menghitung Koefisien Korelasi:

    • Koefisien Korelasi (r) = [Σ(Prevalensi Obesitas - Ȳ)(Konsumsi Alkohol - X̄)] / √[Σ(Prevalensi Obesitas - Ȳ)^2 * Σ(Konsumsi Alkohol - X̄)^2]

                         = [(1 * (30.0 - 35.03) * (1 * (0.28 - 0.4933)) + (2 * (35.4 - 35.03) * (3 * (0.72 - 0.4933)) + (3 * (39.7 - 35.03) * (2 * (0.48 - 0.4933))] / √[(1 * (30.0 - 35.03)^2 + (2 * (35.4 - 35.03)^2 + (3 * (39.7 - 35.03)^2) * (1 * (0.28 - 0.4933)^2 + (3 * (0.72 - 0.4933)^2 + (2 * (0.48 - 0.4933)^2)]
      
                         = -0.961
  4. Menghitung Statistik Uji Shapiro-Wilk (W):

    • Statistik Uji Shapiro-Wilk (W) = (r^2) / (1 - r^2) = (-0.961)^2 / (1 - (-0.961)^2) = 0.944
  5. Membandingkan Statistik Uji dengan Tabel:

    • Dengan ukuran sampel n = 3, tingkat signifikansi α = 0.05, dan menggunakan tabel distribusi Shapiro-Wilk, kita dapat melihat bahwa nilai kritis untuk W adalah sekitar 0.775.
  6. Kesimpulan:

    • Karena nilai W (0.944) lebih besar dari nilai kritis (0.775), maka hipotesis nol diterima. Artinya, data tidak menunjukkan deviasi signifikan dari distribusi normal.

Dengan demikian, berdasarkan perhitungan manual uji asumsi Shapiro-Wilk untuk data yang diberikan, dapat disimpulkan bahwa data Klasifikasi, Prevalensi Obesitas, dan Konsumsi Alkohol tidak menunjukkan deviasi signifikan dari distribusi normal.

4.3 Uji Korelasi Rank Spearman

Uji Rank Spearman secara manual:

  1. Perhitungan:
  • Susun data dalam bentuk tabel yang terdiri dari dua variabel:
Klasifikasi   Prevalensi_Obesitas   Konsumsi_Alkohol
Perkotaan     39.7                  0.28
Perdesaan     30.0                  0.72
Perkotaan+Perdesaan   35.4          0.48
  • Berdasarkan data, kita perlu menghitung peringkat (rank) untuk kedua variabel.
Klasifikasi   Prevalensi_Obesitas_Rank   Konsumsi_Alkohol_Rank
Perkotaan     3                         1
Perdesaan     1                         3
Perkotaan+Perdesaan   2                2
  • Selanjutnya, hitung perbedaan peringkat (d) antara kedua variabel.
Klasifikasi   Prevalensi_Obesitas_Rank   Konsumsi_Alkohol_Rank   d
Perkotaan     3                         1                       2
Perdesaan     1                         3                       -2
Perkotaan+Perdesaan   2                2                       0
  • Hitung jumlah kuadrat perbedaan peringkat (Σ(d^2)).
Σ(d^2) = (2^2) + (-2^2) + (0^2) = 4 + 4 + 0 = 8
  • Hitung jumlah pengamatan (n).
n = 3
  • Hitung nilai uji Rank Spearman (rho) menggunakan rumus:
rho = 1 - (6 * Σ(d^2)) / (n * (n^2 - 1))
    = 1 - (6 * 8) / (3 * (3^2 - 1))
    = 1 - (48) / (3 * 8)
    = 1 - 48 / 24
    = 1 - 2
    = -1
  1. Hipotesis:
  • Hipotesis nol (H0): Tidak ada korelasi monotik antara Prevalensi Obesitas Pada Penduduk dan Konsumsi Alkohol.

  • Hipotesis alternatif (Ha): Terdapat korelasi monotik antara Prevalensi Obesitas Pada Penduduk dan Konsumsi Alkohol.

  1. Pengambilan keputusan:
  • Tingkat signifikansi α yang digunakan untuk pengujian hipotesis ini.

  • Jika p-value < α, maka H0 ditolak, dan Ha diterima.

  • Jika p-value ≥ α, maka tidak cukup bukti untuk menolak H0, dan Ha ditolak.

Dalam kasus ini, dengan nilai uji Rank Spearman sebesar -1, kita dapat mengambil keputusan bahwa terdapat korelasi monotik negatif sempurna antara Prevalensi Obesitas Pada Penduduk dan Konsumsi Alkohol.

4.4 Uji Asumsi Non Autokorelasi Breusch-Godfrey

Untuk menguji asumsi non-autokorelasi menggunakan metode Breusch-Godfrey, kita perlu melakukan langkah-langkah berikut:

Langkah 1:

Mengumpulkan data dan melakukan regresi model Berdasarkan data yang diberikan, kita memiliki dua variabel: Prevalensi Obesitas Pada Penduduk (variabel dependen) dan Konsumsi Alkohol (Liter Per Kapita) (variabel independen). Mari kita bangun model regresi:

Prevalensi Obesitas = β0 + β1 * Konsumsi Alkohol

Dalam hal ini, kita memiliki 3 observasi:

Observasi 1: Perkotaan, Prevalensi Obesitas = 39.7, Konsumsi Alkohol = 0.28

Observasi 2: Perdesaan, Prevalensi Obesitas = 30.0, Konsumsi Alkohol = 0.72

Observasi 3: Perkotaan+Perdesaan, Prevalensi Obesitas = 35.4, Konsumsi Alkohol = 0.48

Langkah 2:

Menghitung residual (e) dan residual kuadrat (e^2)

Residual adalah selisih antara nilai aktual Prevalensi Obesitas dengan nilai yang diprediksi oleh model regresi. Mari kita hitung residual untuk setiap observasi:

Observasi 1: e1 = 39.7 - (β0 + β1 * 0.28)

Observasi 2: e2 = 30.0 - (β0 + β1 * 0.72)

Observasi 3: e3 = 35.4 - (β0 + β1 * 0.48)

Kemudian, kita hitung residual kuadrat untuk setiap observasi:

e1^2, e2^2, e3^2

Langkah 3:

Menghitung koefisien determinasi (R^2) Koefisien determinasi (R^2) mengukur sejauh mana variabilitas dalam variabel dependen (Prevalensi Obesitas) dapat dijelaskan oleh variabel independen (Konsumsi Alkohol). R^2 berkisar antara 0 hingga 1, di mana semakin dekat ke 1, semakin baik model dalam menjelaskan variabilitas. Mari kita hitung R^2 menggunakan rumus:

R^2 = 1 - (Σe^2) / (Σ(Prevalensi Obesitas - rata-rata Prevalensi Obesitas)^2)

Langkah 4:

Menghitung uji Breusch-Godfrey Uji Breusch-Godfrey digunakan untuk menguji adanya autokorelasi pada residual.

Hipotesis nol (H0) adalah tidak ada autokorelasi

hipotesis alternatif (H1) adalah ada autokorelasi.

Langkah-langkah selanjutnya untuk menghitung uji Breusch-Godfrey bergantung pada data historis dan kompleksitas model yang digunakan. Dalam kasus ini, karena kita hanya memiliki 3 observasi, sulit untuk menguji autokorelasi dengan uji Breusch-Godfrey.

Dalam kasus ini, disarankan untuk menggunakan lebih banyak data dan menganalisis model regresi dengan lebih komprehensif untuk menguji asumsi

4.5 Uji Asumsi Non Multikolinearitas Matriks Korelasi

Untuk menghitung secara manual asumsi multikolinearitas, kita perlu melakukan langkah-langkah berikut:

Langkah 1: Mengumpulkan data dan membuat matriks korelasi

Berdasarkan data yang diberikan, kita memiliki dua variabel: Prevalensi Obesitas Pada Penduduk dan Konsumsi Alkohol (Liter Per Kapita). Bentuk matriks korelasinya:

Prevalensi Obesitas Konsumsi Alkohol
Perkotaan 39.7 0.28
Perdesaan 30.0 0.72
Perkotaan+Perdesaan 35.4 0.48

Langkah 2:

Menghitung korelasi antara kedua variabel

n = 3

ΣX = 39.7 + 30.0 + 35.4 = 105.1

ΣY = 0.28 + 0.72 + 0.48 = 1.48

ΣXY = (39.7 * 0.28) + (30.0 * 0.72) + (35.4 * 0.48) = 40.6

ΣX^2 = (39.7)^2 + (30.0)^2 + (35.4)^2 = 3,361.85

ΣY^2 = (0.28)^2 + (0.72)^2 + (0.48)^2 = 0.874

r = (3 * 40.6 - 105.1 * 1.48) / √((3 * 3,361.85 - (105.1)^2) * (3 * 0.874 - (1.48)^2))

= 7.2 / √((10085.55 - 11043.01) * (2.622 - 2.1904))

= 7.2 / √((-9557.46) * (0.4316))

= 7.2 / √(-4130.8667)

Karena dalam perhitungan kita mengalami pembagian dengan akar kuadrat dari bilangan negatif, maka nilai korelasi (r) tidak dapat dihitung. Oleh karena itu, tidak mungkin memberikan interpretasi atau mengambil keputusan terkait asumsi multikolinearitas pada data ini.

5 KESIMPULAN

5.1 Analisis Regresi

Berdasarkan Data yang digunakan, diperoleh hasil model regresi linier sebagai berikut: \[ \Y=53.0015-36.8176X1 \] Apabila angka konsumsi alkohol(X1) bernilai 0, maka Presentase prevelensi obesitas sebesar 53.0015. Dengan asumsi angka konsumsi alkohol (X1) adalah bernilai tetap maka setiap penurunan satu persen angka konsumsi alkohol akan meningkatkan presentase prevelensi obesitas sebesar 53.0015.

5.2 Uji Asumsi Shapiro-Wilk

Berdasarkan uji normalitas menggunakan uji normalitas Shapiro-Wilk didapatkan p-value(0.8751) yang mana lebih besar dari nilai alpha 0.05, sehingga berdasarkan uji normalitas shapiro-wilk data berdistribusi normal.

5.3 Uji Korelasi Rank Spearman

Berdasarkan hasil dengan nilai uji Rank Spearman sebesar -1, kita dapat mengambil keputusan bahwa terdapat korelasi monotik negatif sempurna antara Prevalensi Obesitas Pada Penduduk dan Konsumsi Alkohol.

uji Rank Spearman didapatkan nilai p sebesar 0.3333 (p>0.05), sehingga dapat disimpulkan bahwa tidak terjadi korelasi monotik antara Prevalensi Obesitas Pada Penduduk dan Konsumsi Alkohol.

5.4 Uji Asumsi Non autokorelasi Breusch-Godfrey

Berdasarkan hasil pengujian autokrelasi menggunakan uji Breusch-Godfrey dalam kasus ini, karena kita hanya memiliki 3 observasi, sulit untuk menguji autokorelasi dengan uji Breusch-Godfrey.

Dalam kasus ini, disarankan untuk menggunakan lebih banyak data dan menganalisis model regresi dengan lebih komprehensif untuk menguji asumsi

5.5 Uji Asumsi Non Multikolinieritas Matriks Korelasi

Berdasarkan data tersebut, kita tidak dapat menguji untuk Asumsi Non Multikolinieritas dengan Matriks Korelasi, maupun uji asumsi lainnya dikarenakan data kurang banyak (hanya memiliki 3 observasi) dan variabel respon hanya 1.