Library:
# install.packages("knitr")
# install.packages("rmarkdown")
# install.packages("prettydoc")
# install.packages("equatiomatic")
Kadar gula darah adalah indikator penting dalam kesehatan metabolik dan berperan signifikan dalam pencegahan diabetes dan penyakit kardiovaskular. Kebugaran fisik memengaruhi kadar gula darah melalui peningkatan sensitivitas insulin dan penurunan resistensi insulin. Namun, penelitian yang ada menunjukkan hasil yang beragam mengenai hubungan antara tingkat kebugaran dan kadar gula darah.
Analisis varians (ANOVA) adalah metode statistik yang digunakan untuk membandingkan rata-rata dari beberapa kelompok untuk menentukan apakah terdapat perbedaan yang signifikan. Penelitian ini bertujuan untuk menganalisis perbedaan kadar gula darah pada individu dengan tingkat kebugaran normal, overweight, dan obese menggunakan metode ANOVA.
Data yang digunakan dalam analisis ini adalah data fiktif yang disiapkan sebagai contoh atau latihan dalam analisis statistik. Data ini dibuat untuk tujuan pendidikan dan ilustrasi, dan tidak merepresentasikan data sebenarnya dari studi atau populasi tertentu. Penggunaan data fiktif ini bertujuan untuk memberikan contoh konkret dalam analisis yang dilakukan, serta memungkinkan mahasiswa untuk berlatih dan memahami konsep-konsep analisis data tanpa memperhatikan sensitivitas atau kerahasiaan data sebenarnya. Meskipun data ini tidak merepresentasikan situasi nyata, proses analisis yang dilakukan tetaplah relevan dan memberikan pemahaman yang baik tentang metode analisis yang digunakan.
Analisis Varians (ANOVA) adalah salah satu metode statistik yang digunakan untuk membandingkan rata-rata dari tiga atau lebih kelompok yang berbeda untuk menentukan apakah ada perbedaan signifikan di antara kelompok-kelompok tersebut. Metode ini sering digunakan dalam berbagai bidang salah satunya adalah statistika
Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan, pengolahan, dan penyajian data untuk menghasilkan informasi yang bermanfaat. Statistika deskriptif berfokus pada pengolahan dan penyajian data tanpa mengambil keputusan mengenai populasi. Bidang ini hanya memberikan gambaran umum dari data yang diperoleh (Walpole, 1997). Statistika deskriptif ditunjukkan melalui ukuran penyebaran data, ukuran pemusatan data, grafik, diagram, histogram, dan lain-lain untuk menyajikan informasi yang mudah dipahami.
Analisis Variansi atau ANOVA adalah metode statistik yang dikembangkan oleh R.A. Fisher pada tahun 1925. ANOVA dirancang untuk memisahkan variansi menjadi dua komponen: variansi antar kelompok dan variansi dalam kelompok. Tujuannya adalah untuk membandingkan variansi ini guna menganalisis perbedaan rata-rata antar kelompok
Hipotesis yang diuji dalam ANOVA adalah sebagai berikut:
Hipotesis nol (\(H_0\)) dan hipotesis alternatif (\(H_a\)) dinyatakan sebagai:
\[ H_0: \mu_1 = \mu_2 = \mu_3 = \cdots = \mu_k \] \[ H_1: \text{Setidaknya ada dua rata-rata yang berbeda} \]
Di mana:
Keputusan :
Keputusan dalam ANOVA didasarkan pada perbandingan nilai statistik \(F\) yang dihitung dengan nilai kritis \(F\) dari tabel distribusi \(F\) pada tingkat signifikansi (\(\alpha\)) tertentu.
Dalam bentuk lain, keputusan ini juga dapat diambil berdasarkan nilai \(p\) :
Keterangan :
\(F_{hitung}\) adalah nilai \(F\) yang diperoleh dari perhitungan ANOVA.
\(F_{tabel}\) adalah nilai kritis \(F\) dari tabel distribusi \(F\) berdasarkan derajat kebebasan \(df_{antara}\) dan \(df_{dalam}\).
\(p\)-value adalah probabilitas mendapatkan nilai \(F\) yang sama atau lebih ekstrem jika \(H_0\) benar.
\(\alpha\) adalah tingkat signifikansi yang ditetapkan (misalnya 0.05).
Dengan rumus sebagai berikut :
\[ F = \frac{RK_{antara}}{RK_{dalam}} \]
Di mana:
\[ RK_{antara} = \frac{JK_{antara}}{DK_{antara}} \]
\[ RK_{dalam} = \frac{JK_{dalam}}{DK_{dalam}} \]
\[ JK_{antara} = \sum_{i=1}^{k} n_i (\bar{X}_i - \bar{X})^2 \]
\[ JK_{dalam} = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (X_{ij} - \bar{X}_i)^2 \]
\[ DK_{antara} = k - 1 \]
\[ DK_{dalam} = N - k \]
Keterangan :
\(RK_{antara}\) adalah Rata-rata Kuadrat Antar Kelompok
\(RK_{dalam}\) adalah Rata-rata Kuadrat Dalam Kelompok
\(JK_{antara}\) adalah Jumlah Kuadrat Antar Kelompok
\(JK_{dalam}\) adalah Jumlah Kuadrat Dalam Kelompok
\(DK_{antara}\) adalah Derajat Kebebasan Antar Kelompok
\(DK_{dalam}\) adalah Derajat Kebebasan Dalam Kelompok
\(k\) adalah jumlah kelompok
\(n_i\) adalah ukuran sampel dari kelompok ke-i
\(\bar{X}_i\) adalah rata-rata kelompok ke-i
\(\bar{X}\) adalah rata-rata total
\(N\) adalah total jumlah sampel.
Uji Normalitas merupakan pengujian yang digunakan untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak dengan cara uji normalitas pada galat. Untuk melakukan uji normalitas ini dapat menggunakan uji Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.
Hipotesis:
H0 : pengamatan berdistribusi normal
H1 : pengamatan tidak berdistribusi normal
Kriteria :
Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal
Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal
Uji homogenitas adalah pengujian yang dilakukan untuk mengetahui sama tidaknya variansi-variansi dua buah distribusi atau lebih. Dalam buku yang ditulis Sudjana (2005), uji homogenitas dapat dilakukan dengan uji levene, fisher atau uji bartlett.
Hipotesis:
\[ H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \] \[ H_1: \text{Setidaknya ada dua varians yang berbeda} \]
Kriteria :
Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data mempunyai ragam galat yang homogen
Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data mempunyai ragam galat yang tidak homogen
Hipotesis:
H0 : data antar perlakuan bersifat independen
H1 : data antar perlakuan tidak bersifat independen
Kriteria :
Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data antar perlakuan bersifat independen
Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data antar perlakuan tidak bersifat independen
library(dplyr) #Digunakan untuk melakukan manipulasi data, seperti filtering, selecting, mutating, summarizing, dan arranging.##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyr) #Digunakan untuk melakukan operasi yang berkaitan dengan restrukturisasi (reshaping) data.## Warning: package 'tidyr' was built under R version 4.3.3
library(AOV1R) #Digunakan untuk menganalisis efek perlakuan pada percobaan atau studi dengan lebih fleksibel.## Warning: package 'AOV1R' was built under R version 4.3.3
library(tseries) #Digunakan untuk analisis deret waktu (time series) dalam R.## Warning: package 'tseries' was built under R version 4.3.3
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
library(car) #Digunakan untuk memperluas kemampuan analisis regresi dan ANOVA dalam R.## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
Data1 = data.frame (normal = c(85,90,88,95,92,91),
overweight = c(100,105,110,108,107,106),
obese = c(120,125,130,128,127,126))
Data1## normal overweight obese
## 1 85 100 120
## 2 90 105 125
## 3 88 110 130
## 4 95 108 128
## 5 92 107 127
## 6 91 106 126
library(tidyr)
Data1 <- Data1 %>%
pivot_longer(c(normal, overweight, obese))
names(Data1) <- c("TingkatKebugaran", "KadarGulaDarah")
Data1$TingkatKebugaran <- as.factor(Data1$TingkatKebugaran)
Data1## # A tibble: 18 × 2
## TingkatKebugaran KadarGulaDarah
## <fct> <dbl>
## 1 normal 85
## 2 overweight 100
## 3 obese 120
## 4 normal 90
## 5 overweight 105
## 6 obese 125
## 7 normal 88
## 8 overweight 110
## 9 obese 130
## 10 normal 95
## 11 overweight 108
## 12 obese 128
## 13 normal 92
## 14 overweight 107
## 15 obese 127
## 16 normal 91
## 17 overweight 106
## 18 obese 126
Hasil_Anova <- aov(KadarGulaDarah ~ TingkatKebugaran, data=Data1)
Hasil_Anova## Call:
## aov(formula = KadarGulaDarah ~ TingkatKebugaran, data = Data1)
##
## Terms:
## TingkatKebugaran Residuals
## Sum of Squares 3869.444 174.833
## Deg. of Freedom 2 15
##
## Residual standard error: 3.414023
## Estimated effects may be unbalanced
summary(Hasil_Anova)## Df Sum Sq Mean Sq F value Pr(>F)
## TingkatKebugaran 2 3869 1934.7 166 5.87e-11 ***
## Residuals 15 175 11.7
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residu <- residuals(Hasil_Anova)
residu## 1 2 3 4 5
## -5.166667e+00 -6.000000e+00 -6.000000e+00 -1.666667e-01 -1.000000e+00
## 6 7 8 9 10
## -1.000000e+00 -2.166667e+00 4.000000e+00 4.000000e+00 4.833333e+00
## 11 12 13 14 15
## 2.000000e+00 2.000000e+00 1.833333e+00 1.000000e+00 1.000000e+00
## 16 17 18
## 8.333333e-01 2.886580e-15 1.443290e-15
library(tseries)
jarque.bera.test(Data1$KadarGulaDarah)##
## Jarque Bera Test
##
## data: Data1$KadarGulaDarah
## X-squared = 1.4806, df = 2, p-value = 0.477
library(car)
homogenitas <- leveneTest(Hasil_Anova)
homogenitas## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.011 0.9891
## 15
independensi <- durbinWatsonTest(Hasil_Anova)
independensi## lag Autocorrelation D-W Statistic p-value
## 1 0.6806482 0.4860184 0.002
## Alternative hypothesis: rho != 0
Pada studi kasus ini, ingin dilakukan pengujian apakah ada perbedaan kadar gula darah pada orang dewasa dengan tingkat kebugaran yang normal, overweight, dan obese. Dari Hasil ANOVA didapatkan F-value dan P-value. Jika P-value lebih dari alpha dengan menggunakan taraf nyata 5%, maka didapatkan keputusan terima H0. Yang artinya, tidak terdapat perbedaan signifikan antara kadar gula darah dengan tingkat kebugaran orang dewasa satu dengan yang lainnya.
Berdasarkan hasil uji Jarque Bera, diperoleh P-value. Karena P-value > alpha(0.05), maka didapatkan keputusan terima H0 yang artinya pengamatan menyebar normal.
Berdasarkan hasil uji Levene, diperoleh P-value. Karena P-value > alpha(0.05), maka didapatkan keputusan terima H0 yang artinya data mempunyai ragam galat yang homogen. Sehingga dapat disimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.
Berdasarkan hasil uji Durbin Watson, diperoleh P-value, yang artinya data antar perlakuan bersifat independen.
#PENUTUP
Berdasarkan hasil uji ANOVA, hasil menunjukkan tidak terdapat perbedaan signifikan antara kadar gula darah dengan tingkat kebugaran orang dewasa satu dengan yang lainnya, sehingga tidak perlu dilakukan uji lanjut. Selain itu, asumsi-asumsi yang diperlukan dalam penggunaan metode ANOVA pada kasus ini semuanya terpenuhi.