ANOVA One-Way dan Asumsinya

Zalfa Nida Sasikirana

2024-05-27


Library:

# install.packages("knitr")
# install.packages("rmarkdown")
# install.packages("prettydoc")
# install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Kalsium adalah mineral penting yang berperan dalam mengatur fungsi jantung, pembekuan darah, dan pembentukan tulang yang sehat. The National Osteoporosis Foundation merekomendasikan asupan harian kalsium sebesar 1.000-1.200 mg untuk pria dan wanita dewasa. Meskipun kalsium dapat ditemukan dalam beberapa makanan, sebagian besar orang mendapatkan kalsium mereka dari makanan dan suplemen. Sebuah penelitian dilakukan untuk menguji asupan kalsium pada orang dewasa dengan kepadatan tulang normal, osteopenia (kepadatan tulang rendah yang dapat menyebabkan osteoporosis), dan osteoporosis. Orang dewasa berusia 60 tahun dengan berbagai tingkat kepadatan tulang dipilih secara acak dari catatan rumah sakit dan diundang untuk berpartisipasi dalam penelitian. Asupan kalsium harian setiap peserta diukur berdasarkan laporan konsumsi makanan dan suplemen.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan, pengolahan, dan penyajian data untuk menghasilkan informasi yang bermanfaat. Statistika deskriptif berfokus pada pengolahan dan penyajian data tanpa mengambil keputusan mengenai populasi. Bidang ini hanya memberikan gambaran umum dari data yang diperoleh (Walpole, 1997). Statistika deskriptif ditunjukkan melalui ukuran penyebaran data, ukuran pemusatan data, grafik, diagram, histogram, dan lain-lain untuk menyajikan informasi yang mudah dipahami.

2.2 Analisis of Varians (ANOVA) One- Way

Analisis Variansi atau ANOVA adalah metode statistik yang dikembangkan oleh R.A. Fisher pada tahun 1925. ANOVA dirancang untuk memisahkan variansi menjadi dua komponen: variansi antar kelompok dan variansi dalam kelompok. Tujuannya adalah untuk membandingkan variansi ini guna menganalisis perbedaan rata-rata antar kelompok

Hipotesis yang diuji dalam ANOVA adalah sebagai berikut:

Hipotesis nol (\(H_0\)) dan hipotesis alternatif (\(H_a\)) dinyatakan sebagai:

\[ H_0: \mu_1 = \mu_2 = \mu_3 = \cdots = \mu_k \] \[ H_1: \text{Setidaknya ada dua rata-rata yang berbeda} \]

Di mana:

  • \(\mu_k\) adalah rata-rata populasi dari kelompok ke-k.

Keputusan :

Keputusan dalam ANOVA didasarkan pada perbandingan nilai statistik \(F\) yang dihitung dengan nilai kritis \(F\) dari tabel distribusi \(F\) pada tingkat signifikansi (\(\alpha\)) tertentu.

  • Jika \(F_{hitung} > F_{tabel}\), maka tolak \(H_0\).
  • Jika \(F_{hitung} \leq F_{tabel}\), maka gagal untuk menolak \(H_0\).

Dalam bentuk lain, keputusan ini juga dapat diambil berdasarkan nilai \(p\) :

  • Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).
  • Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).

Keterangan :

  • \(F_{hitung}\) adalah nilai \(F\) yang diperoleh dari perhitungan ANOVA.

  • \(F_{tabel}\) adalah nilai kritis \(F\) dari tabel distribusi \(F\) berdasarkan derajat kebebasan \(df_{antara}\) dan \(df_{dalam}\).

  • \(p\)-value adalah probabilitas mendapatkan nilai \(F\) yang sama atau lebih ekstrem jika \(H_0\) benar.

  • \(\alpha\) adalah tingkat signifikansi yang ditetapkan (misalnya 0.05).

Dengan rumus sebagai berikut :

\[ F = \frac{RK_{antara}}{RK_{dalam}} \]

Di mana:

\[ RK_{antara} = \frac{JK_{antara}}{DK_{antara}} \]

\[ RK_{dalam} = \frac{JK_{dalam}}{DK_{dalam}} \]

\[ JK_{antara} = \sum_{i=1}^{k} n_i (\bar{X}_i - \bar{X})^2 \]

\[ JK_{dalam} = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (X_{ij} - \bar{X}_i)^2 \]

\[ DK_{antara} = k - 1 \]

\[ DK_{dalam} = N - k \]

Keterangan :

  • \(RK_{antara}\) adalah Rata-rata Kuadrat Antar Kelompok

  • \(RK_{dalam}\) adalah Rata-rata Kuadrat Dalam Kelompok

  • \(JK_{antara}\) adalah Jumlah Kuadrat Antar Kelompok

  • \(JK_{dalam}\) adalah Jumlah Kuadrat Dalam Kelompok

  • \(DK_{antara}\) adalah Derajat Kebebasan Antar Kelompok

  • \(DK_{dalam}\) adalah Derajat Kebebasan Dalam Kelompok

  • \(k\) adalah jumlah kelompok

  • \(n_i\) adalah ukuran sampel dari kelompok ke-i

  • \(\bar{X}_i\) adalah rata-rata kelompok ke-i

  • \(\bar{X}\) adalah rata-rata total

  • \(N\) adalah total jumlah sampel.

2.3 Asumsi ANOVA

2.3.1 Asumsi Normalitas Galat

Uji Normalitas merupakan pengujian yang digunakan untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak dengan cara uji normalitas pada galat. Untuk melakukan uji normalitas ini dapat menggunakan uji Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.

Hipotesis:

H0 : pengamatan berdistribusi normal

H1 : pengamatan tidak berdistribusi normal

Kriteria :

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal

2.3.2 Asumsi Homogenitas Ragam

Uji homogenitas adalah pengujian yang dilakukan untuk mengetahui sama tidaknya variansi-variansi dua buah distribusi atau lebih. Dalam buku yang ditulis Sudjana (2005), uji homogenitas dapat dilakukan dengan uji levene, fisher atau uji bartlett.

Hipotesis:

\[ H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \] \[ H_1: \text{Setidaknya ada dua varians yang berbeda} \]

Kriteria :

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data mempunyai ragam galat yang homogen

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data mempunyai ragam galat yang tidak homogen

2.3.3 Asumsi Independensi

Hipotesis:

H0 : data antar perlakuan bersifat independen

H1 : data antar perlakuan tidak bersifat independen

Kriteria :

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data antar perlakuan bersifat independen

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data antar perlakuan tidak bersifat independen

3 SOURCE CODE

3.1 Library

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)
## Warning: package 'tidyr' was built under R version 4.3.2
library(AOV1R)
## Warning: package 'AOV1R' was built under R version 4.3.3
library(tseries)
## Warning: package 'tseries' was built under R version 4.3.3
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
library(car)
## Warning: package 'car' was built under R version 4.3.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.2
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode

3.2 Input Data

Data1 = data.frame (normal = c(1200,1000,980,900,750,800),
                    osteopenia =c (1000,1100,700,800,500,700),
                    osteoporosis  = c(890,650,1100,900,400,350))
Data1
##   normal osteopenia osteoporosis
## 1   1200       1000          890
## 2   1000       1100          650
## 3    980        700         1100
## 4    900        800          900
## 5    750        500          400
## 6    800        700          350
Data1 = Data1 %>%
  pivot_longer(c(normal,osteopenia,osteoporosis))
names(Data1)  = c("KepadatanTulang","AsupanKalsium")
Data1$KepadatanTulang = as.factor(Data1$KepadatanTulang)
Data1
## # A tibble: 18 × 2
##    KepadatanTulang AsupanKalsium
##    <fct>                   <dbl>
##  1 normal                   1200
##  2 osteopenia               1000
##  3 osteoporosis              890
##  4 normal                   1000
##  5 osteopenia               1100
##  6 osteoporosis              650
##  7 normal                    980
##  8 osteopenia                700
##  9 osteoporosis             1100
## 10 normal                    900
## 11 osteopenia                800
## 12 osteoporosis              900
## 13 normal                    750
## 14 osteopenia                500
## 15 osteoporosis              400
## 16 normal                    800
## 17 osteopenia                700
## 18 osteoporosis              350

3.3 Menampilkan Hasil ANOVA

Hasil_Anova <- aov(AsupanKalsium ~ KepadatanTulang, data=Data1)
Hasil_Anova
## Call:
##    aov(formula = AsupanKalsium ~ KepadatanTulang, data = Data1)
## 
## Terms:
##                 KepadatanTulang Residuals
## Sum of Squares         152477.8  819833.3
## Deg. of Freedom               2        15
## 
## Residual standard error: 233.7853
## Estimated effects may be unbalanced
summary(Hasil_Anova)
##                 Df Sum Sq Mean Sq F value Pr(>F)
## KepadatanTulang  2 152478   76239   1.395  0.278
## Residuals       15 819833   54656

3.4 Mendapatkan Residu dari ANOVA

residu<- residuals(Hasil_Anova)
residu
##             1             2             3             4             5 
##  2.616667e+02  2.000000e+02  1.750000e+02  6.166667e+01  3.000000e+02 
##             6             7             8             9            10 
## -6.500000e+01  4.166667e+01 -1.000000e+02  3.850000e+02 -3.833333e+01 
##            11            12            13            14            15 
##  2.842171e-14  1.850000e+02 -1.883333e+02 -3.000000e+02 -3.150000e+02 
##            16            17            18 
## -1.383333e+02 -1.000000e+02 -3.650000e+02

3.5 Uji Asumsi ANOVA

3.5.1 Asumsi Normalitas Galat

jarque.bera.test(Data1$AsupanKalsium)
## 
##  Jarque Bera Test
## 
## data:  Data1$AsupanKalsium
## X-squared = 0.81052, df = 2, p-value = 0.6668

3.5.2 Asumsi Homogenitas Ragam

homogenitas <- leveneTest(Hasil_Anova)
homogenitas
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  1.6311 0.2286
##       15

3.5.3 Asumsi Independensi

independensi <- durbinWatsonTest(Hasil_Anova)
independensi
##  lag Autocorrelation D-W Statistic p-value
##    1       0.3013519      1.151277   0.126
##  Alternative hypothesis: rho != 0

4 HASIL dan PEMBAHASAN

4.1 ANOVA One-Way

Pada studi kasus ini, ingin dilakukan pengujian apakah ada asupan kalsium pada orang dewasa dengan kepadatan tulang yang normal, orang dewasa dengan osteopenia (kepadatan tulang yang rendah yang dapat menyebabkan osteoporosis) dan orang dewasa dengan osteoporosis. Dari Hasil ANOVA didapatkan F-value 1.395 dan P-value 0.278. Karena P-value lebih dari alpha dengan menggunakan taraf nyata 5%, maka didapatkan keputusan terima H0. Yang artinya, tidak terdapat perbedaan signifikan antara asupan kalsium dengan jenis kepadatan tulang orang dewasa satu dengan yang lainnya.

4.2 Asumsi Normalitas Galat

Berdasarkan hasil uji Jarque Bera, diperoleh P-value sebesar 0.6668. Karena P-value > alpha(0.05), maka didapatkan keputusan terima H0 yang artinya pengamatan menyebar normal.

4.3 Asumsi Homogenitas Ragam

Ragam Berdasarkan hasil uji Levene, diperoleh P-value sebesar 0.2286. Karena P-value > alpha(0.05), maka didapatkan keputusan terima H0 yang artinya data mempunyai ragam galat yang homogen. Sehingga dapat disimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.

4.4 Asumsi Independensi

Berdasarkan hasil uji Durbin Watson, diperoleh P-value 0.12, yang artinya data antar perlakuan bersifat independen.

5 KESIMPULAN

Berdasarkan hasil uji ANOVA, hasil meunjukkan tidak terdapat perbedaan signifikan antara asupan kalsium dengan jenis kepadatan tulang orang dewasa satu dengan yang lainnya, sehingga tidak pelu dilakukan uji lanjut. Selain itu, asumsi asumsi yang diperlukan dalam penggunaan metode ANOVA pada kasus ini semuanya terpenuhi.

6 DAFTAR PUSTAKA