Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Statistika merupakan ilmu dan atau seni yang berkaitan dnegan tata cara (metode) pengumpulan data, analisis data, interpretasi hasil analisis yang dilakukan untuk mendapatkan informasi yang bermanfaat dalam suatu kegiatan pengambilan keputusan. Statistika sangat berkaitan erat dengan data, terlihat dari asal kata “statistik” yang berarti data. Data adalah hasil suatu pengukuran atau pengamatan yang dikumpulkan yang dapat berupa angka besaran, pernyataan atau fakta yang menggambarkan persamaan atau perbedaan objek satu dengan yang lain dalam karakter yang sama.

Berdasarkan fungsinya dalam pengolahan data, statistika dapat dibagi menjadi statistika deskriptif dan statistika inferensial. Statistika deskriptif adalah jenis statistika yang terdiri dari metode untuk mengatur, menampilkan, dan menjelaskan data dengan menggunakan tabel, grafik, dan ringkasan. Namun, dalam statistika deskriptif ini belum dilakukan penarikan kesimpulan. Sedangkan, statistika inferensial adalah jenis statistika yang terdiri dari metode yang menggunakan hasil sampel untuk membantu membuat keputusan atau prediksi tentang suatu populasi. Statistika inferensial ini dapat dikatakan sebagai statistik lanjut maupun statistika mendalam. Salah satu cabang dari statistika inferensial adalah analisis ragam (ANOVA).

Analisis ragam biasa digunakan untuk mengetahui perbedaan rata-rata dari beberapa kelompok. Sebagai contoh, suatu penelitian ingin mengetahui apakah ada perbedaan rata-rata berat badan bayi yang dilahirkan dengan tinggi badan ibu

2 TINJAUAN PUSTAKA

2.1 Statistika Inferensial

Statistika inferensial adalah salah satu jenis metode statistika yang menggunakan sebagian dari anggota populasi (sampel) untuk dianalisis yang kemudian hasil analisis tersebut digunakan untuk memberikan gambaran tentang populasi dimana sampel tersebut diambil dan digunakan untuk proses pengambilan kesimpulan. Dalam statistika inferensial terdapat dua jenis statistik yaitu statistik parametrik dan statistika non parametrik.

Statistik parametrik adalah statistik yang mengharuskan beberapa syarat terpenuhi pada parameter populasi seperti data berskala interval maupun rasio, pengambilan sampel harus secara random, data memenuhi distribusi normal, dan data memiliki varians yang homogen. Sedangkan, statistik non parametrik adalah statistika yang parameter popuasinya tidak perlu memenuhi syarat seperti pada statistika parametrik. Statistik non parameterik bersifat bebas sebaran dan lebih sering menggunakan skala nominal dan ordinal yang secara umum memang tidak berdistribusi normal.

2.2 Analisis Ragam

Analisis Ragam (Analysis of Variance) atau yang lebih dikenal dengan ANOVA adalah salah satu metode analisis statistika yang termasuk ke dalam cabang statistika inferensial dan kategori statistika parametrik. Analisis ragam merupakan uji yang bertujuan untuk mengetahui apakah dua sampel acak dari sebuah penelitian berasal dari populasi yang sama. Analisis ini merupakan pengembangan dari masalah Behrens-Fisher sehingga uji yang digunakan adalah uji F, dimana dipakai untuk pengujian lebih dari dua sampel. Ketika melakukan analisis ragam ada empat asumsi yang harus dipenuhi, diantaranya:

  • Pengaruh perlakuan dan pengaruh lingkungan bersifat adiktif (Adiktif)

  • Galat percobaan memiliki ragam yang homogen (Homogenitas)

  • Galat percobaan saling bebas (Independensi)

  • Galat percobaan menyebar normal (Normalitas)

2.2.1 Analisis Ragam Satu Arah

Analisis ragam satu arah digunakan untuk menguji perbedaan rata-rata dari beberapa kelompok (lebih dari 2) yang berasal dari perlakuan yang berbeda-beda. Perbedaan antar kelompok dianalisis berdasarkan perbandingan ragam (within) kelompok dan ragam antar (between) kelompok menggunakan statistik uji F. Sumber keragaman dari analisis ragam satu arah ini adalah

  • Perlakuan yaitu keragaman yang disebabkan atas perbedaan perlakuan atau kondisi.

  • Galat yaitu keragaman yang tidak dapat dikontrol (error).

  • Total yaitu keragaman total.

Hipotesis yang digunakan ketika terdapat k kelompok:

\(H_{0}\) : \(\mu_{1}\) = … = \(\mu{k}\)

\(H_{1}\) : setidaknya ada satu \(\mu_{i}\) yang berbeda

Statistik Uji:

Derajat bebas (db): \[ db_{Perlakuan}= p-1 \]

\[ db_{galat}=p(r-1) \] \[ db_{total}=pr-1 \]

Jumlah Kuadrat (JK): \[ FK=\frac{(\Sigma{Y_{ij}})^2}{pr} \]

\[ JKT=\Sigma_{i}^{p}\Sigma_{j=1}^rY_{ij}^2-FK \]

\[ JKP={\Sigma_{i}^{p}}\frac{(\Sigma_{j=1}^rY_{ij}^2)}{r}-FK \]

\[ JKG=JKT-JKP \]

Kuadrat Tengah (KT): \[ KTP=\frac{JKP}{p-1} \] \[ KTG=\frac{JKG}{p(r-1)} \]

F hitung : \[ F_{hit}=\frac{KTP}{KTG} \]

F tabel = \(F_{db1},_{db2}\)

Keputusan:

  • Tolak \(H_{0}\) jika \(F_{hit}\) > \(F_{tabel}\)

  • Terima \(H_{0}\) jika \(F_{hit}\) < \(F_{tabel}\)

Keterangan:

p = perlakuan

r = ulangan

2.2.2 Analisis Ragam Dua Arah

Analisis ragam dua arah digunakan ketika terdapat lebih dari dua populasi dan masing-masing populasi tersebut berpasangan.

Hipotesis :

\(H_{0}\) : \(\alpha_{1}\) = … = \(\alpha_{i}\)

\(H_{1}\) : minimal terdapat satu \(\alpha_{i}\) yang berbeda

\(H_{0}\) : \(\beta_{1}\)=…=\(\beta{j}\)

\(H_{1}\) : minimal terdapat satu \(\beta_{j}\) yang berbeda

Statistik Uji:

Derajat Bebas (db) : \[ db_{Perlakuan}= p-1 \] \[ db_{Kelompok}= r-1 \] \[ db_{Galat}= (p-1)(r-1) \] \[ db_{Total}= pr-1 \]

Jumlah Kuadrat (JK) : \[ FK=\frac{(\Sigma{Y_{ij}})^2}{pr} \] \[ JKT=\Sigma_{i}^{p}\Sigma_{j=1}^rY_{ij}^2-FK \]

\[ JKP={\Sigma_{i}^{p}}\frac{(\Sigma_{j=1}^rY_{ij}^2)}{r}-FK \] \[ JKK=\Sigma_{j}^{r}\frac{(\Sigma_{i=1}^p{Y_{ij}^2)}}p-FK \] \[ JKG=JKT-JKP-JKK \]

Kuadrat Tengah (KT) : \[ KTP=\frac{JKP}{p-1} \] \[ KTK=\frac{JKK}{r-1} \]

\[ KTG=\frac{JKG}{(p-1)(r-1)} \]

F hitung: \[ F_{hit,Perlakuan}=\frac{KTP}{KTG} \] \[ F_{hit,Kelompok}=\frac{KTK}{KTG} \]

F tabel = \(F_{db1},_{db2}\)

Keputusan:

  • Tolak \(H_{0}\) jika \(F_{hit}\) > \(F_{tabel}\)

  • Terima \(H_{0}\) jika \(F_{hit}\) < \(F_{tabel}\)

Keterangan:

p = perlakuan

r = ulangan

2.2.3 Asumsi Analis Ragam

Ketika dicurigai adanya pelanggaran asumsi berdasarkan pemeriksaan sisaan, maka pengujian asumsi secara formal harus dilakukan. Contoh pengujian asumsi adalah

  • Uji normalitas galat yang dilakukan dengan Uji Jarque Berra dan Saphiro Wilk

  • Uji kehomogenan ragam antar perlakuan yang dilakukan dengan Uji Levene

Hipotesis:

\(H_{0}\) : Pengamatan menyebar normal

\(H_{1}\) : Pengamatan tidak menyebar normal

Uji Jarque Berra

Statistik Jarque Berra dihitung berdasarkan koefisien skewness dan kurtosis yang diduga dari sampel teramati. Semakin tidak normal maka nilai skewness semakin menjauh dari nol dan kurtosis menjauh dari nilai K

\[ JB=\frac{n}{6}(S^2+\frac{1}{4}(K-3)^2) \]

Uji Shapiro Wilk

Uji Shapiro Wolk digunakan untuk mengidentifikasi apakah suatu peubah acak berdistribusi normal. Uji ini digunakan untuk sampel berukuran kecil

\[ W=\frac{(\Sigma_{i=1}a_{i}x_{(i)})^2}{\Sigma_{i=1}^{n}(x_{i}-x)^2} \]

Uji Levene

Hipotesis:

\(H_{0}\)=\(\sigma_{1}^2=\sigma_{2}^{2}=...=\sigma_{k}^2\)

\(H_{1}\)=paling tidak terdapat satu pasang \(\sigma_{i}^2\) dan \(\sigma_{j}^2\)

Kriteria penolakan dapat menggunakan nilai p yang diperoleh dari statistik uji sesuai sebaran \(F_{k-1},_{N-k}\)

2.2.4 Uji Lanjut

Ketika analisis ragam memberikan kesimpulan untuk menolak \(H_{0}\), maka paling sedikit terdapat satu pasang atau kelompok yang memiliki nilai tengah yang berbeda. Namun, dari analisis tersebut belum dapat ditentukan pasangan mana yang berbeda nilai tengahya. Untuk itu, perlu dilakukan uji lanjut, yaitu:

  • Uji BNT : Fisher’s LSD

  • Uji BNJ : Tukey’s HSD

Uji-uji tersebut dapat dilakukan ketika tidak ada pelanggaran pada asumsi normalitas dan kehomogenan ragam. Pada uji lanjut akan dilakukan perbandingan untuk seluruh pasang kelompok atau perlakuan.

Uji BNT

Uji BNT (Beda Nyata Terkecil) adalah perbandingan rata-rata antara dua nilai rata-rata atau perbandingan pasangan rata-rata. Dua rata-rata dinyatakan berbeda secara signifikan atau nyata apabila memiliki selisih yang lebih besar dibandingkan dengan nilai BNT-nya.

\[ BNT=t_{\frac{\alpha}{2}},_{N-k}\sqrt{KTG(\frac{1}{n_{i}}+\frac{1}{n_{i'}})} \]

Uji BNJ

Uji BNJ (Beda Nyata Jujur) digunakan untuk membandingkan seluruh pasangan rata-rata perlakuan setelah uji analisis ragam dilakukan.

\[ BNJ=q_{\frac{\alpha}{2}},_k,_{N-k}\sqrt{\frac{KTG}{2}(\frac{1}{n_{i}}+\frac{1}{n_{i'}})} \]

3 SOURCE CODE

3.1 Library

library(tseries)

library(car)

library(agricolae)

3.2 Input Data

> SP = c(2.4,3.0,2.1,3.0,3.4,2.3,2.3,2.5,2.4,2.5)
> P = c(3.0,3.1,2.7,2.6,3.1,2.9,2.9,2.8,2.5,2.6)
> N = c(3.1,2.4,3.5,2.9,3.4,4.0,3.4,2.9,3.4,3.3)
> Berat_Bayi = c(SP,P,N)

3.3 Data Frame

> Tinggi_Ibu = factor(c(rep("1",10),rep("2",10),rep("3",10)))
> data = data.frame(Tinggi_Ibu,Berat_Bayi)

3.4 Boxplot

> boxplot(Berat_Bayi~Tinggi_Ibu,data=data,main="Boxplot",xlab="Tinggi_Ibu",ylab="Berat_Bayi")

3.5 ANOVA

> anova = aov(Berat_Bayi~Tinggi_Ibu,data=data)
> summary(anova)

3.6 Diagnostik Sisaan

> plot(anova,1)

> plot(anova,2)

> plot(anova,3)

3.7 Uji Normalitas

> sisa = residuals(anova)
> library(tseries)
> jarque.bera.test(sisa)
> shapiro.test(sisa)
> library(car)
> leveneTest(Berat_Bayi~Tinggi_Ibu,data=data)

3.8 Uji Lanjut

> library(agricolae)
> BNT = LSD.test(anova,"Tinggi_Ibu",alpha=0.05)
> BNT
> BNT$groups
> BNT$means
> plot(BNT)

> TukeyHSD(anova,conf.level=0.95)
> plot(TukeyHSD(anova))

4 HASIL DAN PEMBAHASAN

Dari hasil analisis ragam yang telah diperoleh, maka dapat disimpulkan sebagai berikut:

4.1 Boxplot

Secara visual terlihat bahwa terdapat perbedaan antara rata-rata berat bayi antar tinggi ibu yang berbeda-beda, namun perbedaannya tidak terlalu signifikan.

4.2 Analisis Ragam

            Df Sum Sq Mean Sq F value  Pr(>F)   
Tinggi_Ibu   2  2.102  1.0510   7.913 0.00197 **
Residuals   27  3.586  0.1328                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Diperoleh nilai-p sebesar 0.00197, dimana dengan nilai tersebut maka terdapat bukti bahwa paling sedikit satu tinggi badan ibu yang secara signifikan memiliki rata-rata berat badan bayi yang berbeda.

4.3 Diagnostic Plots

Plot 1 merupakan plot Residuals vs Filled yang digunakan untuk memeriksa ketepatan model. Jika dilihat dari plot yang telah diperoleh, terlihat bahwa garis merah yang menghubungkan pusat dari 3 kelompok sisaan masih terlihat datar (horizontal), maka dapat disimpulkan bahwa model sudah tepat

Plot 2 merupakan Q-Q plot untuk normalitas. Pada plot di atas terlihat bahwa titik-titik tidak berada jauh dari garis sudut 45 derajat antara sumbu X dan Y di kuadran I. Jadi, secara grafis tidak ada indikasi pelanggaran normalitas

Plot 3 merupakan Plot Scale - Location untuk memeriksa kesamaan ragam. Garis merah pada plot diatas menghubungkan pusat dari 3 kelompok akar sisaan yang dibakukan, cenderung membentuk kurva kuadrat, walaupun tidak terlalu ekstrim. Ada kecurigaan ketidaksamaan ragam, perlu dipastikan dengan uji.

4.4 Uji Normalitas


    Jarque Bera Test

data:  sisa
X-squared = 0.52941, df = 2, p-value = 0.7674

    Shapiro-Wilk normality test

data:  sisa
W = 0.96895, p-value = 0.511
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.7313 0.4906
      27               

Dari hasil Levene’s Test diperoleh nilai-p sebesar 0.4906 yang dianggap cukup besar, sehingga \(H_{0}\) tentang kesamaan ragam antar tinggi ibu tidak dapat ditolak.

4.5 Uji Lanjut

$statistics
    MSerror Df Mean       CV  t.value       LSD
  0.1328148 27 2.88 12.65409 2.051831 0.3344104

$parameters
        test p.ajusted     name.t ntr alpha
  Fisher-LSD      none Tinggi_Ibu   3  0.05

$means
  Berat_Bayi       std  r      LCL      UCL Min Max   Q25  Q50   Q75
1       2.59 0.4067486 10 2.353536 2.826464 2.1 3.4 2.325 2.45 2.875
2       2.82 0.2149935 10 2.583536 3.056464 2.5 3.1 2.625 2.85 2.975
3       3.23 0.4321779 10 2.993536 3.466464 2.4 4.0 2.950 3.35 3.400

$comparison
NULL

$groups
  Berat_Bayi groups
3       3.23      a
2       2.82      b
1       2.59      b

attr(,"class")
[1] "group"
  Berat_Bayi groups
3       3.23      a
2       2.82      b
1       2.59      b
  Berat_Bayi       std  r      LCL      UCL Min Max   Q25  Q50   Q75
1       2.59 0.4067486 10 2.353536 2.826464 2.1 3.4 2.325 2.45 2.875
2       2.82 0.2149935 10 2.583536 3.056464 2.5 3.1 2.625 2.85 2.975
3       3.23 0.4321779 10 2.993536 3.466464 2.4 4.0 2.950 3.35 3.400

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Berat_Bayi ~ Tinggi_Ibu, data = data)

$Tinggi_Ibu
    diff          lwr       upr     p adj
2-1 0.23 -0.174099166 0.6340992 0.3494247
3-1 0.64  0.235900834 1.0440992 0.0015093
3-2 0.41  0.005900834 0.8140992 0.0462398

Berdasarkan hasil BNJ dan BNT, berat badan bayi dengan tinggi badan ibu sangat pendek dan pendek sama secara rata-rata. Sedangkan, berat badan bayi dengan tinggi badan ibu yang tinggi memiliki rata-rata yang berbeda

5 KESIMPULAN

Berdasarkan perhitungan analisis ragam dan asumsi serta uji lanjut yang telah dilakukan, maka dapat disimpulkan bahwa terdapat perbedaan rata-rata berat badan bayi yang dilahirkan ketiga kelompok ibu berdasarkan tinggi badan.

6 DAFTAR PUSTAKA

Sugiyono, 2007. Statistika untuk penelitian. Bandung: Alfabeta.

Budiwanto, 2017. Metode Statistika untik Mengolah Data Keolahragaan. Malang: Universitas Negeri Malang.