Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Statistika merupakan ilmu dan atau seni yang berkaitan dnegan tata cara (metode) pengumpulan data, analisis data, interpretasi hasil analisis yang dilakukan untuk mendapatkan informasi yang bermanfaat dalam suatu kegiatan pengambilan keputusan. Statistika sangat berkaitan erat dengan data, terlihat dari asal kata “statistik” yang berarti data. Data adalah hasil suatu pengukuran atau pengamatan yang dikumpulkan yang dapat berupa angka besaran, pernyataan atau fakta yang menggambarkan persamaan atau perbedaan objek satu dengan yang lain dalam karakter yang sama.
Berdasarkan fungsinya dalam pengolahan data, statistika dapat dibagi menjadi statistika deskriptif dan statistika inferensial. Statistika deskriptif adalah jenis statistika yang terdiri dari metode untuk mengatur, menampilkan, dan menjelaskan data dengan menggunakan tabel, grafik, dan ringkasan. Namun, dalam statistika deskriptif ini belum dilakukan penarikan kesimpulan. Sedangkan, statistika inferensial adalah jenis statistika yang terdiri dari metode yang menggunakan hasil sampel untuk membantu membuat keputusan atau prediksi tentang suatu populasi. Statistika inferensial ini dapat dikatakan sebagai statistik lanjut maupun statistika mendalam. Salah satu cabang dari statistika inferensial adalah analisis ragam (ANOVA).
Analisis ragam biasa digunakan untuk mengetahui perbedaan rata-rata dari beberapa kelompok. Sebagai contoh, suatu penelitian ingin mengetahui apakah ada perbedaan rata-rata berat badan bayi yang dilahirkan dengan tinggi badan ibu
2 TINJAUAN PUSTAKA
2.1 Statistika Inferensial
Statistika inferensial adalah salah satu jenis metode statistika yang menggunakan sebagian dari anggota populasi (sampel) untuk dianalisis yang kemudian hasil analisis tersebut digunakan untuk memberikan gambaran tentang populasi dimana sampel tersebut diambil dan digunakan untuk proses pengambilan kesimpulan. Dalam statistika inferensial terdapat dua jenis statistik yaitu statistik parametrik dan statistika non parametrik.
Statistik parametrik adalah statistik yang mengharuskan beberapa syarat terpenuhi pada parameter populasi seperti data berskala interval maupun rasio, pengambilan sampel harus secara random, data memenuhi distribusi normal, dan data memiliki varians yang homogen. Sedangkan, statistik non parametrik adalah statistika yang parameter popuasinya tidak perlu memenuhi syarat seperti pada statistika parametrik. Statistik non parameterik bersifat bebas sebaran dan lebih sering menggunakan skala nominal dan ordinal yang secara umum memang tidak berdistribusi normal.
2.2 Analisis Ragam
Analisis Ragam (Analysis of Variance) atau yang lebih dikenal dengan ANOVA adalah salah satu metode analisis statistika yang termasuk ke dalam cabang statistika inferensial dan kategori statistika parametrik. Analisis ragam merupakan uji yang bertujuan untuk mengetahui apakah dua sampel acak dari sebuah penelitian berasal dari populasi yang sama. Analisis ini merupakan pengembangan dari masalah Behrens-Fisher sehingga uji yang digunakan adalah uji F, dimana dipakai untuk pengujian lebih dari dua sampel. Ketika melakukan analisis ragam ada empat asumsi yang harus dipenuhi, diantaranya:
Pengaruh perlakuan dan pengaruh lingkungan bersifat adiktif (Adiktif)
Galat percobaan memiliki ragam yang homogen (Homogenitas)
Galat percobaan saling bebas (Independensi)
Galat percobaan menyebar normal (Normalitas)
2.2.1 Analisis Ragam Satu Arah
Analisis ragam satu arah digunakan untuk menguji perbedaan rata-rata dari beberapa kelompok (lebih dari 2) yang berasal dari perlakuan yang berbeda-beda. Perbedaan antar kelompok dianalisis berdasarkan perbandingan ragam (within) kelompok dan ragam antar (between) kelompok menggunakan statistik uji F. Sumber keragaman dari analisis ragam satu arah ini adalah
Perlakuan yaitu keragaman yang disebabkan atas perbedaan perlakuan atau kondisi.
Galat yaitu keragaman yang tidak dapat dikontrol (error).
Total yaitu keragaman total.
Hipotesis yang digunakan ketika terdapat k kelompok:
\(H_{0}\) : \(\mu_{1}\) = … = \(\mu{k}\)
\(H_{1}\) : setidaknya ada satu \(\mu_{i}\) yang berbeda
Statistik Uji:
Derajat bebas (db): \[ db_{Perlakuan}= p-1 \]
\[ db_{galat}=p(r-1) \] \[ db_{total}=pr-1 \]
Jumlah Kuadrat (JK): \[ FK=\frac{(\Sigma{Y_{ij}})^2}{pr} \]
\[ JKT=\Sigma_{i}^{p}\Sigma_{j=1}^rY_{ij}^2-FK \]
\[ JKP={\Sigma_{i}^{p}}\frac{(\Sigma_{j=1}^rY_{ij}^2)}{r}-FK \]
\[ JKG=JKT-JKP \]
Kuadrat Tengah (KT): \[ KTP=\frac{JKP}{p-1} \] \[ KTG=\frac{JKG}{p(r-1)} \]
F hitung : \[ F_{hit}=\frac{KTP}{KTG} \]
F tabel = \(F_{db1},_{db2}\)
Keputusan:
Tolak \(H_{0}\) jika \(F_{hit}\) > \(F_{tabel}\)
Terima \(H_{0}\) jika \(F_{hit}\) < \(F_{tabel}\)
Keterangan:
p = perlakuan
r = ulangan
2.2.2 Analisis Ragam Dua Arah
Analisis ragam dua arah digunakan ketika terdapat lebih dari dua populasi dan masing-masing populasi tersebut berpasangan.
Hipotesis :
\(H_{0}\) : \(\alpha_{1}\) = … = \(\alpha_{i}\)
\(H_{1}\) : minimal terdapat satu \(\alpha_{i}\) yang berbeda
\(H_{0}\) : \(\beta_{1}\)=…=\(\beta{j}\)
\(H_{1}\) : minimal terdapat satu \(\beta_{j}\) yang berbeda
Statistik Uji:
Derajat Bebas (db) : \[ db_{Perlakuan}= p-1 \] \[ db_{Kelompok}= r-1 \] \[ db_{Galat}= (p-1)(r-1) \] \[ db_{Total}= pr-1 \]
Jumlah Kuadrat (JK) : \[ FK=\frac{(\Sigma{Y_{ij}})^2}{pr} \] \[ JKT=\Sigma_{i}^{p}\Sigma_{j=1}^rY_{ij}^2-FK \]
\[ JKP={\Sigma_{i}^{p}}\frac{(\Sigma_{j=1}^rY_{ij}^2)}{r}-FK \] \[ JKK=\Sigma_{j}^{r}\frac{(\Sigma_{i=1}^p{Y_{ij}^2)}}p-FK \] \[ JKG=JKT-JKP-JKK \]
Kuadrat Tengah (KT) : \[ KTP=\frac{JKP}{p-1} \] \[ KTK=\frac{JKK}{r-1} \]
\[ KTG=\frac{JKG}{(p-1)(r-1)} \]
F hitung: \[ F_{hit,Perlakuan}=\frac{KTP}{KTG} \] \[ F_{hit,Kelompok}=\frac{KTK}{KTG} \]
F tabel = \(F_{db1},_{db2}\)
Keputusan:
Tolak \(H_{0}\) jika \(F_{hit}\) > \(F_{tabel}\)
Terima \(H_{0}\) jika \(F_{hit}\) < \(F_{tabel}\)
Keterangan:
p = perlakuan
r = ulangan
2.2.3 Asumsi Analis Ragam
Ketika dicurigai adanya pelanggaran asumsi berdasarkan pemeriksaan sisaan, maka pengujian asumsi secara formal harus dilakukan. Contoh pengujian asumsi adalah
Uji normalitas galat yang dilakukan dengan Uji Jarque Berra dan Saphiro Wilk
Uji kehomogenan ragam antar perlakuan yang dilakukan dengan Uji Levene
Hipotesis:
\(H_{0}\) : Pengamatan menyebar normal
\(H_{1}\) : Pengamatan tidak menyebar normal
Uji Jarque Berra
Statistik Jarque Berra dihitung berdasarkan koefisien skewness dan kurtosis yang diduga dari sampel teramati. Semakin tidak normal maka nilai skewness semakin menjauh dari nol dan kurtosis menjauh dari nilai K
\[ JB=\frac{n}{6}(S^2+\frac{1}{4}(K-3)^2) \]
Uji Shapiro Wilk
Uji Shapiro Wolk digunakan untuk mengidentifikasi apakah suatu peubah acak berdistribusi normal. Uji ini digunakan untuk sampel berukuran kecil
\[ W=\frac{(\Sigma_{i=1}a_{i}x_{(i)})^2}{\Sigma_{i=1}^{n}(x_{i}-x)^2} \]
Uji Levene
Hipotesis:
\(H_{0}\)=\(\sigma_{1}^2=\sigma_{2}^{2}=...=\sigma_{k}^2\)
\(H_{1}\)=paling tidak terdapat satu pasang \(\sigma_{i}^2\) dan \(\sigma_{j}^2\)
Kriteria penolakan dapat menggunakan nilai p yang diperoleh dari statistik uji sesuai sebaran \(F_{k-1},_{N-k}\)
2.2.4 Uji Lanjut
Ketika analisis ragam memberikan kesimpulan untuk menolak \(H_{0}\), maka paling sedikit terdapat satu pasang atau kelompok yang memiliki nilai tengah yang berbeda. Namun, dari analisis tersebut belum dapat ditentukan pasangan mana yang berbeda nilai tengahya. Untuk itu, perlu dilakukan uji lanjut, yaitu:
Uji BNT : Fisher’s LSD
Uji BNJ : Tukey’s HSD
Uji-uji tersebut dapat dilakukan ketika tidak ada pelanggaran pada asumsi normalitas dan kehomogenan ragam. Pada uji lanjut akan dilakukan perbandingan untuk seluruh pasang kelompok atau perlakuan.
Uji BNT
Uji BNT (Beda Nyata Terkecil) adalah perbandingan rata-rata antara dua nilai rata-rata atau perbandingan pasangan rata-rata. Dua rata-rata dinyatakan berbeda secara signifikan atau nyata apabila memiliki selisih yang lebih besar dibandingkan dengan nilai BNT-nya.
\[ BNT=t_{\frac{\alpha}{2}},_{N-k}\sqrt{KTG(\frac{1}{n_{i}}+\frac{1}{n_{i'}})} \]
Uji BNJ
Uji BNJ (Beda Nyata Jujur) digunakan untuk membandingkan seluruh pasangan rata-rata perlakuan setelah uji analisis ragam dilakukan.
\[ BNJ=q_{\frac{\alpha}{2}},_k,_{N-k}\sqrt{\frac{KTG}{2}(\frac{1}{n_{i}}+\frac{1}{n_{i'}})} \]
3 SOURCE CODE
3.1 Library
library(tseries)
library(car)
library(agricolae)
3.2 Input Data
> SP = c(2.4,3.0,2.1,3.0,3.4,2.3,2.3,2.5,2.4,2.5)
> P = c(3.0,3.1,2.7,2.6,3.1,2.9,2.9,2.8,2.5,2.6)
> N = c(3.1,2.4,3.5,2.9,3.4,4.0,3.4,2.9,3.4,3.3)
> Berat_Bayi = c(SP,P,N)3.3 Data Frame
> Tinggi_Ibu = factor(c(rep("1",10),rep("2",10),rep("3",10)))
> data = data.frame(Tinggi_Ibu,Berat_Bayi)3.4 Boxplot
> boxplot(Berat_Bayi~Tinggi_Ibu,data=data,main="Boxplot",xlab="Tinggi_Ibu",ylab="Berat_Bayi")3.5 ANOVA
> anova = aov(Berat_Bayi~Tinggi_Ibu,data=data)
> summary(anova)3.6 Diagnostik Sisaan
> plot(anova,1)> plot(anova,2)> plot(anova,3)3.7 Uji Normalitas
> sisa = residuals(anova)
> library(tseries)
> jarque.bera.test(sisa)
> shapiro.test(sisa)
> library(car)
> leveneTest(Berat_Bayi~Tinggi_Ibu,data=data)3.8 Uji Lanjut
> library(agricolae)
> BNT = LSD.test(anova,"Tinggi_Ibu",alpha=0.05)
> BNT
> BNT$groups
> BNT$means
> plot(BNT)> TukeyHSD(anova,conf.level=0.95)
> plot(TukeyHSD(anova))4 HASIL DAN PEMBAHASAN
Dari hasil analisis ragam yang telah diperoleh, maka dapat disimpulkan sebagai berikut:
4.1 Boxplot
Secara visual terlihat bahwa terdapat perbedaan antara rata-rata berat bayi antar tinggi ibu yang berbeda-beda, namun perbedaannya tidak terlalu signifikan.
4.2 Analisis Ragam
Df Sum Sq Mean Sq F value Pr(>F)
Tinggi_Ibu 2 2.102 1.0510 7.913 0.00197 **
Residuals 27 3.586 0.1328
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Diperoleh nilai-p sebesar 0.00197, dimana dengan nilai tersebut maka terdapat bukti bahwa paling sedikit satu tinggi badan ibu yang secara signifikan memiliki rata-rata berat badan bayi yang berbeda.
4.3 Diagnostic Plots
Plot 1 merupakan plot Residuals vs Filled yang digunakan untuk memeriksa ketepatan model. Jika dilihat dari plot yang telah diperoleh, terlihat bahwa garis merah yang menghubungkan pusat dari 3 kelompok sisaan masih terlihat datar (horizontal), maka dapat disimpulkan bahwa model sudah tepat
Plot 2 merupakan Q-Q plot untuk normalitas. Pada plot di atas terlihat bahwa titik-titik tidak berada jauh dari garis sudut 45 derajat antara sumbu X dan Y di kuadran I. Jadi, secara grafis tidak ada indikasi pelanggaran normalitas
Plot 3 merupakan Plot Scale - Location untuk memeriksa kesamaan ragam. Garis merah pada plot diatas menghubungkan pusat dari 3 kelompok akar sisaan yang dibakukan, cenderung membentuk kurva kuadrat, walaupun tidak terlalu ekstrim. Ada kecurigaan ketidaksamaan ragam, perlu dipastikan dengan uji.
4.4 Uji Normalitas
Jarque Bera Test
data: sisa
X-squared = 0.52941, df = 2, p-value = 0.7674
Shapiro-Wilk normality test
data: sisa
W = 0.96895, p-value = 0.511
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.7313 0.4906
27
Dari hasil Levene’s Test diperoleh nilai-p sebesar 0.4906 yang dianggap cukup besar, sehingga \(H_{0}\) tentang kesamaan ragam antar tinggi ibu tidak dapat ditolak.
4.5 Uji Lanjut
$statistics
MSerror Df Mean CV t.value LSD
0.1328148 27 2.88 12.65409 2.051831 0.3344104
$parameters
test p.ajusted name.t ntr alpha
Fisher-LSD none Tinggi_Ibu 3 0.05
$means
Berat_Bayi std r LCL UCL Min Max Q25 Q50 Q75
1 2.59 0.4067486 10 2.353536 2.826464 2.1 3.4 2.325 2.45 2.875
2 2.82 0.2149935 10 2.583536 3.056464 2.5 3.1 2.625 2.85 2.975
3 3.23 0.4321779 10 2.993536 3.466464 2.4 4.0 2.950 3.35 3.400
$comparison
NULL
$groups
Berat_Bayi groups
3 3.23 a
2 2.82 b
1 2.59 b
attr(,"class")
[1] "group"
Berat_Bayi groups
3 3.23 a
2 2.82 b
1 2.59 b
Berat_Bayi std r LCL UCL Min Max Q25 Q50 Q75
1 2.59 0.4067486 10 2.353536 2.826464 2.1 3.4 2.325 2.45 2.875
2 2.82 0.2149935 10 2.583536 3.056464 2.5 3.1 2.625 2.85 2.975
3 3.23 0.4321779 10 2.993536 3.466464 2.4 4.0 2.950 3.35 3.400
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Berat_Bayi ~ Tinggi_Ibu, data = data)
$Tinggi_Ibu
diff lwr upr p adj
2-1 0.23 -0.174099166 0.6340992 0.3494247
3-1 0.64 0.235900834 1.0440992 0.0015093
3-2 0.41 0.005900834 0.8140992 0.0462398
Berdasarkan hasil BNJ dan BNT, berat badan bayi dengan tinggi badan ibu sangat pendek dan pendek sama secara rata-rata. Sedangkan, berat badan bayi dengan tinggi badan ibu yang tinggi memiliki rata-rata yang berbeda
5 KESIMPULAN
Berdasarkan perhitungan analisis ragam dan asumsi serta uji lanjut yang telah dilakukan, maka dapat disimpulkan bahwa terdapat perbedaan rata-rata berat badan bayi yang dilahirkan ketiga kelompok ibu berdasarkan tinggi badan.
6 DAFTAR PUSTAKA
Sugiyono, 2007. Statistika untuk penelitian. Bandung: Alfabeta.
Budiwanto, 2017. Metode Statistika untik Mengolah Data Keolahragaan. Malang: Universitas Negeri Malang.