1 PENDAHULUAN

1.1 Latar Belakang

Ilmu statistika dapat diaplikasikan hampir di semua bidang kehidupan terutama pada bidang yang memiliki data dan memerlukan ilmu statistika untuk membantu menganalisis data guna meningkatkan kualitas suatu produk yang dihasilkan. Dalam statistika ada berbagai macam metode yang digunakan untuk menganalisis data sesuai dengan syarat dan ketentuan agar dapat dianalisis dengan metode tertentu. Salah satunya adalah metode analisis ragam atau yang biasa disebut ANOVA Untuk dapat menggunakan analisis ini, data harus memenuhi asumsi normalitas dan heterogenitas. Pada kesempatan ini data yang digunakan merupakan data sekunder yang mempunyai 1 variabel respons dan 1 variabel bebas yang berperan sebagai faktor. Oleh karena itu data dapat dianalisis menggunakan analisis ragam satu arah atau One-Way Anova setelah dilakukan uji asumsi terlebih dahulu. Dilakukan eksperimen terhadap suatu jenis tanaman dimana eksperimen bertujuan untuk membandingkan hasil (yang diukur dengan berat kering tanaman) yang diperoleh di bawah kontrol dan dua kondisi perlakuan yang berbeda (treatment 1 dan treatment 2). Guna menghasilkan hasil eksperimen yang baik diperlukan lingkungan homogen yaitu tidak ada faktor lain yang dianggap berpengaruh. Tujuan dari analisis ragam pada data berat kering tanaman ini adalah untuk mengetahui apakah variabel bebas (control, treatment 1, dan treatment 2) berpengaruh terhadap berat kering tanaman atau tidak, serta untuk mengetahui bagaimana hubungan diantara keduanya.

1.2 Statistika Deskriptif

Pengumpulan dan penyajian data secara visual agar dapat memberikan informasi tanpa menarik kesimpulan disebut statistika deskriptif. Dengan kata lain, statistika deskriptif adalah cara memberikan informasi dari suatu data tanpa melalui pengolahan data atau analisis dahulu. Dalam statistika deskriptif data berat kering tanaman dijelaskan melalui ukuran pemusatan yaitu rata-rata, ukuran penyebaran yaitu ragam dan jangkauan.

a. Rata-rata (Mean)

Rata-rata (mean) diperoleh dengan cara perbandingan jumlah seluruh data dan banyaknya data. Adanya nilai ekstrem pada data dapat mempengaruhi besarnya mean data. \[ \mu = \frac{\Sigma x_i}{n} \]

b. Ragam (Varians)

Ragam (varians) adalah nilai perbandingan antara simpangan baku (standar deviasi) dengan nilai rata-ratanya. Ragam ini digunakan untuk mengetahui jarak sebaran data yang ada dan seberapa dekat titik data individu dengan mean dari data itu sendiri. \[ S^2 = \frac{\Sigma (x_i-\mu)^2}{n} \]

c. Jangkauan (Range)

Jangkauan (range) adalah nilai dari selisih nilai maksimum dan nilai minimum yang ada pada data. Jangkauan didapatkan dengan cara berikut: \[ J = x_{max} - x_{min} \] ## Analisis Ragam (ANOVA)

Analisis ragam adalah salah satu metode analisis data yang menguraikan keragaman total menjadi beberapa komponen penyusun model. Komponen penyusun model terdiri atas keragaman total yaitu perlakuan dan galat. Analisis ragam dapat dilakukan satu arah (One-Way ANOVA) atau dua arah (Two-Way ANOVA). Data yang terdiri atas 1 variabel respons dan 1 variabel bebas yang berperan sebagai faktor menggunakan analisis ragam satu arah (One-Way). Sedangkan apabila data terdiri atas 1 variabel respons dan 2 variabel bebas yang berperan sebagai faktor menggunakan analisis ragam dua arah (Two-Way).

Asumsi ANOVA:

  1. Asumsi Normalitas: Data yang digunakan harus memenuhi uji normalitas, artinya data berdistribusi normal.

  2. Asumsi Heteroskedastisitas: Data yang digunakan harus memenuhi uji heteroskedasitas, artinya data mempunyai ragam yang homogen yang dapat diketahui melalui uji variansi. Hipotesis: \[ H_0: \sigma_1^2 = \sigma_2^2 = \dots =\sigma^2 \] \[ H_1: \sigma_i^2 ??? \sigma^2 \] Hipotesis ANOVA \[ H_0: \mu_1 = \mu_2 = \dots =\mu_k \] \[ H_1: \mu_i \not= \mu_i^{'} \]

Apabila nilai-p < 0.05 maka terima hipotesis alternatif.

Langkah-langkah analisis ragam

  1. Melakukan uji asumsi normalitas dan heteroskedastisitas.

  2. Menghitung derajat bebas (DB).

    dbPerlakuan \[dbPerlakuan=k-1\] dbGalat \[dbGalat= \Sigma_{i=1}^k n_i -k\] dbTotal \[ dbTotal=\Sigma_{i=1}^k n_i -1\]

  3. Menghitung jumlah kuadrat (JK)

    JKPerlakuan \[JKPerlakuan=\Sigma_{i=1}^k n_i (Ybar_{i.} - Ybar_{..})^2\] JKGalat \[JKGalat=\Sigma_{j=1}^{n_i} \Sigma_{i=1}^k (Y_{ij} - Ybar_{i.})^2\] JKTotal \[JKTotal=\Sigma_{j=1}^{n_i} \Sigma_{i=1}^k (Y_{ij} - Ybar_{i.})^2\]

  4. Menghitung kuadrat tengah (KT)

    KTPerlakuan \[ KTPerlakuan= \frac{JKPerlakuan}{k-1}\] KTGalat \[ KTGalat= \frac{JKGalat}{\Sigma_{i=1}^k n_i-k}\]

  5. Mencari nilai Fhitung. \[ F_{hit} = \frac{KTPerlakuan}{KTGalat}\]

  6. Membuat tabel ANOVA

  7. Menghitung effect size \[\eta^2 = \frac{JKPerlakuan}{JKTotal}\] Effect size adalah besaran variabilitas dari respons yang dapat dijelaskan oleh sumber keragaman perlakuan. Di mana apabila effect size bernilai 0 maka tidak terdapat hubungan antara keduanya dan apabila bernilai 1 maka keduanya mempunyai hubungan sempurna.

  8. Menarik keputusan dan kesimpulan

2 DATA

Data yang digunakan merupakan data sekunder dari R dataset yaitu data ‘PlantGrowth’ dengan variabel respons merupakan berat kering tanaman (weight) dan variabel bebas merupakan group (control, treatment 1, dan treatment 2).

Weight Group
4.17 ctrl
5.58 ctrl
5.18 ctrl
6.11 ctrl
4.50 ctrl
4.61 ctrl
5.58 ctrl
5.17 ctrl
4.53 ctrl
5.33 ctrl
5.16 ctrl
4.81 trt1
4.17 trt1
4.41 trt1
3.59 trt1
5.87 trt1
3.83 trt1
6.03 trt1
4.89 trt1
4.32 trt1
4.69 trt1
6.31 trt2
5.12 trt2
5.54 trt2
5.50 trt2
5.37 trt2
5.29 trt2
4.92 trt2
6.15 trt2
5.80 trt2
5.26 trt2

Table: Plant Growth

3 SOURCE CODE

3.1 Library yang Dibutuhkan

> # Library
> library(car)
> library(tidyr)

Library car digunakan untuk memanggil fungsi leveneTest untuk melakukan uji heteroskedastisitas. sedangkan library tidyr digunakan memanggil fungsi yang berfungsi untuk menghitung derajat bebas.

3.2 Membangkitkan Data

> #Data
> data("PlantGrowth")
> str(PlantGrowth)
'data.frame':   30 obs. of  2 variables:
 $ weight: num  4.17 5.58 5.18 6.11 4.5 4.61 5.17 4.53 5.33 5.14 ...
 $ group : Factor w/ 3 levels "ctrl","trt1",..: 1 1 1 1 1 1 1 1 1 1 ...
> Y<-PlantGrowth$weight
> Y
 [1] 4.17 5.58 5.18 6.11 4.50 4.61 5.17 4.53 5.33 5.14 4.81 4.17 4.41 3.59 5.87
[16] 3.83 6.03 4.89 4.32 4.69 6.31 5.12 5.54 5.50 5.37 5.29 4.92 6.15 5.80 5.26
> X<-PlantGrowth$group
> X
 [1] ctrl ctrl ctrl ctrl ctrl ctrl ctrl ctrl ctrl ctrl trt1 trt1 trt1 trt1 trt1
[16] trt1 trt1 trt1 trt1 trt1 trt2 trt2 trt2 trt2 trt2 trt2 trt2 trt2 trt2 trt2
Levels: ctrl trt1 trt2

Data dipanggil menggunakan fungsi data() karena data yang digunakan merupakan dataset R. Sedangkan fungsi str() digunakan untuk melihat type variabel pada data. Dimana pada data PlantGrowth tersebut variabel weight merupakan variabel respons dan variabel group merupakan variabel bebas dengan 3 faktor yaitu control, treatment 1, dan treatment 2.

3.3 Statistika Deskriptif

> #Statistika Deskriptif
> Mean<-mean(Y)
> Jangkauan<-range(Y)
> Ragam<-var(Y)
> Mean; Jangkauan; Ragam

[1] 5.073 [1] 3.59 6.31 [1] 0.49167

Pada bagian statistika deskriptif fungsi mean digunakan untuk mencari rata-rata, fungsi range digunakan untuk mencari jangkauan, dan fungsi var digunakan untuk mencari ragam pada data. Di mana masing-masing nilai fungsi akan tersimpan pada variabel dengan nama yang berbeda. Sehingga untuk memunculkan nilai dapat menggunakan nama variabel tersebut.

3.4 Boxplot

> #Boxplot Data
> boxplot=boxplot(weight~group, data=PlantGrowth,
+                 main="Boxplot Plant Growth",
+                 xlab="Group", ylab="Weight")

Selanjutnya untuk membuat boxplot data digunakan fungsi boxplot dengan detail yang dapat ditambahkan yaitu judul boxplot, keterangan pada sumbu-x dan sumbu-y.

3.5 Uji Asumsi

> #Uji Asumsi
> normalitas<-shapiro.test(Y)
> normalitas
Shapiro-Wilk normality test

data: Y W = 0.98268, p-value = 0.8915

> library(car)
> heteroskedastisitas<-leveneTest(Y~X, data=PlantGrowth)
> heteroskedastisitas

Levene’s Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 2 1.1192 0.3412 27

Fungsi shapiro.test digunakan untuk melakukan uji normalitas. Dengan memanggil library(car) maka fungsi leveneTest dapat digunakan untuk melakukan uji asumsi heteroskesdatisitas yaitu untuk melihat kehomogenan data.

3.6 Derajat Bebas (DB)

> #Hitung DB
> library(tidyr)
> N<-nrow(PlantGrowth)
> p<-PlantGrowth$group%>% unique() %>% length()
> DBTotal<-N-1
> DBPerlakuan<-p-1
> DBGalat<-N-p
> DB<-c(DBTotal, DBPerlakuan, DBGalat)
> DB

[1] 29 2 27

Memanggil library(tidyr) digunakan untuk memanggil fungsi yang berfungsi dalam perhitungan derajat bebas (DB). Di mana dalam analisis ini terdapat 3 DB yang terdiri atas DBTotal, DBPerlakuan, dan DBGalat. Kemudian hasil dari ketiga DB tersebut disatukan dalam vektor DB dengan menggunakan fungsi c(x, ... , ...).

3.7 Jumlah Kuadrat (JK)

> #Hitung JK
> perlakuan.mean<- aggregate(weight~group, PlantGrowth, mean)
> perlakuan.mean= perlakuan.mean$weight
> n<- aggregate(weight~group, PlantGrowth, length)
> n= n$weight
> grand.mean<- mean(PlantGrowth$weight)
> JKTotal<- sum((PlantGrowth$weight-grand.mean)^2)
> JKPerlakuan<-sum(n*(perlakuan.mean-grand.mean)^2)
> JKGalat<- JKTotal-JKPerlakuan
> JK<-c(JKTotal, JKPerlakuan, JKGalat)
> JK

[1] 14.25843 3.76634 10.49209

Fungsi aggregate digunakan untuk menghitung statistik ringkasanuntuk subset data untuk menggabungkan baris dengan faktor pengelompokkan. Untuk menghitung jumlah kuadrat (JK) sesuai dengan rumus yang sudah dijelaskan sebelumnya. Di mana dalam analisis ini terdapat 3 JK yang terdiri atas JKTotal, JKPerlakuan, dan JKGalat. Kemudian hasil dari ketiga JK tersebut disatukan dalam vektor JK dengan menggunakan fungsi c(x, ... , ...).

3.8 Kuadrat Tengah

> #Hitung KT
> KTPerlakuan<-JKPerlakuan/DBPerlakuan
> KTGalat<- JKGalat/DBGalat
> KT<-c(KTPerlakuan, KTGalat, NA)
> KT

[1] 1.8831700 0.3885959 NA

Perhitungan kuadrat tengah (KT) dilakukan sesuai rumus yang telah dijelaskan sebelumnya. Dalam analisis ini terdapat 3 KT yaitu KTPerlakuan dan KTGalat yang kemudian digabungkan dalam vektor KT dengan menggunakan fungsi c(x, ..., ...).

3.9 Statistik Uji

> #Statistik Uji F
> Fp<-KTPerlakuan/KTGalat
> pVal<-pf(Fp, DBPerlakuan, DBGalat, lower.tail = F)
> Fhitung<-c(Fp,NA,NA)
> Fhitung

[1] 4.846088 NA NA

> pVal<-c(pVal,NA,NA)
> pVal

[1] 0.01590996 NA NA

Fungsi pf() digunakan untuk menghitung nilai-p atau p-value. Karena hasil dari Fhitung dan nilai-p merupakan nilai tunggal, agar dapat digabungkan dalam tabel ANOVA maka diperlukan 2 elemen lain yang tidak mempengaruhi nilainya yaitu NA.

3.10 Tabel Anova

> #Tabel ANOVA
> SK<-c("Perlakuan", "Galat", "Total")
> SK
[1] "Perlakuan" "Galat"     "Total"    
> ANOVA<-data.frame(SK, DB, JK, KT, Fhitung, pVal)
> ANOVA
         SK DB       JK        KT  Fhitung       pVal
1 Perlakuan 29 14.25843 1.8831700 4.846088 0.01590996
2     Galat  2  3.76634 0.3885959       NA         NA
3     Total 27 10.49209        NA       NA         NA

Fungsi data.frame digunakan untuk membuat tabel data dengan komponen yang sudah dihitung sebelumnya yaitu SK, DB, JK, KT, Fhitung, dan pVal. Di mana tabel ini akan disimpan pada variabel ANOVA.

3.11 Effect Size

> #Effect Size
> etasq<-JKPerlakuan/JKTotal
> etasq

[1] 0.2641483

Nilai effect size disimpan pada variabel bernama etasq.

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

Berdasarkan data ‘Plant Growth’ yang digunakan, diperoleh nilai rata-rata

\[\mu = 5.073\] Artinya sebagian besar tanaman mempunyai berat kering 5.073.

Data terbesar bernilai 6.31 dan terendah bernilai 3.59. Sehingga didapatkan nilai jangkauan \[J= 6.31 - 3.59 = 2.72\] Artinya antara nilai terbesar dengan nilai terkecil pada data mempunyai rentang sebesar 2.72.

Kemudian ragam dari data tersebut \[\sigma^2= 0.49167\] Artinya data tersebut mempunyai keragaman yang tidak terlalu besar atau sebaran data dari rata-rata tidak terlalu besar.

4.2 Boxplot Data

Berdasarkan hasil Boxplot Plant Growth terlihat bahwa group atau variabel bebas terdiri atas 3 faktor yaitu control, treatment 1, dan treatment 2 yang mempunyai perbedaan rata-rata yang signifikan. Di mana faktor treatment 2 mempunyai nilai respons yang lebih tinggi daripada 2 faktor lainnya.

4.3 Uji Asumsi

Berdasarkan tabel Shapiro-Wilk diperoleh nilai-p=0.8915 dimana nilai-p cukup besar. Karena nilai-p > 0.05 maka keputusan terima H0. Sehingga dapat dikatakan bahwa data memenuhi asumsi normalitas (data berdistribusi normal). Berdasarkan tabel Lavene’s Test diperoleh nilai-p=0.3412 dimana nilai-p cukup besar. Karena nilai-p > 0.05 maka keputusan terima H0. Sehingga dapat dikatakan bahwa data memenuhi asumsi homogenitas (data mempunyai ragam homogen).

4.4 Analisis Ragam (ANOVA)

Berdasarkan tabel ANOVA yang dihasilkan nilai-p=0.01590996. Sehingga terdapat cukup bukti bahwa terdapat setidaknya satu faktor yang memiliki perbedaan ragam secara signifikan.

4.5 Effect Size

Dari hasil analisis, data tersebut mempunyai nilai effect size sebesar 0.2641483. Sehingga dapat dikatakan bahwa terdapat hubungan yang lemah di antara keduanya

5 DAFTAR PUSTAKA

Arizka, A. 2018. Analisis Ragam Rancangan Acak Lengkap Dengan Pendekatan Model Linier Umum (Doctoral dissertation, Universitas Brawijaya). Arul, A, I. Diego, F. Fahimah, D.W. Nisa, G.S. Widiarni. Analysis of Variance. Materi Praktikum Komputasi Statistika. Chambers, J.M, W.S. Cleveland, B. Kleiner, P.A. Tukey. 1998. Graphical Methods for Data Analysis. Duxbury Press. Hidayat, A. 2018. Penjelasan Lengkap ANOVA Sebagai Analisis Statistik. Santoso, A.B. 2019. Info Lengkap RAL dan RAK. Ezoic Publisher. Setiawan, A. 2019. Asumsi-Asumsi ANOVA Satu Arah. SmartStat. Tiyas. 2022. Statistika Deskriptif. Yuksinau.