Penerapan One-Way Anova dalam Perbandingan Tinggi Siswa Kelas A, Kelas B, dan Kelas C di Sekolah Menengah Atas 3 Jakarta Tahun Ajaran 2016/2017

Izzan Azka Aulia

Mei 2022

1 PENDAHULUAN

1.1 Latar Belakang

      Sebuah sekolah di Jakarta yaitu SMA 3 Jakarta ingin mengikuti sebuah perlombaan tingkat provinsi yang diselenggarakan oleh Pemkot DKI Jakarta yaitu lomba paskibra. Paskibraka yang akan dipilih dari para siswa untuk mengikuti lomba diharapkan memenuhi persyaratan yang diberikan oleh panitia lomba yaitu tinggi badan yang lebih dari 167cm. SMA 3 Jakarta memiliki 3 kelas, yaitu kelas A, kelas B, dan kelas C yang akan melakukan seleksi tinggi badan untuk mengetahui kelas mana yang memiliki siswa dengan tinggi yang memenuhi syarat paling banyak.
      Dalam seleksi ini, ingin diketahui perbedaan dari tiga kelas, yaitu kelas A, kelas B, dan kelas C terhadap tinggi siswa SMA 3 Jakarta. Sehingga, analisis yang tepat untuk digunakan adalah one-way ANOVA. Penerapan one-way ANOVA ini diharapkan mampu memberikan kesimpulan dengan tepat agar kelas yang memiliki siswa dengan tinggi yang memenuhi syarat paling banyak dapat terpilih.

1.2 Statistika Deskriptif

     Statistik deskriptif adalah statistik yang digunakan untuk menganalisa data dengan cara mendeskripsikan atau mengambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi

(Sugiono, 2012:206). Statistika deskriptif dapat disajikan dalam berbagai bentuk yaitu Histogram, pie chart, tabel, poligon, ogive, dan diagram batang daun (stem and leaf). Berikut merupakan contoh diagaram pada statistika deskriptif. Statistika deskriptif digunakan para peneliti untuk dapat memvisualisasi hasil data yang diperoleh di lapangan.

1.3 Asumsi Normalitas

      Menurut Ghozali (2013:160) uji normalitas bertujuan untuk menguji apakah dalam model regresi variabel pengganggu atau residual memiliki distribusi normal.Seperti diketahui bahwa uji t dan F mengasumsikan bahwa nilai residual mengikuti distribusi

normal.Kalau asumsi ini dilanggar maka uji statistik menjadi tidak valid untuk jumlah sampel kecil.Nilai residual dikatakan berdistribusi normal jika nilai residual tersebut sebagian besar mendekati nilai rata-rata. Uji normalitas tidak dilakukan pervariabel tetapi dilakukan terhadap nilai residualnya. Parameter asumsi normalitas data metode deskriptif adalah Histogram, Boxplot, Normal q-q Plot, Detrended Q-Q Plot (data menyebar sekitar garis pada nilai 0). Dasar pengambilan keputusan pada Normal q-q plot dapat dilihat dari titik-titik yang menyebar pada q-q plot. Jika titik-titik berada disekitar garis diagonal maka data residual data berdistribusi secara normal. (Dahlan, 2017). Namun pada perhitungan one-way ANOVA uji normalitas langsung menggunakan variabel continue tanpa residual.

1.4 Asumsi Homoskedastisitas

      Uji heteroskedastisitas adalah untuk melihat apakah terdapat ketidaksamaan varians dari residual satu ke pengamatan ke pengamatan yang lain. Jika varian dari residual satu pengamatan ke pengamatan lain tetap, maka disebut homoskedastisitas, dan jika variance dari residual satu pengamatan ke pengamatan lain berbeda disebut

heteroskedastisitas. Untuk mendeteksi ada atau tidaknya gejala heteroskedastisitas dapat dilakukan dengan melihat melakukan uji glejser, (Ghozali, 2013:139). Salah satu uji homoskedastisitas adalah Bartlett Test untuk melihat apakah grup memiliki varian sama atau berbeda.

Hipotesis yang diajukan sebagai berikut:

\(H_0: Varian~grup~bersifat~homogen~(sama)\)
\(H_1: Varian~grup~bersifat~heterogen~(berbeda)\)

Kriteria pengambilan keputusan:

Jika sig. (p value) kurang dari sama dengan alpha (5%) maka H0 ditolak artinya varian grup bersifat heterogen (berbeda). sebalikya jika sig. (p value) lebih besar dari alpha (5%) maka H0 diterima artinya varian grup bersifat homogen (sama) (Ghozali,2016).

1.5 One-Way ANOVA

      Menurut Ghozali (2006), Analisis of Variance merupakan metode untuk menguji hubungan antara satu variabel (skala metrik) dengan satu atau lebih variabel(skala nonmetrik atau kategorikal dengan kategori lebih dari dua). Hubungan antara satu variabel dependen dengan satu variabel independen one way ANOVA (Ghozali, 2006). ANOVA digunakan untuk mengetahui pengaruh utama (main effect) dan pengaruh interaksi (interaction effect) dari variabel independen kategorikal terhadap variabel dependen metrik (Ghozali, 2006). Sedangkan menurut Ghozali (2006), pengaruh interaksi adalah pengaruh bersama atau joint effect dua atau lebih variabel independen terhadap variabel dependen.

1.6 Data

      Data adalah sekumpulan keterangan ataupun fakta yang dibuat dengan kata-kata, kalimat, simbol, angka, dan lainnya. Data disini didapatkan melalui sebuah proses pencarian dan juga pengamatan yang tepat berdasarkan sumber-sumber tertentu. Adapun pengertian lain dari data yaitu sebagai suatu kumpulan keterangan atau deskripsi dasar yang berasal dari obyek ataupun kejadian. Sumber data dibagi menjadi 2 ,yaitu data primer dan data sekunder
      Dalam penerapan one-way ANOVA kasus ini digunakan data sekunder yang berasal dari hasil pengumpulan data primer hasil tinggi badan siswa yang dilakukan oleh SMA 3 Jakarta tahun ajaran 2016/2017. Data berisi hasil tinggi siswa dari 3 kelas yang berbeda ,yaitu A, B, dan C. Dalam upaya mencari kelas yang memiliki siswa dengan tinggi badan yang sesuai dengan syarat keikutsertaan lomba paskibra.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library
> # Library (readxl)
> # Library (dplyr)
> # Library (tidyr)

2.2 Data Tinggi Badan Siswa SMA 3 Jakarta

> library(readxl)
> DataAnovaKomstat <- read_excel("E:/DataAnovaKomstat.xlsx", 
+     range = "A1:C16")

Source code diatas digunakan untuk mangambil data yang akan digunakan dari “E:/DataAnovaKomstat.xlsx” yang merupakan lokasi file data excel yang akan digunakan. Function yang digunakan adalah read_excel yang ada pada library readxl lalu diberi nama DataAnovaKomstat

> library(rmarkdown)
> paged_table(as.data.frame(DataAnovaKomstat))

Source code diatas digunakan untuk menampilkan data yang sudah diimport dari excel menjadi sebuah tabel. Library yang dibutuhkan adalah rmarkdown. Dengan syarat dalam penggunaan function paged_table adalah data harus berbentuk dataframe, jadi kita buat data excel praktikum menjadi (as.data.frame).

2.3 Asumsi Normalitas

Grafik Normal QQ-Plot

> library(tidyr)
> library(dplyr)
> 
> A <- DataAnovaKomstat$`Class A`    
> B <- DataAnovaKomstat$`Class B`    
> C <- DataAnovaKomstat$`Class C` 
> DataTinggi <- data.frame (A,B,C)
> 
> DataTinggi <- DataTinggi %>%
+ pivot_longer(c(A,B,C))
> 
> names(DataTinggi) <- c("Kelas","Tinggi.Badan")
> DataTinggi
# A tibble: 45 × 2
   Kelas Tinggi.Badan
   <chr>        <dbl>
 1 A             156 
 2 B             156.
 3 C             157.
 4 A             160.
 5 B             160.
 6 C             162.
 7 A             162.
 8 B             161 
 9 C             163.
10 A             164.
# … with 35 more rows
> DataTinggi$Kelas <- as.factor(DataTinggi$Kelas) 
> 
> qqnorm(DataTinggi$Tinggi.Badan, col = "darkviolet")
> qqline(DataTinggi$Tinggi.Badan)

A, B, dan C adalah penamaan data dari A = Class A, B = Class B, C = Class C. Simbol $ digunakan untuk memanggil data yang ingin dipanggil dari ‘DataAnovaKomstat’. Kita dapat membentuk data frame “DataAnovaKomstat” dari A, B, dan C.

Function pivot_longer digunakan untuk membuat kolom Program (A,B,C) menjadi satu kolom dan memisahkan antara faktor Kelas dengan Hasil tinggi badan.

Function names digunakan untuk memberi nama pada Tabel Data.

Function as.factor digunakan untuk mendefinisikan Program yang diambil dari DataAnovaKomstat sebagai faktor.

Function qqnorm()digunakan untuk menampilkan Grafik Normal QQ

Function qqline() digunakan sebagai garis linear.Data yang digunakan adalah Pengurangan Berat Badan dari tabel Data

2.4 Asumsi Homoskedastisitas

Bartlett test

> #hitung varian masing masing kelas
> A <- DataAnovaKomstat$`Class A`
> B <- DataAnovaKomstat$`Class B`
> C <- DataAnovaKomstat$`Class C`
> 
> A2 <- A^2
> B2 <- B^2
> C2 <- C^2
> 
> nA <- length(A)
> nB <- length(B)
> nC <- length(C)
> 
> dbA <- nA - 1
> dbB <- nB - 1
> dbC <- nC - 1
> 
> Si2A    <- (nA*sum(A2) - (sum(A))^2)/nA*dbA
> 
> Si2B    <- (nB*sum(B2) - (sum(B))^2)/nB*dbB
> 
> Si2C    <- (nC*sum(C2) - (sum(C)^2))/nC*dbC

Perhitungan manual dengan mendefinisikan A, B, dan C berturut-turut dari ekstrak Class A, Class B, dan Class C dengan menggunakan simbol $.

A2, B2, dan C2 merupakan hasil kuadrat berturut-turut dari A, B, dan C dengan simbol ^.

nA, nB, dan nC merupakan jumlah data berturut-turut dari A, B, C dengan function length.

Argumen nya dapat diisikan untuk masing variabel mulai dari A, B, dan C. dbA, dbB, dan dbC merupakan derajat kebebasan dengan rumus \(n - 1\).

Menghitung nilai \(S_i^2\) atau varian masing-masing variabel. Salah satu function yang digunakan adalah sum untuk menjumlahkan seluruh data yang diinginkan.

> #Menghitung varian gabungan
> dbS2A   <- dbA*Si2A 
> dbS2B   <- dbB*Si2B
> dbS2C   <- dbC*Si2C 
> 
> S2gab   <- sum(dbS2A + dbS2B  + dbS2C) / (dbA+dbB+dbC)
> 
> LogS2gab <- log10(S2gab)

Menghitung varian gabungan yakni hasil dari \(Log (S^2gab)\). Function yang digunakan yaitu Log10().

> #Menghitung nilai satuan Bartlett
> Bartlet <- (dbA+dbB+dbC)*LogS2gab
> 
> #Menghitung chi kuadrat hitung
> dblogs2A <- dbA*log10(Si2A)
> dblogs2B <- dbB*log10(Si2B)
> dblogs2C <- dbC*log10(Si2C)
> sumdblog <- (sum(dblogs2A + dblogs2B+ dblogs2C))
> 
> chikuadrat <- log(10)*(Bartlet - (sumdblog))
> 
> 
> chitabel <- qchisq(0.05,9)
> 
> chikuadrat ; chitabel
[1] 1.69857
[1] 3.325113

Perhitungan nilai satuan bartlett merupakan hasil dari total derajat bebas dikali dengan hasil \(Log(S^2gab)\).

Menghitung statistik uji \(Chisquare\) adalah hasil dari \(Ln\) dikali hasil dari nilai satuan bartlett dikurangi jumlah derajat bebas. Titik kritis \(X^2table\) diperoleh dengan function qchisq dengan argumen yang diisikan adalah peluang tingkat kebenaran dan degree of freedom kelompok.

2.5 One-way ANOVA

Langkah 1. Mengubah Bentuk Tabel

> A <- DataAnovaKomstat$`Class A`    
> B <- DataAnovaKomstat$`Class B`    
> C <- DataAnovaKomstat$`Class C` 
> DataTinggi <- data.frame (A,B,C)
> DataTinggi
       A     B     C
1  156.0 156.5 156.7
2  160.4 160.1 161.9
3  161.7 161.0 162.9
4  163.6 161.2 165.0
5  163.8 161.4 165.5
6  164.8 162.5 166.1
7  165.8 162.6 166.2
8  165.8 162.9 166.2
9  166.2 163.1 167.1
10 168.0 164.4 169.1
11 168.1 165.9 170.9
12 168.4 166.0 171.4
13 168.7 166.3 172.0
14 169.4 167.3 172.2
15 170.0 168.9 173.3

A, B, C adalah penamaan data dari A = Class A, B = Class B, C = Class C.

Simbol $ digunakan untuk memanggil data yang ingin dipanggil dari Data Excel yang bernama (DataAnovaKomstat).

Bentuk data frame “DataTinggi” dari A, B, dan C

Langkah 2. Menghitung n

> nA <- length(A)
> nB <- length(B)
> nC <- length(C)
> 
> N  <- nA + nB + nC

Function length digunakan untuk menghitung jumlah data dari A,B,C. Dengan memberi nama hitungan tersebut dengan nama nA +nB +nC.

Perintah dengan nama N digunakan untuk mendeskripsikan bahwa N adalah penjumlahan dari data nA +nB +nC.

Langkah 3. Menghitung Jumlah Masing-Masing Variabel

> sumA <- sum (A)
> sumB <- sum (B)
> sumC <- sum (C)
> 
> SumGab <- sumA + sumB + sumC
> 
> Akuadrat <- A^2
> Bkuadrat <- B^2
> Ckuadrat <- C^2

Function sum digunakan untuk menghitung jumlah dari masing-masing variabel

SumGab digunakan untuk total dari jumlah masing-masing variabel.

Menghitung A^2, B^2, C^2 dengan memberi nama perhitungan dengan Akuadrat, Bkuadrat, Ckuadrat.

Langkah 4. Hitung Jumlah Kuadrat

> JKP <- ((sumA^2/nA) + (sumB^2/nB) + (sumC^2/nC)) - (SumGab^2/N)
> 
> JKT <- (sum(Akuadrat) + sum(Bkuadrat) + sum(Ckuadrat)) - SumGab^2/N
> 
> JKG <- JKT - JKP
> 
> JKP ; JKG ; JKT
[1] 106.288
[1] 635.8
[1] 742.088

JKP merupakan jumlah kuadrat perlakuan hasil perhitungan \(\sum\frac{A^2}{nA}\), \(\sum\frac{B^2}{nB}\), dan \(\sum\frac{C^2}{nC}\) - \(\frac{sumGab^2}{N}\).

JKT merupakan jumlah kuadrat tengah hasil perhitungan \(\sum A^2\) + \(\sum B^2\) + \(\sum C^2\).

JKG merupakan jumlah kuadrat galat atau error hasil perhitungan \(JKT - JKP\)

Langkah 5. Hitung DB

> DBp <- (dim(DataAnovaKomstat)[2]) - 1
> DBg <- N - (dim(DataAnovaKomstat)[2])
> DBt <- N - 1
> DBp ; DBg ; DBt
[1] 2
[1] 42
[1] 44

Derajat bebas perlakuan (DBp) merupakan hasil dari \(total~perlakuan - 1\).

Derajat bebas galat (DBg) merupakan hasil dari \(total~pengamatan - total~perlakuan\).

Derajat bebas total (DBt) merupakan hasil dari \(total~pengamatan - 1\)

Langkah 6. Hitung Kuadrat Tengah

> KTp <- JKP / DBp
> KTg <- JKG / DBg
> 
> KTp ; KTg
[1] 53.144
[1] 15.1381

Kuadrat tengah perlakuan merupakan hasil dari \(\frac{JKP}{DBp}\).

Kuadrat tengah galat merupakan hasil dari \(\frac{JKG}{DBg}\)

Langkah 7. Hitung Statistik Uji Simultan F

> Fp   <- KTp / KTg
> pVal <- pf(Fp,DBp, DBg, lower.tail = F)
> 
> Fp ; pVal
[1] 3.510613
[1] 0.03891951

Nilai statistik uji F diperoleh dari hasil bagi \(\frac{KTp}{KTg}\).

\(p-value\) diperoleh dengan function pf dan argumen yang diisi adalah Fhitung,db perlakuan, db galat, sisi kanan.

Langkah 8. Bentuk Tabel one-way ANOVA

> 
>  SK    <- c("Perlakuan", "Galat", "Total")
>  DB    <- c(DBp,  DBg, DBt) 
>  JK    <- c(JKP,  JKG, JKT)
>  KT    <- c(KTp,  KTg, NA)  
>  Fhit  <- c(Fp,   NA,  NA)  
>  p.Val <- c(pVal, NA,  NA)  
> paged_table(data.frame(SK,DB,JK,KT,Fhit,p.Val))

Mendefinisikan masing-masing data yang dibutuhkan pada tabel anova yaitu SK dengan (“Perlakuan”, “Galat”, “Total”), DB, JK, KT, Fhit, dan \(p-value\).

NA merupakan data kosong bertujuan agar tidak terjadi error.

Function paged_table untuk membentuk tabel yang berisi dataframe dari SK,DB,JK,KT,Fhit, dan \(p-value\).

3 HASIL DAN PEMBAHASAN

3.1 Hasil Asumsi Normalitas

Hasil QQ-Plot normalitas adalah sebagai berikut:

Interpretasi

    Berdasarkan dari grafik Normal QQ-Plot titik-titik menyebar disekitar daerah garis diagonal. Sehingga dapat disimpulkan bahwa data menyebar secara normal. Namun terdapat 3 (dua) outlier pada data yang artinya ada data yang berbeda jauh dari pola data lainnya. Dalam penelitian ini tetap menggunakan data outlier tersebut dikarenakan dapat mempengaruhi hasil dan keputusan.

3.2 Hasil Asumsi Homoskedastisitas

Hipotesis

\(H_0: Varian~grup~bersifat~homogen~(sama)\)
\(H_1: Varian~grup~bersifat~heterogen~(berbeda)\)

Nilai Satuan Bartlett:

       \(B = (\sum db).(LogS^2_g)= 145.8377\)

Chi-Square Hitung:

       \(X^2_{hitung}= Ln.(B-\sum dbLogS^2_i) = 1.69857\)

Chi-Square tabel:

       \(X^2_{(0.05;2)} = 3.325113\)

Keputusan

       Nilai \(X^2_{hitung}\) < \(X^2_{(0.05;2)}\), maka Terima \(H_0\)

Interpretasi

Dapat disimpulkan berdasarkan taraf nyata 5%, varian grup bersifat homogen.

3.3 Hasil One-way ANOVA

Hipotesis

\(H_0: Tidak~terdapat~perbedaan~signifikan~antar~metode~pembelajaran\)
\(H_1: Terdapat~perbedaan~signifikan~antar~metode~pembelajaran\)

Hasil perhitungan uji F parsial disajikan pada tabel ANOVA berikut:

Keputusan

Karena \(p-value\) (3.510613) > \(alpha (0.05)\), Maka Terima \(H_0\)

Interpretasi

Dengan taraf nyata 5% dapat disimpulkan tidak terdapat perbedaan signifikan antar kelas.

4 KESIMPULAN

Berdasarkan hasil perhitungan one-way ANOVA dapat disimpulkan bahwa antar ketiga kelas yaitu Class A, Class B, dan Class C tidak terdapat perbedaan yang signifikan. Sehingga, tidak perlu dilakukan uji lanjut untuk mengetahui kelas mana yang paling cocok untuk menjadi perwakilan lomba paskibra. SMA 3 Jakarta dapat menggunakan salah satu dari ketiga kelas tersebut untuk menjadi perwakilan karena sama efektifnya.

5 DAFTAR PUSTAKA

Cynthia D. & Mudiantono. 2013. ANALISIS PERBEDAAN RESPON SIKAP AUDIENCE ATAS STRATEGI PROMOSI PRODUCT PLACEMENT DALAM FILM HABIBIE & AINUN

Setiawati. 2021. ANALISIS PENGARUH KEBIJAKAN DEVIDEN TERHADAP NILAI PERUSAHAAN PADA PERUSAHAAN FARMASI DI BEI

Yani T.,Saiful A.,w & Muhammad A.. 2020. PENGARUH DISIPLIN KERJA TERHADAP KINERJA KARYAWAN PADA RSU BHAKTI RAHAYU AMBON

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5296382/

https://www.gramedia.com/literasi/pengertian-data/