Analisis T^2-Hotelling Untuk Mengetahui Apakah Terdapat Perbedaan Vektor Rata Rata

Novtry Rezki Simamora

03-01-2023

Library yang Dibutuhkan

> library("knitr")
> library(rmarkdown)
> library(prettydoc)
> library(tinytex)
> library(readxl)
> library(mvnormtest)
> library(asbio)
> library(DescTools)

1 PENDAHULUAN

1.1 Studi Kasus

Seorang peneliti ingin mengetahui apakah terdapat perbedaan vektor rata rata antara anak anak laki laki dan perempuan berusia 2 tahun di Kota ABC. Pada setiap anak dilakukan pengukuran tinggi badan (TB), lingkar dada (LD), dan lingkar lengan atas (LL). Untuk mencapai tujuan penelitian, dilakukan uji T^2 Hotelling pada data.

1.2 Tinjauan Pustaka

Uji T^2-Hotelling adalah salah satu uji statistik multivariat yang digunakan untuk melihat apakah terdapat perbedaan antara 2 kelompok percobaan yang terdiri dari 2 atau lebih variabel. Pada pengujian vektor rata rata dilakukan secara serentak pada semua variabel. Dengan kata lain, Uji T^2-Hotelling adalah Uji-T namun pada kasus multivariabel.

Fungsi Peluang Distribusi T^2-Hotelling

  • Untuk 1 Populasi

    dengan A = x’x = (N-1)S maka

    N : Ukuran Populasi
    Xbar : Mean sampel vector
    S : Matriks varcovar
    Sehingga sebaran T^2 Hotelling dapat diaproksimasi dengan formulasi sebagai berikut:

  • Untuk 2 populasi

    di mana

    sehingga sebaran T^2 Hotelling dapat diaproksimasi dengan formulasi sebagai berikut :
    dengan db=(p, n1+n2-p-1) di mana p = banyak variabel

Kriteria pengambilan keputusan :
- Menolak Ho apabila F>F(p,n-p) atau P-Value<alpha
- Menerima Ho apabila F<F(p,n-p) atau P-Value>alpha

Adapun asumsi yang harus dipenuhi adalah :
- Asumsi Normalitas (Saphiro Wilk, Kolmogorov Smirnov, QQ-Plot)
- Asumsi Homogenitas Varcovar (BoxM)

2 HASIL DAN PEMBAHASAN

2.1 Data

Data yang digunakan merupakan data tinggi badan (TB), lingkar dada (LD), dan lingkar lengan atas (LL) anak laki laki dan perempuan berusia 2 tahun di Kota ABC. Adapun data yang diperoleh adalah sebagai berikut :
Anak Laki laki

Individu ke- TB (cm) LD (cm) LL (cm)
1 81 60.8 15.5
2 76 58.1 12.5
3 84 59.5 14.0
4 81 59.0 14.0
5 78 60.6 16.5
6 92 63.2 14.5

Anak Perempuan

Individu ke- TB (cm) LD (cm) LL (cm)
1 80 58.4 14.0
2 75 59.2 15.0
3 78 60.3 15.0
4 75 57.4 13.0
5 80 59.2 12.5
6 64 55.5 11.0
7 75 58.0 12.5
8 78 58.1 14.5
9 79 59.5 14.0

2.2 Uji T^2-Hotelling

2.2.1 Input Data

> #x=data anak laki-laki 
> Tinggi_x<-c(81,76,84,81,78,92) 
> CC_x<-c(60.8,58.1,59.5,59.0,60.6,63.2)
> MUAC_x<-c(15.5,12.5,14.0,14.0,16.5,14.5) 
> 
> #y=data anak perempuan
> Tinggi_y<-c(80,75,78,75,80,64,75,78,79) 
> CC_y<-c(58.4,59.2,60.3,57.4,59.2,55.5,58.0,58.1,59.5)
> MUAC_y<-c(14.0,15.0,15.0,13.0,12.5,11.0,12.5,14.5,14.0)

2.2.2 Menggabungkan Data

> x<-matrix(c(Tinggi_x,CC_x,MUAC_x),nrow=6,ncol=3)
> y<-matrix(c(Tinggi_y,CC_y,MUAC_y),nrow=9,ncol=3) 
> gabung=rbind(x,y)
> gabung
      [,1] [,2] [,3]
 [1,]   81 60.8 15.5
 [2,]   76 58.1 12.5
 [3,]   84 59.5 14.0
 [4,]   81 59.0 14.0
 [5,]   78 60.6 16.5
 [6,]   92 63.2 14.5
 [7,]   80 58.4 14.0
 [8,]   75 59.2 15.0
 [9,]   78 60.3 15.0
[10,]   75 57.4 13.0
[11,]   80 59.2 12.5
[12,]   64 55.5 11.0
[13,]   75 58.0 12.5
[14,]   78 58.1 14.5
[15,]   79 59.5 14.0
> 
> zz=factor(c(rep(1,6),rep(2,9)))
> zz
 [1] 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Levels: 1 2

2.2.3 Menguji Asumsi

> #Uji normalitas shapiro
> library(mvnormtest)
> mshapiro.test(t(x))

    Shapiro-Wilk normality test

data:  Z
W = 0.65772, p-value = 0.002149
> mshapiro.test(t(y))

    Shapiro-Wilk normality test

data:  Z
W = 0.72319, p-value = 0.002646
> 
> #Uji kesamaan matriks kovarian 2 populasi
> library(asbio)
> Kullback(gabung,zz)

Kullback test for equal covariance matrices 
      Chi* df P(Chi>Chi*)
1 2.270782  6   0.8931873

2.2.4 Uji T^2-Hotelling

> library(DescTools)
> HotellingsT2Test(gabung~zz)

    Hotelling's two sample T2-test

data:  gabung by zz
T.2 = 1.4982, df1 = 3, df2 = 11, p-value = 0.2693
alternative hypothesis: true location difference is not equal to c(0,0,0)

2.3 Pembahasan

2.3.1 Pengujian Asumsi Normalitas

Hipotesis :
H0 : Data anak laki laki dan anak perempuan berdistribusi normal
H1 : Data anak laki laki dan anak perempuan tidak berdistribusi normal
Statistik Uji :
P-Value Anak Laki Laki = 0.002149
P-Value Anak Perempuan = 0.002646
Keputusan :
P-Value<alpha untuk anak laki laki maka tolak H0
P-Value<alpha untuk anak perempuan maka tolak H0
Kesimpulan :
Data anak laki laki dan anak perempuan tidak berdistribusi normal, data tidak memenuhi asumsi normalitas.

2.3.2 Pengujian Asumsi Homogenitas varcovar

Hipotesis :
H0 : Data anak laki laki dan anak perempuan memiliki matriks varcovar yang sama
H1 : Data anak laki laki dan anak perempuan memiliki matriks varcovar yang berbeda
Statistik Uji :
P-Value = 0.8931873
Keputusan :
P-Value>alpha maka terima Ho
Kesimpulan :
Data anak laki laki dan anak perempuan memiliki matriks varcovar yang sama

2.3.3 Pengujian T^2-Hotelling

Hipotesis :
H0 : Data anak laki laki dan anak perempuan memiliki vektor rata rata yang sama
H1 : Data anak laki laki dan anak perempuan memiliki vektor rata rata yang berbeda
Statistik Uji :
P-Value = 0.2693
Keputusan :
P-Value>alpha maka terima Ho
Kesimpulan :
Data anak laki laki dan anak perempuan memiliki vektor rata rata yang sama

3 Kesimpulan

Pada pengukuran tinggi badan (TB), lingkar dada (LD), dan lingkar lengan atas (LL), dapat disimpulkan bahwa terdapat perbedaan vektor rata rata antara anak anak laki laki dan perempuan berusia 2 tahun di Kota ABC.