ONE WAY MANOVA

Sumber dan Deskripsi data

Data yang diperoleh dari website kaggle.com, data ini menjelaskan mengenai analisis kesehatan jantung dan membantu proses klasifikasi terkait risiko atau keberadaan penyakit jantung. Data ini memungkinkan peneliti untuk membantu mengidentifikasi faktor faktor yang signidikan terkait kesehatan jantung, seperti usia, tekanan darah, kadar kolesterol, detak jantung saat berolahraga, dan perubahan segmen ST serta faktornya meruapakan gender (Laki-laki atau perempuan)

setwd("C:/Users/Fadhail/Documents/Semester 3/ADM")
data1 <- read.csv("Heart Attack Data Set.csv") 
head (data1)
##   age sex cp trestbps chol fbs restecg thalach exang oldpeak slope ca thal
## 1  63   1  3      145  233   1       0     150     0     2.3     0  0    1
## 2  37   1  2      130  250   0       1     187     0     3.5     0  0    2
## 3  41   0  1      130  204   0       0     172     0     1.4     2  0    2
## 4  56   1  1      120  236   0       1     178     0     0.8     2  0    2
## 5  57   0  0      120  354   0       1     163     1     0.6     2  0    2
## 6  57   1  0      140  192   0       1     148     0     0.4     1  0    1
##   target
## 1      1
## 2      1
## 3      1
## 4      1
## 5      1
## 6      1

Dari beberapa variabel tersebut peneliti hanya mengambil 5 variabel yaitu :

x1 = Age (Usia): Usia responden dalam satuan tahun.

x2 = Restbps (Tekanan Darah Istirahat): Tekanan darah dalam satuan mmHg pada saat masuk rumah sakit.

x3 = Chol (Kolesterol): Kadar kolesterol serum dalam satuan mg/dL.

x4 = MaxHR (Detak Jantung Maksimal): Jumlah detak jantung maksimal yang bisa dicapai selama aktivitas fisik intens.

x5 = Oldpeak : Depresi ST yang dipicu oleh olahraga dibandingkan dengan kondisi istirahat (dalam satuan mm), yang diukur dengan mengurangi titik terendah segmen ST selama olahraga dengan segmen saat istirahat.

Sumber data : https://www.kaggle.com/datasets/pritsheta/heart-attack

Uji Normalitas Multivariate

Hipotesis

H0 : Data berdistribusi normal multivariat

H1 : Data tidak berdistribusi normal multivariat

Taraf Signifikansi

⍺ = 5%

Statistik uji

Menggunakan mardia’s test dengan formula sebagai berikut.

Dengan perhitungan software R, diperoleh

X1 <- data1[,1]
X2 <- data1[,4]
X3 <- data1[,5]
X4 <- data1[,8]
X5 <- data1[,10]
data1P <- data.frame(X1, X2,X3,X4,X5)
library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
test = mvn(data1P, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test        Statistic              p value Result
## 1 Mardia Skewness 249.249602322361 3.81978161249757e-34     NO
## 2 Mardia Kurtosis 6.91045755946928 4.83102446935391e-12     NO
## 3             MVN             <NA>                 <NA>     NO
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    X1        0.9864  0.0058      NO    
## 2 Shapiro-Wilk    X2        0.9659  <0.001      NO    
## 3 Shapiro-Wilk    X3        0.9469  <0.001      NO    
## 4 Shapiro-Wilk    X4        0.9763   1e-04      NO    
## 5 Shapiro-Wilk    X5        0.8442  <0.001      NO    
## 
## $Descriptives
##      n       Mean   Std.Dev Median Min   Max  25th  75th       Skew    Kurtosis
## X1 303  54.366337  9.082101   55.0  29  77.0  47.5  61.0 -0.2004632 -0.56912374
## X2 303 131.623762 17.538143  130.0  94 200.0 120.0 140.0  0.7067170  0.86839602
## X3 303 246.264026 51.830751  240.0 126 564.0 211.0 274.5  1.1321049  4.36284085
## X4 303 149.646865 22.905161  153.0  71 202.0 133.5 166.0 -0.5321005 -0.09992646
## X5 303   1.039604  1.161075    0.8   0   6.2   0.0   1.6  1.2571761  1.50033966

P value Uji Normalitas Multivariate

Mardia Skewness : 3,82e-14

Mardia Kurtosis : 4,84e-12

Kriteria Uji

Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,

● Pada Mardia’s Test Skewness, tolak H0 jika p-value < α

● Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α

Keputusan

Karena p-value untuk mardia kurtosis dan skewness lebih kecil dari α (0,05). maka H0 ditolak.

Kesimpulan

Dengan taraf signifikansi 5% dapat disimpulkan bahwa data tidak berdistribusi normal secara multivariate.

Potong Data dan Uji Normalitas Multivariate Kembali

grup <- data1[1:33,2]
x1 <- data1[1:33,1]
x2 <- data1[1:33,4]
x3 <- data1[1:33,5]
x4 <- data1[1:33,8]
x5 <- data1[1:33,10]
data1_fix <- data.frame(x1,x2,x3,x4,x5);data1_fix
##    x1  x2  x3  x4  x5
## 1  63 145 233 150 2.3
## 2  37 130 250 187 3.5
## 3  41 130 204 172 1.4
## 4  56 120 236 178 0.8
## 5  57 120 354 163 0.6
## 6  57 140 192 148 0.4
## 7  56 140 294 153 1.3
## 8  44 120 263 173 0.0
## 9  52 172 199 162 0.5
## 10 57 150 168 174 1.6
## 11 54 140 239 160 1.2
## 12 48 130 275 139 0.2
## 13 49 130 266 171 0.6
## 14 64 110 211 144 1.8
## 15 58 150 283 162 1.0
## 16 50 120 219 158 1.6
## 17 58 120 340 172 0.0
## 18 66 150 226 114 2.6
## 19 43 150 247 171 1.5
## 20 69 140 239 151 1.8
## 21 59 135 234 161 0.5
## 22 44 130 233 179 0.4
## 23 42 140 226 178 0.0
## 24 61 150 243 137 1.0
## 25 40 140 199 178 1.4
## 26 71 160 302 162 0.4
## 27 59 150 212 157 1.6
## 28 51 110 175 123 0.6
## 29 65 140 417 157 0.8
## 30 53 130 197 152 1.2
## 31 41 105 198 168 0.0
## 32 65 120 177 140 0.4
## 33 44 130 219 188 0.0
head(data1_fix)
##   x1  x2  x3  x4  x5
## 1 63 145 233 150 2.3
## 2 37 130 250 187 3.5
## 3 41 130 204 172 1.4
## 4 56 120 236 178 0.8
## 5 57 120 354 163 0.6
## 6 57 140 192 148 0.4

Hipotesis

H0 : Data berdistribusi normal multivariat

H1 : Data tidak berdistribusi normal multivariat

Taraf Signifikansi

⍺ = 5%

Statistik uji

library(MVN)
test = mvn(data1_fix, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test        Statistic            p value Result
## 1 Mardia Skewness   47.78994997005 0.0732684507889433    YES
## 2 Mardia Kurtosis 1.15154831815655  0.249506729206127    YES
## 3             MVN             <NA>               <NA>    YES
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    x1        0.9652    0.3601    YES   
## 2 Shapiro-Wilk    x2        0.9651    0.3581    YES   
## 3 Shapiro-Wilk    x3        0.8905    0.0031    NO    
## 4 Shapiro-Wilk    x4        0.9591    0.2443    YES   
## 5 Shapiro-Wilk    x5        0.9183    0.0165    NO    
## 
## $Descriptives
##     n      Mean    Std.Dev Median Min   Max  25th  75th        Skew   Kurtosis
## x1 33  53.75758  9.2264237   56.0  37  71.0  44.0  59.0 -0.05186958 -1.1198689
## x2 33 134.75758 15.0955919  135.0 105 172.0 120.0 145.0  0.12625133 -0.3777080
## x3 33 241.51515 53.7500705  233.0 168 417.0 204.0 263.0  1.31482168  1.7875177
## x4 33 160.06061 17.1372026  162.0 114 188.0 151.0 172.0 -0.66220232  0.1111788
## x5 33   1.00000  0.8242421    0.8   0   3.5   0.4   1.5  0.92277760  0.6726152

P value Uji Normalitas Multivariate

Mardia Skewness : 0,07327

Mardia Kurtosis : 0,24951

Kriteria Uji

Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,

  • Pada Mardia’s Test Skewness, tolak H0 jika p-value < α

  • Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α

Keputusan

Karena p-value untuk mardia kurtosis dan skewness lebih besar dari α (0,05). maka H0 diterima.

Kesimpulan

Setelah data dipotong menjadi n sebesar 33 dan dengan taraf signifikansi 5% dapat disimpulkan bahwa data setelah dipotong berdistribusi normal secara multivariate. Sehingga data inilah yang dilanjutkan untuk analisis One Way Manova.

Uji Homogenitas Multivariate

Hipotesis

H0 : s1 = s2 = s3 = s4 = s5, matriks kovarians grup adalah sama.

H1 : Minimal ada satu matriks kovarians grup (sk) yang berbeda.

Taraf Signifikansi

⍺ = 5%

Statistik uji

Uji Box’M

library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
head(grup)
## [1] 1 1 0 1 0 1
boxM(data = data1_fix, grouping = grup)
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data1_fix
## Chi-Sq (approx.) = 24.145, df = 15, p-value = 0.06266

diperoleh p-value = 0,06266

Kriteria Uji

Tolak H0 jika p-value < α , terima dalam hal lainnya.

Keputusan

Karena nilai p-value (0,06266) > dari α (0,05), maka H0 diterima

Kesimpulan

Dengan taraf signifikansi 5% dapat disimpulkan bahwa data pengelompokkan data mengenai kesehatan jantung berdasarkan gender memiliki matriks kovarians grup yang sama. Oleh karena itu, asumsi homogenitas multivariat terpenuhi.

One Way Manova

Hipotesis

H0 : μ1 = μ2 = 0 (Faktor gender tidak berpengaruh terhadap kesehatan jantung)

H1 : Terdapat minimal satu μi tidak sama dengan 0, i = 1,2 (Faktor gender berpengaruh terhadap kesehatan jantung)

Taraf Signifikansi

⍺ = 5%

Statistik Uji

owm = manova(cbind(data1_fix$x1, data1_fix$x2,data1_fix$x3,data1_fix$x4,data1_fix$x5)~data1$sex[1:33])
summary(owm)
##                 Df Pillai approx F num Df den Df  Pr(>F)  
## data1$sex[1:33]  1 0.3608    3.048      5     27 0.02619 *
## Residuals       31                                        
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kriteria Uji

Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya.

Keputusan

Karena nilai p-value (0,02619) < dari α (0,05), maka H0 ditolak.

Kesimpulan

Dengan taraf signifikansi 5% dapat disimpulkan bahwa gender secara signifikan mempengaruhi kesehatan jantung.

Uji Lanjut

Hipotesis

H0 : Faktor tidak berpengaruh secara signifikan terhadap vektor yang diamati. H1 : Faktor berpengaruh secara signifikan terhadap vektor yang diamati.

Taraf Signifikansi

⍺ = 5%

Statistik Uji

summary.aov(owm)
##  Response 1 :
##                 Df  Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33]  1  159.58 159.584  1.9291 0.1748
## Residuals       31 2564.48  82.725               
## 
##  Response 2 :
##                 Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33]  1   19.1  19.144  0.0816  0.777
## Residuals       31 7272.9 234.610               
## 
##  Response 3 :
##                 Df Sum Sq Mean Sq F value   Pr(>F)   
## data1$sex[1:33]  1  26851 26851.0  12.689 0.001213 **
## Residuals       31  65599  2116.1                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response 4 :
##                 Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33]  1  323.8  323.82  1.1063  0.301
## Residuals       31 9074.1  292.71               
## 
##  Response 5 :
##                 Df  Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33]  1  0.0118 0.01179  0.0168 0.8977
## Residuals       31 21.7282 0.70091

Kriteria Uji

Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya

Keputusan

Response P-value Keputusan
Age 0,1748 Terima H0
Restbps (Tekanan darah istirahat) 0,777 Terima H0
Chol (Kolesterol) 0,001213 Tolak H0
Thalach (Detak jantung maksimal) 0,301 Terima H0
Oldpeak 0,8977 Terima H0

Kesimpulan

Dengan taraf signfikasi 5%

  1. Gender seseorang tidak mempengaruhi Age secara signifkan.

  2. Gender seseorang tidak mempengaruhi Tekanan darah instirahat secara signifkan.

  3. Gender seseorang secara signfikan mempengaruhi kolesterol

  4. Gender seseorang tidak mempengaruhi Detak jantung maksimal secara signifkan.

  5. Gender seseorang tidak mempengaruhi Oldpeak secara signifkan.

TWO WAY MANOVA

Sumber dan Deskripsi data

Data yang diperoleh dari website kaggle.com, data yang digunakan untuk menganalisis biaya asuransi kesehatan individu berdasarkan beberapa variabel demografis dan kesehatan.

data2 <- read.csv("insurance.csv") 
head(data2)
##   age    sex    bmi children smoker    region   charges
## 1  19 female 27.900        0    yes southwest 16884.924
## 2  18   male 33.770        1     no southeast  1725.552
## 3  28   male 33.000        3     no southeast  4449.462
## 4  33   male 22.705        0     no northwest 21984.471
## 5  32   male 28.880        0     no northwest  3866.855
## 6  31 female 25.740        0     no southeast  3756.622

Dari beberapa variabel tersebut peneliti hanya mengambil 5 variabel yaitu :

  • Age (Usia): Usia tertanggung dalam tahun.

  • Sex (Jenis Kelamin): Jenis kelamin tertanggung, dengan nilai “male” untuk laki-laki dan “female” untuk perempuan.

  • BMI (Body Mass Index): Indeks massa tubuh, yang dihitung berdasarkan berat dan tinggi badan. Nilai BMI di atas 30 menunjukkan kemungkinan obesitas, yang dapat mempengaruhi biaya asuransi.

  • Smoker (Perokok): Status merokok tertanggung, dengan nilai “yes” untuk perokok dan “no” untuk bukan perokok. Faktor ini secara signifikan memengaruhi premi asuransi.

  • Charges (Biaya Asuransi): Biaya atau premi yang harus dibayar oleh tertanggung dalam satuan dolar AS.

Dataset ini berguna untuk menganalisis faktor-faktor apa saja yang berpengaruh terhadap biaya asuransi kesehatan, seperti usia, status merokok, dan BMI. Data ini dapat digunakan dalam model prediksi untuk memperkirakan biaya asuransi berdasarkan variabel-variabel yang ada, sehingga membantu perusahaan asuransi dalam menetapkan harga premi yang lebih akurat.

Sumber data : https://www.kaggle.com/datasets/mirichoi0218/insurance

Uji Normalitas Multivariate

Hipotesis

H0 : Data berdistribusi normal multivariat

H1 : Data tidak berdistribusi normal multivariat

Taraf Signifikansi

⍺ = 5%

Statistik uji

Menggunakan mardia’s test dengan formula sebagai berikut.

Dengan perhitungan software R, diperoleh

x1 <- data2[,1]
x2 <- data2[,3]
x3 <- data2[,7]
data2_fix <- data.frame(x1, x2, x3)
library(MVN)
test = mvn(data2_fix, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test        Statistic               p value Result
## 1 Mardia Skewness 752.251399654731 3.77081932250362e-155     NO
## 2 Mardia Kurtosis 1.31199444614049     0.189522008474186    YES
## 3             MVN             <NA>                  <NA>     NO
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    x1        0.9447  <0.001      NO    
## 2 Shapiro-Wilk    x2        0.9939  <0.001      NO    
## 3 Shapiro-Wilk    x3        0.8147  <0.001      NO    
## 
## $Descriptives
##       n        Mean      Std.Dev   Median      Min      Max       25th
## x1 1338    39.20703    14.049960   39.000   18.000    64.00   27.00000
## x2 1338    30.66340     6.098187   30.400   15.960    53.13   26.29625
## x3 1338 13270.42227 12110.011237 9382.033 1121.874 63770.43 4740.28715
##           75th       Skew    Kurtosis
## x1    51.00000 0.05554775 -1.24754314
## x2    34.69375 0.28341055 -0.05942352
## x3 16639.91251 1.51248252  1.58895424

P value Uji Normalitas Multivariate

Mardia Skewness : 3,78e-155

Mardia Kurtosis : 0,1896

Kriteria Uji

Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,

● Pada Mardia’s Test Skewness, tolak H0 jika p-value < α

● Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α

Keputusan

Karena p-value untuk mardia skewness lebih kecil dari α (0,05). maka H0 ditolak.

Kesimpulan

Dengan taraf signifikansi 5% dapat disimpulkan bahwa data tidak berdistribusi normal secara multivariate.

Potong Data dan Uji Normalitas Multivariate Kembali

data2_p <- data2_fix[1:30,]
dim(data2_p)
## [1] 30  3
x1_p <- data2[1:30,1]
x2_p <- data2[1:30,3]
x3_p <- data2[1:30,7]

Hipotesis

H0 : Data berdistribusi normal multivariat

H1 : Data tidak berdistribusi normal multivariat

Taraf Signifikansi

⍺ = 5%

Statistik uji

library(MVN)
test = mvn(data2_p, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test          Statistic            p value Result
## 1 Mardia Skewness   17.9194502751016 0.0563376973705181    YES
## 2 Mardia Kurtosis -0.897127607545633  0.369650828655085    YES
## 3             MVN               <NA>               <NA>    YES
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    x1        0.8881    0.0043    NO    
## 2 Shapiro-Wilk    x2        0.9848    0.9343    YES   
## 3 Shapiro-Wilk    x3        0.8212    0.0002    NO    
## 
## $Descriptives
##     n        Mean      Std.Dev   Median      Min      Max      25th       75th
## x1 30    37.46667    15.190136   32.500   18.000    63.00   25.5000    54.2500
## x2 30    30.40817     5.717774   30.305   17.385    42.13   26.2375    34.0175
## x3 30 13122.58852 12372.185677 9421.487 1137.011 39611.76 3784.1800 16276.6518
##          Skew   Kurtosis
## x1 0.41903192 -1.3691494
## x2 0.03243587 -0.5159608
## x3 1.01852498 -0.3577376

P value Uji Normalitas Multivariate

Mardia Skewness : 0,0564

Mardia Kurtosis : 0,3897

Kriteria Uji

Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,

  • Pada Mardia’s Test Skewness, tolak H0 jika p-value < α

  • Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α

Keputusan

Karena p-value untuk mardia kurtosis dan skewness > dari α (0,05). maka H0 diterima.

Kesimpulan

Setelah data dipotong menjadi n sebesar 30 dan dengan taraf signifikansi 5% dapat disimpulkan bahwa data setelah dipotong berdistribusi normal secara multivariate. Sehingga data inilah yang dilanjutkan untuk analisis Two Way Manova.

Uji Homogenitas Multivariate

Hipotesis

H0 : s1 = s2 = s3 , matriks kovarians grup adalah sama.

H1 : Minimal ada satu matriks kovarians grup (sk) yang berbeda.

Taraf Signifikansi

⍺ = 5%

Statistik uji

Uji Box’M

# Gender 
head(data2[1:30,2])
## [1] "female" "male"   "male"   "male"   "male"   "female"
boxM(data = data2_p, grouping = data2[1:30,2])
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data2_p
## Chi-Sq (approx.) = 7.7571, df = 6, p-value = 0.2564
# Smoker
head(data2[1:30,5])
## [1] "yes" "no"  "no"  "no"  "no"  "no"
boxM(data = data2_p, grouping = data2[1:30,5])
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data2_p
## Chi-Sq (approx.) = 16.045, df = 6, p-value = 0.01351

Kriteria Uji

Tolak H0 jika p-value < α, terima dalam hal lainnya.

Keputusan

Grup Grup Keputusan
Gender 0,256 Terima H0
Perokok 0,01351 Tolak H0

Kesimpulan

  • Dengan taraf signifikansi 5% dapat disimpulkan bahwa data pengelompokkan data mengenai biaya asuransi kesehatan berdasarkan gender memiliki matriks kovarians grup yang sama. Oleh karena itu, asumsi homogenitas multivariat terpenuhi.

  • Dengan taraf signifikansi 5% dapat disimpulkan bahwa data pengelompokkan data mengenai biaya asuransi kesehatan berdasarkan perokok (perokok atau tidak) tidak memiliki matriks kovarians grup yang sama. Walaupun asumsi homogenitas tidak terpenuhi, namun untuk pembelajaran data ini diasumsikan memiliki matriks kovarians grup yang sama.

Two Way Manova

Hipotesis

  • H0’ : α1 = α2 = 0 (Faktor gender tidak berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)

  • H1’ : Setidaknya ada satu αi yang tidak sama dengan 0 (Faktor gender berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)

  • H0’’ : β1 = β2 = 0 (Faktor perokok tidak berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)

  • H1’’ : Setidaknya ada satu βj yang tidak sama dengan 0 (Faktor perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)

  • H0’’’ : αβij = 0, i =1,2 j=1,2 (Interaksi antara jenis kelamin dan hasil tidak berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)

  • H1’’’ : Setidaknya ada satu αβij yang tidak sama dengan 0 (Interaksi antara gender dan perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)

Taraf Signifikansi

⍺ = 5%

Statistik Uji

data2$sex<-ifelse(data2$sex == "male",1,0)
gender <- data2$sex
gender <- as.factor(gender[1:30])
smoker <- as.factor(data2$smoker[1:30])
manova <- manova(cbind(x1_p, x2_p, x3_p ) ~ gender * smoker, data2_fix)
summary(manova)
##               Df  Pillai approx F num Df den Df    Pr(>F)    
## gender         1 0.44516    6.418      3     24  0.002394 ** 
## smoker         1 0.84364   43.163      3     24 7.962e-10 ***
## gender:smoker  1 0.38859    5.085      3     24  0.007249 ** 
## Residuals     26                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kriteria Uji

Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya.

Keputusan

Pvalue Keputusan
Gender 0,002394 Tolak H0
Perokok 9,982e-10 Tolak H0
Gender : Perokok 0,007249 Tolak H0

Kesimpulan

Dengan taraf signifikansi 5% dapat disimpulkan bahwa,

  • Faktor gender berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi.

  • Faktor perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi.

  • Interaksi antara gender dan perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi.

Uji Lanjut

Hipotesis

H0 : Faktor tidak berpengaruh secara signifikan terhadap vektor yang diamati. H1 : Faktor berpengaruh secara signifikan terhadap vektor yang diamati.

Taraf Signifikansi

⍺ = 5%

Kriteria Uji

Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya

Statistik Uji

summary.aov(manova)
##  Response x1_p :
##               Df Sum Sq Mean Sq F value    Pr(>F)    
## gender         1 2605.0 2605.04 17.9690 0.0002501 ***
## smoker         1  136.0  136.00  0.9381 0.3416906    
## gender:smoker  1  181.1  181.11  1.2493 0.2739170    
## Residuals     26 3769.3  144.97                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response x2_p :
##               Df Sum Sq Mean Sq F value  Pr(>F)  
## gender         1   2.43   2.430  0.0848 0.77319  
## smoker         1  63.91  63.911  2.2308 0.14732  
## gender:smoker  1 136.89 136.888  4.7781 0.03802 *
## Residuals     26 744.87  28.649                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response x3_p :
##               Df     Sum Sq    Mean Sq F value    Pr(>F)    
## gender         1   96691540   96691540  2.3437  0.137865    
## smoker         1 2909023562 2909023562 70.5130 7.046e-09 ***
## gender:smoker  1  360709474  360709474  8.7434  0.006533 ** 
## Residuals     26 1072633797   41255146                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Keputusan

Response Kelompok P-value Keputusan
Usia gender 0,0002501 Tolak H0
Usia perokok 0,3416906 Terima H0
Usia gender*perokok 0,273917 Terima H0
BMI gender 0,77319 Terima H0
BMI perokok 0,14732 Terima H0
BMI gender*perokok 0,03802 Tolak H0
Biaya Asuransi gender 0,137865 Terima H0
Biaya Asuransi peroko 7.046e-09 Tolak H0
Biaya Asuransi gender*perokok 0.006533 Tolak H0

Kesimpulan

Dengan taraf signfikasi 5%

  1. Gender seseorang secara signifikan mempengaruhi Usia.

  2. Gender seseorang tidak mempengaruhi BMI secara signifkan.

  3. Gender seseorang tidak mempengaruhi biaya asuranasi secara signifikan

  4. Perokok atau tidaknya seseorang tidak mempengaruhi usia secara signifikan.

  5. Perokok atau tidaknya seseorang tidak mempengaruhi BMI secara signifikan.

  6. Perokok atau tidaknya seseorang secara signifikan mempengaruhi biaya asuransi.

  7. Interaksi gender dan perokok tidak mempengaruhi usia secara signifikan

  8. Interaksi gender dan perokok secara signifikan mempengaruhi BMI

  9. Interaksi gender dan perokok secara signifikan mempengaruhi Biaya Asuransi