Data yang diperoleh dari website kaggle.com, data ini menjelaskan mengenai analisis kesehatan jantung dan membantu proses klasifikasi terkait risiko atau keberadaan penyakit jantung. Data ini memungkinkan peneliti untuk membantu mengidentifikasi faktor faktor yang signidikan terkait kesehatan jantung, seperti usia, tekanan darah, kadar kolesterol, detak jantung saat berolahraga, dan perubahan segmen ST serta faktornya meruapakan gender (Laki-laki atau perempuan)
setwd("C:/Users/Fadhail/Documents/Semester 3/ADM")
data1 <- read.csv("Heart Attack Data Set.csv")
head (data1)
## age sex cp trestbps chol fbs restecg thalach exang oldpeak slope ca thal
## 1 63 1 3 145 233 1 0 150 0 2.3 0 0 1
## 2 37 1 2 130 250 0 1 187 0 3.5 0 0 2
## 3 41 0 1 130 204 0 0 172 0 1.4 2 0 2
## 4 56 1 1 120 236 0 1 178 0 0.8 2 0 2
## 5 57 0 0 120 354 0 1 163 1 0.6 2 0 2
## 6 57 1 0 140 192 0 1 148 0 0.4 1 0 1
## target
## 1 1
## 2 1
## 3 1
## 4 1
## 5 1
## 6 1
Dari beberapa variabel tersebut peneliti hanya mengambil 5 variabel yaitu :
x1 = Age (Usia): Usia responden dalam satuan tahun.
x2 = Restbps (Tekanan Darah Istirahat): Tekanan darah dalam satuan mmHg pada saat masuk rumah sakit.
x3 = Chol (Kolesterol): Kadar kolesterol serum dalam satuan mg/dL.
x4 = MaxHR (Detak Jantung Maksimal): Jumlah detak jantung maksimal yang bisa dicapai selama aktivitas fisik intens.
x5 = Oldpeak : Depresi ST yang dipicu oleh olahraga dibandingkan dengan kondisi istirahat (dalam satuan mm), yang diukur dengan mengurangi titik terendah segmen ST selama olahraga dengan segmen saat istirahat.
Sumber data : https://www.kaggle.com/datasets/pritsheta/heart-attack
Hipotesis
H0 : Data berdistribusi normal multivariat
H1 : Data tidak berdistribusi normal multivariat
Taraf Signifikansi
⍺ = 5%
Statistik uji
Menggunakan mardia’s test dengan formula sebagai berikut.
Dengan perhitungan software R, diperoleh
X1 <- data1[,1]
X2 <- data1[,4]
X3 <- data1[,5]
X4 <- data1[,8]
X5 <- data1[,10]
data1P <- data.frame(X1, X2,X3,X4,X5)
library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
test = mvn(data1P, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
test
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 249.249602322361 3.81978161249757e-34 NO
## 2 Mardia Kurtosis 6.91045755946928 4.83102446935391e-12 NO
## 3 MVN <NA> <NA> NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk X1 0.9864 0.0058 NO
## 2 Shapiro-Wilk X2 0.9659 <0.001 NO
## 3 Shapiro-Wilk X3 0.9469 <0.001 NO
## 4 Shapiro-Wilk X4 0.9763 1e-04 NO
## 5 Shapiro-Wilk X5 0.8442 <0.001 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis
## X1 303 54.366337 9.082101 55.0 29 77.0 47.5 61.0 -0.2004632 -0.56912374
## X2 303 131.623762 17.538143 130.0 94 200.0 120.0 140.0 0.7067170 0.86839602
## X3 303 246.264026 51.830751 240.0 126 564.0 211.0 274.5 1.1321049 4.36284085
## X4 303 149.646865 22.905161 153.0 71 202.0 133.5 166.0 -0.5321005 -0.09992646
## X5 303 1.039604 1.161075 0.8 0 6.2 0.0 1.6 1.2571761 1.50033966
P value Uji Normalitas Multivariate
Mardia Skewness : 3,82e-14
Mardia Kurtosis : 4,84e-12
Kriteria Uji
Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,
● Pada Mardia’s Test Skewness, tolak H0 jika p-value < α
● Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α
Keputusan
Karena p-value untuk mardia kurtosis dan skewness lebih kecil dari α (0,05). maka H0 ditolak.
Kesimpulan
Dengan taraf signifikansi 5% dapat disimpulkan bahwa data tidak berdistribusi normal secara multivariate.
Potong Data dan Uji Normalitas Multivariate Kembali
grup <- data1[1:33,2]
x1 <- data1[1:33,1]
x2 <- data1[1:33,4]
x3 <- data1[1:33,5]
x4 <- data1[1:33,8]
x5 <- data1[1:33,10]
data1_fix <- data.frame(x1,x2,x3,x4,x5);data1_fix
## x1 x2 x3 x4 x5
## 1 63 145 233 150 2.3
## 2 37 130 250 187 3.5
## 3 41 130 204 172 1.4
## 4 56 120 236 178 0.8
## 5 57 120 354 163 0.6
## 6 57 140 192 148 0.4
## 7 56 140 294 153 1.3
## 8 44 120 263 173 0.0
## 9 52 172 199 162 0.5
## 10 57 150 168 174 1.6
## 11 54 140 239 160 1.2
## 12 48 130 275 139 0.2
## 13 49 130 266 171 0.6
## 14 64 110 211 144 1.8
## 15 58 150 283 162 1.0
## 16 50 120 219 158 1.6
## 17 58 120 340 172 0.0
## 18 66 150 226 114 2.6
## 19 43 150 247 171 1.5
## 20 69 140 239 151 1.8
## 21 59 135 234 161 0.5
## 22 44 130 233 179 0.4
## 23 42 140 226 178 0.0
## 24 61 150 243 137 1.0
## 25 40 140 199 178 1.4
## 26 71 160 302 162 0.4
## 27 59 150 212 157 1.6
## 28 51 110 175 123 0.6
## 29 65 140 417 157 0.8
## 30 53 130 197 152 1.2
## 31 41 105 198 168 0.0
## 32 65 120 177 140 0.4
## 33 44 130 219 188 0.0
head(data1_fix)
## x1 x2 x3 x4 x5
## 1 63 145 233 150 2.3
## 2 37 130 250 187 3.5
## 3 41 130 204 172 1.4
## 4 56 120 236 178 0.8
## 5 57 120 354 163 0.6
## 6 57 140 192 148 0.4
Hipotesis
H0 : Data berdistribusi normal multivariat
H1 : Data tidak berdistribusi normal multivariat
Taraf Signifikansi
⍺ = 5%
Statistik uji
library(MVN)
test = mvn(data1_fix, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
test
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 47.78994997005 0.0732684507889433 YES
## 2 Mardia Kurtosis 1.15154831815655 0.249506729206127 YES
## 3 MVN <NA> <NA> YES
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk x1 0.9652 0.3601 YES
## 2 Shapiro-Wilk x2 0.9651 0.3581 YES
## 3 Shapiro-Wilk x3 0.8905 0.0031 NO
## 4 Shapiro-Wilk x4 0.9591 0.2443 YES
## 5 Shapiro-Wilk x5 0.9183 0.0165 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis
## x1 33 53.75758 9.2264237 56.0 37 71.0 44.0 59.0 -0.05186958 -1.1198689
## x2 33 134.75758 15.0955919 135.0 105 172.0 120.0 145.0 0.12625133 -0.3777080
## x3 33 241.51515 53.7500705 233.0 168 417.0 204.0 263.0 1.31482168 1.7875177
## x4 33 160.06061 17.1372026 162.0 114 188.0 151.0 172.0 -0.66220232 0.1111788
## x5 33 1.00000 0.8242421 0.8 0 3.5 0.4 1.5 0.92277760 0.6726152
P value Uji Normalitas Multivariate
Mardia Skewness : 0,07327
Mardia Kurtosis : 0,24951
Kriteria Uji
Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,
Pada Mardia’s Test Skewness, tolak H0 jika p-value < α
Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α
Keputusan
Karena p-value untuk mardia kurtosis dan skewness lebih besar dari α (0,05). maka H0 diterima.
Kesimpulan
Setelah data dipotong menjadi n sebesar 33 dan dengan taraf signifikansi 5% dapat disimpulkan bahwa data setelah dipotong berdistribusi normal secara multivariate. Sehingga data inilah yang dilanjutkan untuk analisis One Way Manova.
Hipotesis
H0 : s1 = s2 = s3 = s4 = s5, matriks kovarians grup adalah sama.
H1 : Minimal ada satu matriks kovarians grup (sk) yang berbeda.
Taraf Signifikansi
⍺ = 5%
Statistik uji
Uji Box’M
library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
head(grup)
## [1] 1 1 0 1 0 1
boxM(data = data1_fix, grouping = grup)
##
## Box's M-test for Homogeneity of Covariance Matrices
##
## data: data1_fix
## Chi-Sq (approx.) = 24.145, df = 15, p-value = 0.06266
diperoleh p-value = 0,06266
Kriteria Uji
Tolak H0 jika p-value < α , terima dalam hal lainnya.
Keputusan
Karena nilai p-value (0,06266) > dari α (0,05), maka H0 diterima
Kesimpulan
Dengan taraf signifikansi 5% dapat disimpulkan bahwa data pengelompokkan data mengenai kesehatan jantung berdasarkan gender memiliki matriks kovarians grup yang sama. Oleh karena itu, asumsi homogenitas multivariat terpenuhi.
Hipotesis
H0 : μ1 = μ2 = 0 (Faktor gender tidak berpengaruh terhadap kesehatan jantung)
H1 : Terdapat minimal satu μi tidak sama dengan 0, i = 1,2 (Faktor gender berpengaruh terhadap kesehatan jantung)
Taraf Signifikansi
⍺ = 5%
Statistik Uji
owm = manova(cbind(data1_fix$x1, data1_fix$x2,data1_fix$x3,data1_fix$x4,data1_fix$x5)~data1$sex[1:33])
summary(owm)
## Df Pillai approx F num Df den Df Pr(>F)
## data1$sex[1:33] 1 0.3608 3.048 5 27 0.02619 *
## Residuals 31
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Kriteria Uji
Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya.
Keputusan
Karena nilai p-value (0,02619) < dari α (0,05), maka H0 ditolak.
Kesimpulan
Dengan taraf signifikansi 5% dapat disimpulkan bahwa gender secara signifikan mempengaruhi kesehatan jantung.
Hipotesis
H0 : Faktor tidak berpengaruh secara signifikan terhadap vektor yang diamati. H1 : Faktor berpengaruh secara signifikan terhadap vektor yang diamati.
Taraf Signifikansi
⍺ = 5%
Statistik Uji
summary.aov(owm)
## Response 1 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33] 1 159.58 159.584 1.9291 0.1748
## Residuals 31 2564.48 82.725
##
## Response 2 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33] 1 19.1 19.144 0.0816 0.777
## Residuals 31 7272.9 234.610
##
## Response 3 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33] 1 26851 26851.0 12.689 0.001213 **
## Residuals 31 65599 2116.1
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Response 4 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33] 1 323.8 323.82 1.1063 0.301
## Residuals 31 9074.1 292.71
##
## Response 5 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data1$sex[1:33] 1 0.0118 0.01179 0.0168 0.8977
## Residuals 31 21.7282 0.70091
Kriteria Uji
Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya
Keputusan
Response | P-value | Keputusan |
---|---|---|
Age | 0,1748 | Terima H0 |
Restbps (Tekanan darah istirahat) | 0,777 | Terima H0 |
Chol (Kolesterol) | 0,001213 | Tolak H0 |
Thalach (Detak jantung maksimal) | 0,301 | Terima H0 |
Oldpeak | 0,8977 | Terima H0 |
Kesimpulan
Dengan taraf signfikasi 5%
Gender seseorang tidak mempengaruhi Age secara signifkan.
Gender seseorang tidak mempengaruhi Tekanan darah instirahat secara signifkan.
Gender seseorang secara signfikan mempengaruhi kolesterol
Gender seseorang tidak mempengaruhi Detak jantung maksimal secara signifkan.
Gender seseorang tidak mempengaruhi Oldpeak secara signifkan.
Data yang diperoleh dari website kaggle.com, data yang digunakan untuk menganalisis biaya asuransi kesehatan individu berdasarkan beberapa variabel demografis dan kesehatan.
data2 <- read.csv("insurance.csv")
head(data2)
## age sex bmi children smoker region charges
## 1 19 female 27.900 0 yes southwest 16884.924
## 2 18 male 33.770 1 no southeast 1725.552
## 3 28 male 33.000 3 no southeast 4449.462
## 4 33 male 22.705 0 no northwest 21984.471
## 5 32 male 28.880 0 no northwest 3866.855
## 6 31 female 25.740 0 no southeast 3756.622
Dari beberapa variabel tersebut peneliti hanya mengambil 5 variabel yaitu :
Age (Usia): Usia tertanggung dalam tahun.
Sex (Jenis Kelamin): Jenis kelamin tertanggung, dengan nilai “male” untuk laki-laki dan “female” untuk perempuan.
BMI (Body Mass Index): Indeks massa tubuh, yang dihitung berdasarkan berat dan tinggi badan. Nilai BMI di atas 30 menunjukkan kemungkinan obesitas, yang dapat mempengaruhi biaya asuransi.
Smoker (Perokok): Status merokok tertanggung, dengan nilai “yes” untuk perokok dan “no” untuk bukan perokok. Faktor ini secara signifikan memengaruhi premi asuransi.
Charges (Biaya Asuransi): Biaya atau premi yang harus dibayar oleh tertanggung dalam satuan dolar AS.
Dataset ini berguna untuk menganalisis faktor-faktor apa saja yang berpengaruh terhadap biaya asuransi kesehatan, seperti usia, status merokok, dan BMI. Data ini dapat digunakan dalam model prediksi untuk memperkirakan biaya asuransi berdasarkan variabel-variabel yang ada, sehingga membantu perusahaan asuransi dalam menetapkan harga premi yang lebih akurat.
Sumber data : https://www.kaggle.com/datasets/mirichoi0218/insurance
Hipotesis
H0 : Data berdistribusi normal multivariat
H1 : Data tidak berdistribusi normal multivariat
Taraf Signifikansi
⍺ = 5%
Statistik uji
Menggunakan mardia’s test dengan formula sebagai berikut.
Dengan perhitungan software R, diperoleh
x1 <- data2[,1]
x2 <- data2[,3]
x3 <- data2[,7]
data2_fix <- data.frame(x1, x2, x3)
library(MVN)
test = mvn(data2_fix, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
test
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 752.251399654731 3.77081932250362e-155 NO
## 2 Mardia Kurtosis 1.31199444614049 0.189522008474186 YES
## 3 MVN <NA> <NA> NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk x1 0.9447 <0.001 NO
## 2 Shapiro-Wilk x2 0.9939 <0.001 NO
## 3 Shapiro-Wilk x3 0.8147 <0.001 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th
## x1 1338 39.20703 14.049960 39.000 18.000 64.00 27.00000
## x2 1338 30.66340 6.098187 30.400 15.960 53.13 26.29625
## x3 1338 13270.42227 12110.011237 9382.033 1121.874 63770.43 4740.28715
## 75th Skew Kurtosis
## x1 51.00000 0.05554775 -1.24754314
## x2 34.69375 0.28341055 -0.05942352
## x3 16639.91251 1.51248252 1.58895424
P value Uji Normalitas Multivariate
Mardia Skewness : 3,78e-155
Mardia Kurtosis : 0,1896
Kriteria Uji
Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,
● Pada Mardia’s Test Skewness, tolak H0 jika p-value < α
● Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α
Keputusan
Karena p-value untuk mardia skewness lebih kecil dari α (0,05). maka H0 ditolak.
Kesimpulan
Dengan taraf signifikansi 5% dapat disimpulkan bahwa data tidak berdistribusi normal secara multivariate.
Potong Data dan Uji Normalitas Multivariate Kembali
data2_p <- data2_fix[1:30,]
dim(data2_p)
## [1] 30 3
x1_p <- data2[1:30,1]
x2_p <- data2[1:30,3]
x3_p <- data2[1:30,7]
Hipotesis
H0 : Data berdistribusi normal multivariat
H1 : Data tidak berdistribusi normal multivariat
Taraf Signifikansi
⍺ = 5%
Statistik uji
library(MVN)
test = mvn(data2_p, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
test
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 17.9194502751016 0.0563376973705181 YES
## 2 Mardia Kurtosis -0.897127607545633 0.369650828655085 YES
## 3 MVN <NA> <NA> YES
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk x1 0.8881 0.0043 NO
## 2 Shapiro-Wilk x2 0.9848 0.9343 YES
## 3 Shapiro-Wilk x3 0.8212 0.0002 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th
## x1 30 37.46667 15.190136 32.500 18.000 63.00 25.5000 54.2500
## x2 30 30.40817 5.717774 30.305 17.385 42.13 26.2375 34.0175
## x3 30 13122.58852 12372.185677 9421.487 1137.011 39611.76 3784.1800 16276.6518
## Skew Kurtosis
## x1 0.41903192 -1.3691494
## x2 0.03243587 -0.5159608
## x3 1.01852498 -0.3577376
P value Uji Normalitas Multivariate
Mardia Skewness : 0,0564
Mardia Kurtosis : 0,3897
Kriteria Uji
Karena pada mardia’s test menggunakan dua nilai yaitu nilai skewness dan nilai kurtosis, sehingga,
Pada Mardia’s Test Skewness, tolak H0 jika p-value < α
Pada Mardia’s Test Kurtosis, tolak H0 jika p-value < α
Keputusan
Karena p-value untuk mardia kurtosis dan skewness > dari α (0,05). maka H0 diterima.
Kesimpulan
Setelah data dipotong menjadi n sebesar 30 dan dengan taraf signifikansi 5% dapat disimpulkan bahwa data setelah dipotong berdistribusi normal secara multivariate. Sehingga data inilah yang dilanjutkan untuk analisis Two Way Manova.
Hipotesis
H0 : s1 = s2 = s3 , matriks kovarians grup adalah sama.
H1 : Minimal ada satu matriks kovarians grup (sk) yang berbeda.
Taraf Signifikansi
⍺ = 5%
Statistik uji
Uji Box’M
# Gender
head(data2[1:30,2])
## [1] "female" "male" "male" "male" "male" "female"
boxM(data = data2_p, grouping = data2[1:30,2])
##
## Box's M-test for Homogeneity of Covariance Matrices
##
## data: data2_p
## Chi-Sq (approx.) = 7.7571, df = 6, p-value = 0.2564
# Smoker
head(data2[1:30,5])
## [1] "yes" "no" "no" "no" "no" "no"
boxM(data = data2_p, grouping = data2[1:30,5])
##
## Box's M-test for Homogeneity of Covariance Matrices
##
## data: data2_p
## Chi-Sq (approx.) = 16.045, df = 6, p-value = 0.01351
Kriteria Uji
Tolak H0 jika p-value < α, terima dalam hal lainnya.
Keputusan
Grup | Grup | Keputusan |
---|---|---|
Gender | 0,256 | Terima H0 |
Perokok | 0,01351 | Tolak H0 |
Kesimpulan
Dengan taraf signifikansi 5% dapat disimpulkan bahwa data pengelompokkan data mengenai biaya asuransi kesehatan berdasarkan gender memiliki matriks kovarians grup yang sama. Oleh karena itu, asumsi homogenitas multivariat terpenuhi.
Dengan taraf signifikansi 5% dapat disimpulkan bahwa data pengelompokkan data mengenai biaya asuransi kesehatan berdasarkan perokok (perokok atau tidak) tidak memiliki matriks kovarians grup yang sama. Walaupun asumsi homogenitas tidak terpenuhi, namun untuk pembelajaran data ini diasumsikan memiliki matriks kovarians grup yang sama.
Hipotesis
H0’ : α1 = α2 = 0 (Faktor gender tidak berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)
H1’ : Setidaknya ada satu αi yang tidak sama dengan 0 (Faktor gender berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)
H0’’ : β1 = β2 = 0 (Faktor perokok tidak berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)
H1’’ : Setidaknya ada satu βj yang tidak sama dengan 0 (Faktor perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)
H0’’’ : αβij = 0, i =1,2 j=1,2 (Interaksi antara jenis kelamin dan hasil tidak berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)
H1’’’ : Setidaknya ada satu αβij yang tidak sama dengan 0 (Interaksi antara gender dan perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi)
Taraf Signifikansi
⍺ = 5%
Statistik Uji
data2$sex<-ifelse(data2$sex == "male",1,0)
gender <- data2$sex
gender <- as.factor(gender[1:30])
smoker <- as.factor(data2$smoker[1:30])
manova <- manova(cbind(x1_p, x2_p, x3_p ) ~ gender * smoker, data2_fix)
summary(manova)
## Df Pillai approx F num Df den Df Pr(>F)
## gender 1 0.44516 6.418 3 24 0.002394 **
## smoker 1 0.84364 43.163 3 24 7.962e-10 ***
## gender:smoker 1 0.38859 5.085 3 24 0.007249 **
## Residuals 26
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Kriteria Uji
Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya.
Keputusan
Pvalue | Keputusan | |
---|---|---|
Gender | 0,002394 | Tolak H0 |
Perokok | 9,982e-10 | Tolak H0 |
Gender : Perokok | 0,007249 | Tolak H0 |
Kesimpulan
Dengan taraf signifikansi 5% dapat disimpulkan bahwa,
Faktor gender berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi.
Faktor perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi.
Interaksi antara gender dan perokok berpengaruh terhadap pengukuran usia, BMI, dan biaya asuransi.
Hipotesis
H0 : Faktor tidak berpengaruh secara signifikan terhadap vektor yang diamati. H1 : Faktor berpengaruh secara signifikan terhadap vektor yang diamati.
Taraf Signifikansi
⍺ = 5%
Kriteria Uji
Tolak H0 jika p-value < ⍺ , terima dalam hal lainnya
Statistik Uji
summary.aov(manova)
## Response x1_p :
## Df Sum Sq Mean Sq F value Pr(>F)
## gender 1 2605.0 2605.04 17.9690 0.0002501 ***
## smoker 1 136.0 136.00 0.9381 0.3416906
## gender:smoker 1 181.1 181.11 1.2493 0.2739170
## Residuals 26 3769.3 144.97
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Response x2_p :
## Df Sum Sq Mean Sq F value Pr(>F)
## gender 1 2.43 2.430 0.0848 0.77319
## smoker 1 63.91 63.911 2.2308 0.14732
## gender:smoker 1 136.89 136.888 4.7781 0.03802 *
## Residuals 26 744.87 28.649
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Response x3_p :
## Df Sum Sq Mean Sq F value Pr(>F)
## gender 1 96691540 96691540 2.3437 0.137865
## smoker 1 2909023562 2909023562 70.5130 7.046e-09 ***
## gender:smoker 1 360709474 360709474 8.7434 0.006533 **
## Residuals 26 1072633797 41255146
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Keputusan
Response | Kelompok | P-value | Keputusan |
---|---|---|---|
Usia | gender | 0,0002501 | Tolak H0 |
Usia | perokok | 0,3416906 | Terima H0 |
Usia | gender*perokok | 0,273917 | Terima H0 |
BMI | gender | 0,77319 | Terima H0 |
BMI | perokok | 0,14732 | Terima H0 |
BMI | gender*perokok | 0,03802 | Tolak H0 |
Biaya Asuransi | gender | 0,137865 | Terima H0 |
Biaya Asuransi | peroko | 7.046e-09 | Tolak H0 |
Biaya Asuransi | gender*perokok | 0.006533 | Tolak H0 |
Kesimpulan
Dengan taraf signfikasi 5%
Gender seseorang secara signifikan mempengaruhi Usia.
Gender seseorang tidak mempengaruhi BMI secara signifkan.
Gender seseorang tidak mempengaruhi biaya asuranasi secara signifikan
Perokok atau tidaknya seseorang tidak mempengaruhi usia secara signifikan.
Perokok atau tidaknya seseorang tidak mempengaruhi BMI secara signifikan.
Perokok atau tidaknya seseorang secara signifikan mempengaruhi biaya asuransi.
Interaksi gender dan perokok tidak mempengaruhi usia secara signifikan
Interaksi gender dan perokok secara signifikan mempengaruhi BMI
Interaksi gender dan perokok secara signifikan mempengaruhi Biaya Asuransi