Komputasi Statistika

~ Final Exam ~


Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/diasary_nm/
RPubs https://rpubs.com/diyasarya/

library("performance")
library("see")
library("broom")
library("fBasics")
library("tidyverse")
library("ggpubr")
library("ISwR")
library("mvnormtest")
library("rstatix")
library("GGally")

2 Buatlah contoh penyelesaian Hipotesis Testing dengan menggunakan R!

Terdapat sebuah dataset rmr yang berisi resting metabolic rate dari 44 perempuan yang diambil sampel. Diklaim bahwa setidaknya lebih dari 1225 metabolic rate untuk setiap perempuan. Dengan level signifikan 95%, apakah kita dapat menolak klaim tersebut.

rmr

Hipotesis yang diuji untuk pemeriksaan klaim adalah
H0: Jumlah rata-rata metabolic rate sama dengan atau lebih dari 1225 kcal/24hr
H1: Jumlah rata-rata metabolic rate kurang dari 1225 kcal/24hr
Lalu lakukan pengujian

mu0 = 1225
n = 44
xbar = mean(rmr$metabolic.rate)
sigma = sd(rmr$metabolic.rate)
alpha = 0.05
t = (xbar-mu0)/(sigma/sqrt(n))
t.alpha = qt(1-alpha, df = n-1)
p.value = pt(t, df = n-1, lower.tail = F)
cat(" T score =", t, "\n",
    "T crit =", t.alpha, "\n",
    "P value =", p.value)
##  T score = 3.260296 
##  T crit = 1.681071 
##  P value = 0.001090315

Untuk menarik kesimpulan kita dapat membandingkan T score dengan T crit atau P value dengan alpha.
- Jika p-value > alpha = 0,05 maka, H0 diterima
- Jika p-value < alpha = 0,05 maka, H0 ditolak
- Jika T score > T crit maka, H0 ditolak
- Jika T score < T crit maka, H0 diterima
Berdasarkan kriteria diatas dimana T score > T crit dan p-value < alpha maka, dapat disimpulkan H0 ditolak yang artinya “Jumlah rata-rata metabolic rate kurang dari 1225 kcal/24hr”.

3 Buatlah contoh penyelesaian ANOVA dengan menggunakan R!

Data Kasus No 3

ventilation <- c(rep("1", each = 8), rep("2", each = 9), rep("3", each = 5))
folate <- c(243, 251, 275, 291, 347, 354, 380, 392, 206, 210, 226, 249, 255, 273, 285, 295, 309, 241, 258, 270, 293, 328)
data <- data.frame("Ventilation" = ventilation,
                   "Folate" = folate)

Saya kategorikan ventilation sebagai berikut :
kat 1 = N2O+O2,24h
kat 2 = N2O+O2,op
kat 3 = O2,24h

anova <- aov(Folate ~ ventilation, data = data)
res <- broom::augment(anova)
res

Asumsi 1 : Normalitas

plot(check_normality(x = anova), type = "pp")

Hipotesis yang diuji untuk pemeriksaan normalitas adalah
H0: residual menyebar normal
H1: residual tidak menyebar normal
Uji Normalitas bisa dilakukan dengan beberapa metode pengujian dibawah ini

fBasics::shapiroTest(res %>% pull(.resid))
## 
## Title:
##  Shapiro - Wilk Normality Test
## 
## Test Results:
##   STATISTIC:
##     W: 0.966
##   P VALUE:
##     0.6188

Karena p-value yang dihasilkan dari uji normalitas lebih dari 0.05 maka H0 diterima atau dengan kata lain residual menyebar normal.


Asumsi 2 : Homogenitas

ggpubr::ggscatter(data = res, x = ".fitted", y = ".resid", color = "steelblue") +
  geom_hline(aes(yintercept=0))

Hipotesis yang diuji untuk pemeriksaan homogenitas adalah
H0: residual memiliki ragam homogen
H1: residual memiliki ragam tidak homogen
Uji Homogenitas bisa dilakukan dengan beberapa metode pengujian dibawah ini

check_homogeneity(anova,method="fligner")
## OK: There is not clear evidence for different variances across groups (Fligner-Killeen Test, p = 0.063).

karena p-value yang dihasilkan dari uji homogenitas lebih dari 0.05 maka H0 diterima atau dengan kata lain residual ragam homogen.


Asumsi 3 : Independent

ggpubr::ggscatter(data = res %>%
                    mutate(order = seq(nrow(res))), 
                  x = "order", y = ".resid", color = "steelblue")

Dari grafik diatas, terbentuk pola linear maka diduga bahwa asumsi Independent terpenuhi.


Setelah semua asumsi sudah terpenuhi, maka lanjut untuk melakukan uji ANOVA.
Hipotesis yang diuji pada kasus ini adalah
H0: Tidak terdapat perbedaan rata-rata ventilation yang signifikan
H1: Terdapat perbedaan rata-rata ventilation yang signifikan minimal 1

summary(anova)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## ventilation  2  15516    7758   3.711 0.0436 *
## Residuals   19  39716    2090                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

karena p-value yang dihasilkan dari uji ANOVA kurang dari 0.05 maka H0 ditolak atau dengan kata lain terdapat minimal sepasang ventilation yang memiliki rata-rata yang berbeda.

TukeyHSD(anova, conf.level = 0.95)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Folate ~ ventilation, data = data)
## 
## $ventilation
##          diff        lwr      upr     p adj
## 2-1 -60.18056 -116.61904 -3.74207 0.0354792
## 3-1 -38.62500 -104.84037 27.59037 0.3214767
## 3-2  21.55556  -43.22951 86.34062 0.6802018

Kesimpulan yang di dapat dari Uji Tukey HSD :
1. kategori 1 vs 2 dengan p adj = 0,0354792 < a = 0,05 maka H0 ditolak, artinya kategori 1 vs 2 memiliki perbedaan yang signifikan.
2. kategori 1 vs 3 dengan p adj = 0,3214767 > a = 0,05 maka H0 diterima, artinya kategori 1 vs 3 tidak memiliki perbedaan yang signifikan.
3. kategori 2 vs 3 dengan p adj = 0,6802018 > a = 0,05 maka H0 diterima, artinya kategori 2 vs 3 tidak memiliki perbedaan yang signifikan.
4. Dengan kata lain jenis pernapasan yang memiliki hasil yang berbeda adalah N2O+O2,24h (kategori 1) vs N2O+O2,op (kategori 2).

4 Buatlah contoh penyelesaian MANOVA dengan menggunakan R!

Berikut terdapat dataset bp.obese tentang obesitas dan tekanan darah. Data ini mengambil sampel acak orang dewasa Meksiko-Amerika di sebuah kota kecil California. Lakukan lah pengujian dengan kondisi apakah terdapat perbedaan yang signifikan antara obese dan bp dengan perbedaan sex.

bp.obese

sex, 0 for male and 1 for female
obese is ratio of actual weight to ideal weight from New York Metropolitan Life Tables
bp is systolic blood pressure (mm Hg)


Asumsi 1 : Multicollinearitas


Hipotesis yang diuji untuk pemeriksaan homogenitas covarians adalah
H0: Terdapat hubungan multicollinearitas antar variabel
H1: Tidak terdapat hubungan multicollinearitas antar variabel
Uji Homogenitas bisa dilakukan dengan beberapa metode pengujian dibawah ini

bp.obese %>%
  cor_test(obese, bp) 

Karena p-value yang dihasilkan kurang dari 0.05 maka H0 ditolak atau dengan kata lain variabel independen tidak terdapat multicollinearitas.


Asumsi 2 : Normalitas dan Linearitas

lin <- bp.obese %>%
  select(obese, bp, sex) %>%
  group_by(sex) %>%
  doo(~ggpairs(.) + theme_bw(), result = "plots")
lin$plots
## [[1]]

## 
## [[2]]

Asumsi 3 : Homogenitas Covarians


Hipotesis yang diuji untuk pemeriksaan homogenitas covarians adalah
H0: residual memiliki covarians homogen
H1: residual memiliki covarians tidak homogen
Uji Homogenitas bisa dilakukan dengan beberapa metode pengujian dibawah ini

box_m(bp.obese[, c("obese", "bp")], bp.obese$sex)

Karena p-value yang dihasilkan kurang dari 0.05 maka H0 ditolak atau dengan kata lain data residuals memiliki covarians yang tidak homogen. Tetapi, jika asumsi ini ditolak maka, masih tetap bisa untuk melanjutkan analisis dengan cara mengubah variabel dependen atau tetap melanjutkan dengan wilks’ statistik.


Setelah semua pengujian asumsi terpenuhi maka, bisa lanjut untuk melakukan pengujian MANOVA.
Hipotesis yang diuji pada kasus ini adalah
H0: Tidak terdapat perbedaan rata-rata antara obese dan bp yang signifikan
H1: Terdapat perbedaan rata-rata antara obese dan bp yang signifikan minimal 1

summary(manova(cbind(bp, obese) ~ sex, data=bp.obese))
##            Df  Pillai approx F num Df den Df    Pr(>F)    
## sex         1 0.19871   12.275      2     99 1.728e-05 ***
## Residuals 100                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

karena p-value yang dihasilkan dari uji MANOVA kurang dari 0.05 maka H0 ditolak atau dengan kata lain terdapat minimal satu pasangan yang memiliki rata-rata obese dan bp yang berbeda.

summary.aov(manova(cbind(bp, obese) ~ sex, data = bp.obese))
##  Response bp :
##              Df Sum Sq Mean Sq F value Pr(>F)
## sex           1     68   67.64  0.2029 0.6533
## Residuals   100  33330  333.30               
## 
##  Response obese :
##              Df Sum Sq Mean Sq F value    Pr(>F)    
## sex           1 1.0990 1.09900  19.571 2.472e-05 ***
## Residuals   100 5.6156 0.05616                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1