Komputasi Statistika
~ Final Exam ~
| Kontak | : \(\downarrow\) |
| diyasaryanugroho@gmail.com | |
| https://www.instagram.com/diasary_nm/ | |
| RPubs | https://rpubs.com/diyasarya/ |
library("performance")
library("see")
library("broom")
library("fBasics")
library("tidyverse")
library("ggpubr")
library("ISwR")
library("mvnormtest")
library("rstatix")
library("GGally")2 Buatlah contoh penyelesaian Hipotesis Testing dengan menggunakan R!
Terdapat sebuah dataset rmr yang berisi resting
metabolic rate dari 44 perempuan yang diambil sampel. Diklaim bahwa
setidaknya lebih dari 1225 metabolic rate untuk setiap perempuan. Dengan
level signifikan 95%, apakah kita dapat menolak klaim tersebut.
rmrHipotesis yang diuji untuk pemeriksaan klaim adalah
H0: Jumlah
rata-rata metabolic rate sama dengan atau lebih dari 1225 kcal/24hr
H1: Jumlah rata-rata metabolic rate kurang dari 1225 kcal/24hr
Lalu
lakukan pengujian
mu0 = 1225
n = 44
xbar = mean(rmr$metabolic.rate)
sigma = sd(rmr$metabolic.rate)
alpha = 0.05
t = (xbar-mu0)/(sigma/sqrt(n))
t.alpha = qt(1-alpha, df = n-1)
p.value = pt(t, df = n-1, lower.tail = F)
cat(" T score =", t, "\n",
"T crit =", t.alpha, "\n",
"P value =", p.value)## T score = 3.260296
## T crit = 1.681071
## P value = 0.001090315
Untuk menarik kesimpulan kita dapat membandingkan T score dengan T
crit atau P value dengan alpha.
- Jika p-value > alpha = 0,05
maka, H0 diterima
- Jika p-value < alpha = 0,05 maka, H0 ditolak
- Jika T score > T crit maka, H0 ditolak
- Jika T score
< T crit maka, H0 diterima
Berdasarkan kriteria diatas dimana T
score > T crit dan p-value < alpha maka, dapat disimpulkan H0
ditolak yang artinya “Jumlah rata-rata metabolic rate kurang dari 1225
kcal/24hr”.
3 Buatlah contoh penyelesaian ANOVA dengan menggunakan R!
Data Kasus No 3
ventilation <- c(rep("1", each = 8), rep("2", each = 9), rep("3", each = 5))
folate <- c(243, 251, 275, 291, 347, 354, 380, 392, 206, 210, 226, 249, 255, 273, 285, 295, 309, 241, 258, 270, 293, 328)
data <- data.frame("Ventilation" = ventilation,
"Folate" = folate)Saya kategorikan ventilation sebagai berikut :
kat 1 =
N2O+O2,24h
kat 2 = N2O+O2,op
kat 3 = O2,24h
anova <- aov(Folate ~ ventilation, data = data)
res <- broom::augment(anova)
resAsumsi 1 : Normalitas
plot(check_normality(x = anova), type = "pp")Hipotesis yang diuji untuk pemeriksaan normalitas adalah
H0:
residual menyebar normal
H1: residual tidak menyebar normal
Uji Normalitas bisa dilakukan dengan beberapa metode pengujian dibawah
ini
fBasics::shapiroTest(res %>% pull(.resid))##
## Title:
## Shapiro - Wilk Normality Test
##
## Test Results:
## STATISTIC:
## W: 0.966
## P VALUE:
## 0.6188
Karena p-value yang dihasilkan dari uji normalitas lebih dari 0.05
maka H0 diterima atau dengan kata lain residual menyebar normal.
Asumsi 2 : Homogenitas
ggpubr::ggscatter(data = res, x = ".fitted", y = ".resid", color = "steelblue") +
geom_hline(aes(yintercept=0))Hipotesis yang diuji untuk pemeriksaan homogenitas adalah
H0:
residual memiliki ragam homogen
H1: residual memiliki ragam tidak
homogen
Uji Homogenitas bisa dilakukan dengan beberapa metode
pengujian dibawah ini
check_homogeneity(anova,method="fligner")## OK: There is not clear evidence for different variances across groups (Fligner-Killeen Test, p = 0.063).
karena p-value yang dihasilkan dari uji homogenitas lebih dari 0.05
maka H0 diterima atau dengan kata lain residual ragam homogen.
Asumsi 3 : Independent
ggpubr::ggscatter(data = res %>%
mutate(order = seq(nrow(res))),
x = "order", y = ".resid", color = "steelblue")Dari grafik diatas, terbentuk pola linear maka diduga bahwa asumsi
Independent terpenuhi.
Setelah semua asumsi sudah terpenuhi, maka lanjut untuk
melakukan uji ANOVA.
Hipotesis yang diuji pada kasus ini adalah
H0: Tidak terdapat perbedaan rata-rata ventilation yang signifikan
H1: Terdapat perbedaan rata-rata ventilation yang signifikan
minimal 1
summary(anova)## Df Sum Sq Mean Sq F value Pr(>F)
## ventilation 2 15516 7758 3.711 0.0436 *
## Residuals 19 39716 2090
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
karena p-value yang dihasilkan dari uji ANOVA kurang dari 0.05 maka H0 ditolak atau dengan kata lain terdapat minimal sepasang ventilation yang memiliki rata-rata yang berbeda.
TukeyHSD(anova, conf.level = 0.95)## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Folate ~ ventilation, data = data)
##
## $ventilation
## diff lwr upr p adj
## 2-1 -60.18056 -116.61904 -3.74207 0.0354792
## 3-1 -38.62500 -104.84037 27.59037 0.3214767
## 3-2 21.55556 -43.22951 86.34062 0.6802018
Kesimpulan yang di dapat dari Uji Tukey HSD :
1. kategori 1 vs 2
dengan p adj = 0,0354792 < a = 0,05 maka H0 ditolak, artinya kategori
1 vs 2 memiliki perbedaan yang signifikan.
2. kategori 1 vs 3
dengan p adj = 0,3214767 > a = 0,05 maka H0 diterima, artinya
kategori 1 vs 3 tidak memiliki perbedaan yang signifikan.
3.
kategori 2 vs 3 dengan p adj = 0,6802018 > a = 0,05 maka H0 diterima,
artinya kategori 2 vs 3 tidak memiliki perbedaan yang signifikan.
4. Dengan kata lain jenis pernapasan yang memiliki hasil yang berbeda
adalah N2O+O2,24h (kategori 1) vs N2O+O2,op (kategori 2).
4 Buatlah contoh penyelesaian MANOVA dengan menggunakan R!
Berikut terdapat dataset bp.obese tentang obesitas dan
tekanan darah. Data ini mengambil sampel acak orang dewasa
Meksiko-Amerika di sebuah kota kecil California. Lakukan lah pengujian
dengan kondisi apakah terdapat perbedaan yang signifikan antara
obese dan bp dengan perbedaan
sex.
bp.obesesex, 0 for male and 1 for female
obese is ratio of actual weight
to ideal weight from New York Metropolitan Life Tables
bp is
systolic blood pressure (mm Hg)
Asumsi 1 : Multicollinearitas
Hipotesis yang diuji untuk pemeriksaan homogenitas covarians
adalah
H0: Terdapat hubungan multicollinearitas antar variabel
H1: Tidak terdapat hubungan multicollinearitas antar variabel
Uji
Homogenitas bisa dilakukan dengan beberapa metode pengujian dibawah
ini
bp.obese %>%
cor_test(obese, bp) Karena p-value yang dihasilkan kurang dari 0.05 maka H0 ditolak atau
dengan kata lain variabel independen tidak terdapat multicollinearitas.
Asumsi 2 : Normalitas dan Linearitas
lin <- bp.obese %>%
select(obese, bp, sex) %>%
group_by(sex) %>%
doo(~ggpairs(.) + theme_bw(), result = "plots")
lin$plots## [[1]]
##
## [[2]]
Asumsi 3 : Homogenitas Covarians
Hipotesis yang diuji untuk pemeriksaan homogenitas covarians
adalah
H0: residual memiliki covarians homogen
H1: residual
memiliki covarians tidak homogen
Uji Homogenitas bisa dilakukan
dengan beberapa metode pengujian dibawah ini
box_m(bp.obese[, c("obese", "bp")], bp.obese$sex)Karena p-value yang dihasilkan kurang dari 0.05 maka H0 ditolak atau
dengan kata lain data residuals memiliki covarians yang tidak homogen.
Tetapi, jika asumsi ini ditolak maka, masih tetap bisa untuk melanjutkan
analisis dengan cara mengubah variabel dependen atau tetap melanjutkan
dengan wilks’ statistik.
Setelah semua pengujian asumsi terpenuhi maka, bisa lanjut untuk
melakukan pengujian MANOVA.
Hipotesis yang diuji pada kasus ini
adalah
H0: Tidak terdapat perbedaan rata-rata antara obese dan bp
yang signifikan
H1: Terdapat perbedaan rata-rata antara obese dan
bp yang signifikan minimal 1
summary(manova(cbind(bp, obese) ~ sex, data=bp.obese))## Df Pillai approx F num Df den Df Pr(>F)
## sex 1 0.19871 12.275 2 99 1.728e-05 ***
## Residuals 100
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
karena p-value yang dihasilkan dari uji MANOVA kurang dari 0.05 maka H0 ditolak atau dengan kata lain terdapat minimal satu pasangan yang memiliki rata-rata obese dan bp yang berbeda.
summary.aov(manova(cbind(bp, obese) ~ sex, data = bp.obese))## Response bp :
## Df Sum Sq Mean Sq F value Pr(>F)
## sex 1 68 67.64 0.2029 0.6533
## Residuals 100 33330 333.30
##
## Response obese :
## Df Sum Sq Mean Sq F value Pr(>F)
## sex 1 1.0990 1.09900 19.571 2.472e-05 ***
## Residuals 100 5.6156 0.05616
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1