| ca_mama | sin ca | Sum | |
|---|---|---|---|
| estilista | 20 | 980 | 1000 |
| no estilista | 7 | 993 | 1000 |
| estilista | no estilista | estilista | no estilista | estilista | no estilista | |
|---|---|---|---|---|---|---|
| ca_mama | 13.5 | 13.5 | -6.5 | 6.5 | 3.13 | 3.13 |
| sin ca | 986.5 | 986.5 | 6.5 | -6.5 | 0.04 | 0.04 |
| Total | 1000.0 | 1000.0 | 0.0 | 0.0 | 3.17 | 3.17 |
\(\chi^2\) = 3.17 + 3.17 = 6.34
Tras obtener el estadístico (en este caso el valor de \(\chi^2\)) la p correspondiente puede variar dependiendo de si se considera una prueba de una o dos colas, sin embargo: > La prueba de \(\chi^2\) siempre es de una cola
Por tanto: Número de grados de libertad = (filas - 1) * (columnas - 1) = (2-1) * (2-1) = 1
p <- pchisq(6.34, df=1, lower.tail = FALSE)
round(p, 3)
## [1] 0.012
*e) \(p = x/n\) \(\sigma = \sqrt{p(1-p)}\) \(S_p = \sqrt{\frac{p(1-p)}{n}}\)
\(p \pm z_{\alpha/2} S_p\)
\(p = 15/100 = 0.15\) \(S_p = \sqrt{\frac{0.15(1-0.15)}{100}} = 0.03570\) \(0.15 \pm z_{\alpha/2} 0.03570 = -0.08 / 0.219986\)
dist_fuma <- c(15, 100-15, 3100*0.25, 3100-(3100*0.25))
dist_fuma
## [1] 15 85 775 2325
dist_fuma <- matrix(dist_fuma, 2, 2)
dist_fuma
## [,1] [,2]
## [1,] 15 775
## [2,] 85 2325
chisq.test(dist_fuma)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: dist_fuma
## X-squared = 4.6864, df = 1, p-value = 0.0304
\(z' = \frac{|p_2-p_1|}{s_{p_2-p_1}}\)
\(s_{p_2-p_1} = \sqrt{\frac{p_2(1-p_2)}{n_2} + \frac{p_1(1-p_1)}{n_1}}\)
\(z_{1-\beta(superior)} = z_{\alpha/2}-z´=z_{\alpha/2} - \frac{|p_2-p_1|}{s_{p_2-p_1}}\)
p_1=0.25 p_2=0.20 \(s_{p_2-p_1} = \sqrt{\frac{0.20(1-0.20)}{100} + \frac{0.25(1-0.25)}{3100}} = 0.04075\)
\(z' = \frac{0.05}{0.04075} = 1.227\)
\(z_{1-\beta(superior)} = 1.96-1.22 = 0.7329\)
library(openxlsx)
indep <- read.xlsx("anexo1.xlsx")
tapply(indep$tg, indep$grupo, summary)
## $fib_alta
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6.178 24.051 41.027 85.835 127.912 326.329
##
## $fib_hab
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 15.98 62.80 130.38 226.15 215.44 1556.85
hist(indep$tg, breaks = 15)
t.test(indep$tg ~ indep$grupo)
##
## Welch Two Sample t-test
##
## data: indep$tg by indep$grupo
## t = -1.8985, df = 24.082, p-value = 0.06968
## alternative hypothesis: true difference in means between group fib_alta and group fib_hab is not equal to 0
## 95 percent confidence interval:
## -292.82455 12.19622
## sample estimates:
## mean in group fib_alta mean in group fib_hab
## 85.8345 226.1487
wilcox.test(indep$tg ~ indep$grupo)
##
## Wilcoxon rank sum exact test
##
## data: indep$tg by indep$grupo
## W = 145, p-value = 0.02243
## alternative hypothesis: true location shift is not equal to 0
Dado el tamaño de muestra y la distribución de la variable independiente (triglicéridos séricos) la prueba de t puede subestimar la diferencia entre grupos por lo que la prueba de Wilcox es más apropiada.
pareadas <- read.xlsx("anexo1.xlsx", sheet = 2)
summary(pareadas[-1])
## fib_hab fib_alta
## Min. : 55.68 Min. : 24.07
## 1st Qu.: 84.64 1st Qu.: 60.04
## Median :105.85 Median : 70.86
## Mean :125.25 Mean : 93.28
## 3rd Qu.:149.33 3rd Qu.:106.24
## Max. :335.15 Max. :332.85
hist(pareadas$fib_hab, breaks = 15)
hist(pareadas$fib_alta, breaks = 15)
t.test(pareadas$fib_hab, pareadas$fib_alta, paired = TRUE)
##
## Paired t-test
##
## data: pareadas$fib_hab and pareadas$fib_alta
## t = 6.3414, df = 29, p-value = 6.271e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 21.65717 42.27741
## sample estimates:
## mean of the differences
## 31.96729
wilcox.test(pareadas$fib_hab, pareadas$fib_alta, paired = TRUE)
##
## Wilcoxon signed rank exact test
##
## data: pareadas$fib_hab and pareadas$fib_alta
## V = 465, p-value = 1.863e-09
## alternative hypothesis: true location shift is not equal to 0
Dado el tamaño de muestra y la distribución de la variable independiente (triglicéridos séricos) la prueba de t puede subestimar la diferencia entre grupos por lo que la prueba de Wilcox es más apropiada.
Grados de libertad \(GL_t=n_1+n_2-2 = 42\)
##Valor de t crítico para una prueba de 2 colas con alfa=0.05 con 18 grados de libertad
qt(0.05/2, 42, lower.tail = FALSE)
## [1] 2.018082
Bajo un cambio de 3% en la saturación y 22 sujetos en cada grupo esperamos —
\(t = \frac{\bar x_{dr} - \bar x_{pla}}{\sqrt{(s^2/n_{dr}) + (s^2/n_{pla})}}\)
\(\sigma=3\)
\(t = \frac{3}{\sqrt{(3^2/22) + (3^2/22)}} = 3.31\)
##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 42, lower.tail = FALSE)
## [1] 2.018082
##diferencia entre hipótesis nula y diferencia del 3% bajo alfa=0.05
qt(0.05/2, 42, lower.tail = FALSE) - 3.31
## [1] -1.291918
##poder estadístico con diferencia del 3% y alfa=0.05
pt(-1.21919, 42, lower.tail = FALSE)
## [1] 0.8852124
\(\beta\)(probabilidad de error tipo 2) = 1-poder, por tanto \(\beta=1-0.8832=0.1167\)