Respuestas

Tabla. Incidencia de cáncer de mama en mujeres estilistas y de otras ocupaciones
ca_mama sin ca Sum
estilista 20 980 1000
no estilista 7 993 1000
Esperados
O-E
(O-E)²/E
estilista no estilista estilista no estilista estilista no estilista
ca_mama 13.5 13.5 -6.5 6.5 3.13 3.13
sin ca 986.5 986.5 6.5 -6.5 0.04 0.04
Total 1000.0 1000.0 0.0 0.0 3.17 3.17

\(\chi^2\) = 3.17 + 3.17 = 6.34

Tras obtener el estadístico (en este caso el valor de \(\chi^2\)) la p correspondiente puede variar dependiendo de si se considera una prueba de una o dos colas, sin embargo: > La prueba de \(\chi^2\) siempre es de una cola

Por tanto: Número de grados de libertad = (filas - 1) * (columnas - 1) = (2-1) * (2-1) = 1

 p <- pchisq(6.34, df=1, lower.tail = FALSE)
 round(p, 3)
## [1] 0.012

*e) \(p = x/n\) \(\sigma = \sqrt{p(1-p)}\) \(S_p = \sqrt{\frac{p(1-p)}{n}}\)
\(p \pm z_{\alpha/2} S_p\)
\(p = 15/100 = 0.15\) \(S_p = \sqrt{\frac{0.15(1-0.15)}{100}} = 0.03570\) \(0.15 \pm z_{\alpha/2} 0.03570 = -0.08 / 0.219986\)

dist_fuma <- c(15, 100-15, 3100*0.25, 3100-(3100*0.25))
dist_fuma
## [1]   15   85  775 2325
dist_fuma <- matrix(dist_fuma, 2, 2)
dist_fuma
##      [,1] [,2]
## [1,]   15  775
## [2,]   85 2325
chisq.test(dist_fuma)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  dist_fuma
## X-squared = 4.6864, df = 1, p-value = 0.0304

\(z' = \frac{|p_2-p_1|}{s_{p_2-p_1}}\)

\(s_{p_2-p_1} = \sqrt{\frac{p_2(1-p_2)}{n_2} + \frac{p_1(1-p_1)}{n_1}}\)

\(z_{1-\beta(superior)} = z_{\alpha/2}-z´=z_{\alpha/2} - \frac{|p_2-p_1|}{s_{p_2-p_1}}\)

p_1=0.25 p_2=0.20 \(s_{p_2-p_1} = \sqrt{\frac{0.20(1-0.20)}{100} + \frac{0.25(1-0.25)}{3100}} = 0.04075\)

\(z' = \frac{0.05}{0.04075} = 1.227\)

\(z_{1-\beta(superior)} = 1.96-1.22 = 0.7329\)

library(openxlsx)
indep <- read.xlsx("anexo1.xlsx")
tapply(indep$tg, indep$grupo, summary)
## $fib_alta
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   6.178  24.051  41.027  85.835 127.912 326.329 
## 
## $fib_hab
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.98   62.80  130.38  226.15  215.44 1556.85
hist(indep$tg, breaks = 15)

t.test(indep$tg ~ indep$grupo)
## 
##  Welch Two Sample t-test
## 
## data:  indep$tg by indep$grupo
## t = -1.8985, df = 24.082, p-value = 0.06968
## alternative hypothesis: true difference in means between group fib_alta and group fib_hab is not equal to 0
## 95 percent confidence interval:
##  -292.82455   12.19622
## sample estimates:
## mean in group fib_alta  mean in group fib_hab 
##                85.8345               226.1487
wilcox.test(indep$tg ~ indep$grupo)
## 
##  Wilcoxon rank sum exact test
## 
## data:  indep$tg by indep$grupo
## W = 145, p-value = 0.02243
## alternative hypothesis: true location shift is not equal to 0

Dado el tamaño de muestra y la distribución de la variable independiente (triglicéridos séricos) la prueba de t puede subestimar la diferencia entre grupos por lo que la prueba de Wilcox es más apropiada.

pareadas <- read.xlsx("anexo1.xlsx", sheet = 2)
summary(pareadas[-1])
##     fib_hab          fib_alta     
##  Min.   : 55.68   Min.   : 24.07  
##  1st Qu.: 84.64   1st Qu.: 60.04  
##  Median :105.85   Median : 70.86  
##  Mean   :125.25   Mean   : 93.28  
##  3rd Qu.:149.33   3rd Qu.:106.24  
##  Max.   :335.15   Max.   :332.85
hist(pareadas$fib_hab, breaks = 15)

hist(pareadas$fib_alta, breaks = 15)

t.test(pareadas$fib_hab, pareadas$fib_alta, paired = TRUE)
## 
##  Paired t-test
## 
## data:  pareadas$fib_hab and pareadas$fib_alta
## t = 6.3414, df = 29, p-value = 6.271e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  21.65717 42.27741
## sample estimates:
## mean of the differences 
##                31.96729
wilcox.test(pareadas$fib_hab, pareadas$fib_alta, paired = TRUE)
## 
##  Wilcoxon signed rank exact test
## 
## data:  pareadas$fib_hab and pareadas$fib_alta
## V = 465, p-value = 1.863e-09
## alternative hypothesis: true location shift is not equal to 0

Dado el tamaño de muestra y la distribución de la variable independiente (triglicéridos séricos) la prueba de t puede subestimar la diferencia entre grupos por lo que la prueba de Wilcox es más apropiada.

  1. Calculemos el valor de t crítico para un \(\alpha = 0.05\) bajo la hipótesis nula y el valor de t esperado en caso de una saturación del 92% con desviación estándar el 3%.

Grados de libertad \(GL_t=n_1+n_2-2 = 42\)

##Valor de t crítico para una prueba de 2 colas con alfa=0.05 con 18 grados de libertad
qt(0.05/2, 42, lower.tail = FALSE)
## [1] 2.018082

Bajo un cambio de 3% en la saturación y 22 sujetos en cada grupo esperamos —

\(t = \frac{\bar x_{dr} - \bar x_{pla}}{\sqrt{(s^2/n_{dr}) + (s^2/n_{pla})}}\)

\(\sigma=3\)

\(t = \frac{3}{\sqrt{(3^2/22) + (3^2/22)}} = 3.31\)

##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 42, lower.tail = FALSE)
## [1] 2.018082
##diferencia entre hipótesis nula y diferencia del 3% bajo alfa=0.05
qt(0.05/2, 42, lower.tail = FALSE) - 3.31
## [1] -1.291918
##poder estadístico con diferencia del 3% y alfa=0.05
pt(-1.21919, 42, lower.tail = FALSE)
## [1] 0.8852124

\(\beta\)(probabilidad de error tipo 2) = 1-poder, por tanto \(\beta=1-0.8832=0.1167\)