En esta práctica se proponen una serie de ejemplos que ilustran cómo se llevan a cabo con R los principales contrastes de hipótesis paramétricos. Veremos primero cómo llevar a cabo contrastes para una sola media y posteriormente cómo realizar contrastes para la diferencia de dos medias (tanto en el caso de muestras independientes como de datos emparejados). Finalmente, se describe cómo realizar contrastes relacionados con una o dos proporciones.
Ejemplo: Se mide el tiempo (en segundos) de duración de un proceso químico realizado 20 veces en condiciones similares, obteniéndose los siguientes resultados:
resultados <- c(93, 90, 97, 90, 93, 91, 96, 94, 91, 91, 88, 93, 95,
91, 89, 92, 87, 88, 90, 86)
Suponemos que los datos proceden de una distribución normal. ¿Permiten los datos anteriores afirmar a nivel \( \alpha=0.01 \) que la duración media del proceso es inferior a 95 segundos?
Para llevar a cabo el contraste, usamos el comando t.test. En este caso, este comando tiene tres argumentos:
resultados).alternative y mu, que sirven para determinar cuál es la hipótesis alternativa. Si \( \mu \) es el tiempo medio, queremos contrastar \( H_0:\mu\geq \mu_0 \) frente a \( H_1:\mu < \mu_0 \), con \( \mu_0=95 \). El argumento mu corresponde a \( \mu_0 \). Le damos por tanto el valor 95 (el valor por defecto es 0). Para alternative elegimos la opción less. Las otras dos posibilidades son two.sided (opción por defecto que corresponde a \( H_1:\mu \neq \mu_0 \)), y greater, que corresponde a \( H_1:\mu >\mu_0 \).t.test(resultados, alternative = "less", mu = 95)
##
## One Sample t-test
##
## data: resultados
## t = -5.713, df = 19, p-value = 8.306e-06
## alternative hypothesis: true mean is less than 95
## 95 percent confidence interval:
## -Inf 92.39
## sample estimates:
## mean of x
## 91.25
El estadístico \( t \) vale -5.713. Hay que comparar este valor con la distribución \( t \) de Student con \( n-1=19 \) grados de libertad. Resulta un p-valor \( 8.306\times 10^{-6} \), prácticamente igual a cero, menor que \( \alpha=0.01 \), por lo que se rechaza claramente la hipótesis nula a este nivel. Podemos afirmar que la duración media es inferior a 95 segundos.
t.test(resultados, mu = 90)
##
## One Sample t-test
##
## data: resultados
## t = 1.904, df = 19, p-value = 0.07214
## alternative hypothesis: true mean is not equal to 90
## 95 percent confidence interval:
## 89.88 92.62
## sample estimates:
## mean of x
## 91.25
En este caso el p-valor es \( 0.07214>0.05 \) por lo que no es posible rechazar la hipótesis nula. Por otra parte \( [89.88; 92.62] \) es un intervalo de confianza de nivel \( 0.95 \) (valor por defecto que se puede modificar con el argumento conf.level) para el tiempo medio \( \mu \).
t.test(resultados, alternative = "greater", mu = 90)
##
## One Sample t-test
##
## data: resultados
## t = 1.904, df = 19, p-value = 0.03607
## alternative hypothesis: true mean is greater than 90
## 95 percent confidence interval:
## 90.11 Inf
## sample estimates:
## mean of x
## 91.25
Ejemplo: El maíz es un alimento importante para los animales. De todas formas, este alimento carece de algunos aminoácidos que son esenciales. Un grupo de científicos desarrolló una nueva variedad que sí contenía niveles apreciables de dichos aminoácidos. Para comprobar la utilidad de esta nueva variedad para la alimentación animal se llevó a cabo el siguiente experimento: a un grupo de 20 pollos de 1 día se les suministró un pienso que contenía harina de maíz de la nueva variedad. A otro grupo de 20 pollos (grupo de control) se le alimentó con un pienso que solo se diferenciaba del anterior en que no conteníaa harina de la variedad mejorada de maíz. Los resultados que se obtuvieron sobre las ganancias de peso de los pollos (en gramos) al cabo de 21 días de alimentación fueron los siguientes:
# Datos
maiz.normal <- c(380, 321, 366, 356, 283, 349, 402, 462, 356, 410,
329, 399, 350, 384, 316, 272, 345, 455, 360, 431)
maiz.transgenico <- c(361, 447, 401, 375, 434, 403, 393, 426, 406,
318, 467, 407, 427, 420, 477, 392, 430, 339, 410, 326)
Suponemos que los datos de ambas muestras son independientes, ya que son pollos diferentes los que reciben los tipos de maíz. También suponemos que los datos proceden de dos distribuciones normales.
# Diagramas de cajas
boxplot(maiz.normal, maiz.transgenico, names = c("Normal", "Transgenico"))
# Medias
mean(maiz.normal)
## [1] 366.3
mean(maiz.transgenico)
## [1] 402.9
# (Cuasi)desviaciones típicas
sd(maiz.normal)
## [1] 50.81
sd(maiz.transgenico)
## [1] 42.73
Vemos que en las muestras analizadas, la ganancia media de peso de los pollos alimentados con maíz transgénico es superior a la de los alimentados con maíz normal pero, ¿es la diferencia entre las dos ganancias medias significativa? Las varianzas muestrales no parecen ser muy distintas. ¿Es aceptable suponer que las varianzas poblacionales son iguales?
Comenzamos por la segunda cuestión. Para contestarla contrastamos \( H_0:\sigma_1^2 = \sigma_2^2 \) a nivel \( \alpha=0.05 \). Se usa el comando var.test que tiene como argumentos los dos vectores que contienen las dos muestras.
var.test(maiz.normal, maiz.transgenico)
##
## F test to compare two variances
##
## data: maiz.normal and maiz.transgenico
## F = 1.414, num df = 19, denom df = 19, p-value = 0.4575
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.5596 3.5718
## sample estimates:
## ratio of variances
## 1.414
La razón entre las dos varianzas es \( F=1.414 \). Para saber si este valor está o no lejos del valor esperado bajo \( H_0 \), lo comparamos con la distribución \( F_{19,19} \). Resulta un p-valor \( 0.4575>0.05 \), por lo que no se rechaza \( H_0 \), es decir, la hipótesis de igualdad de varianzas es aceptable.
Para contrastar \( H_0:\mu_1=\mu_2 \), usamos de nuevo el comando t.test. Ahora los dos primeros argumentos son los vectores con las dos muestras. Por defecto, no se supone que las varianzas poblacionales son iguales, por lo que añadimos el argumento var.equal=TRUE para suponer que sí lo son.
t.test(maiz.normal, maiz.transgenico, var.equal = TRUE)
##
## Two Sample t-test
##
## data: maiz.normal and maiz.transgenico
## t = -2.469, df = 38, p-value = 0.01816
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -66.7 -6.6
## sample estimates:
## mean of x mean of y
## 366.3 402.9
Repite el contraste de igualdad de medias pero sin suponer que las varianzas son iguales. ¿Cambian mucho las conclusiones? (elimina var.equal=TRUE en el comando anterior).
Con los datos anteriores, ¿podemos afirmar a nivel 0.01 que los pollos alimentados con maíz transgénico tienden a engordar por término medio más que los alimentados con maíz normal? (Utiliza el argumento alternative tal y como se ha explicado anteriormente para cambiar la hipótesis alternativa).
Ejemplo: La existencia de trazas de metales en el agua afecta a su sabor y, si las concentraciones son altas, puede afectar a la salud. En un estudio se seleccionaron seis localizaciones en un río y, para cada localización, se determinó la concentración de zinc en el agua de la superficie y en el agua del fondo (en mg/l). Los resultados fueron los siguientes:
fondo <- c(0.43, 0.27, 0.57, 0.53, 0.71, 0.72)
superficie <- c(0.41, 0.24, 0.39, 0.41, 0.6, 0.61)
Asumiendo normalidad, ¿existe evidencia empírica para afirmar, con un nivel de significación \( \alpha=0,05 \), que la concentración media de zinc en el fondo es diferente a la concentración media en la superficie?
recta <- lm(fondo ~ superficie)
recta
##
## Call:
## lm(formula = fondo ~ superficie)
##
## Coefficients:
## (Intercept) superficie
## 0.0267 1.1540
plot(superficie, fondo)
abline(recta)
cor(fondo, superficie)
## [1] 0.9448
Claramente existe relación entre las medidas del fondo y de la superficie (la correlación es 0.94) por lo que no podemos suponer que las muestras sean independientes para comparar las medias. Son datos emparejados.
El comando sigue siendo t.test pero para indicar que los datos son emparejados añadimos el argumento paired = TRUE.
t.test(fondo, superficie, paired = TRUE)
##
## Paired t-test
##
## data: fondo and superficie
## t = 3.862, df = 5, p-value = 0.01185
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.03177 0.15823
## sample estimates:
## mean of the differences
## 0.095
Dado que se trabaja con las 6 diferencias entre medidas de la superficie y del fondo, el estadístico t solo tiene 5 grados de libertad. Su valor es 3.862 y el correspondiente p-valor es 0.01185. Como el p-valor es menor que \( \alpha=0.05 \), se rechaza la hipótesis nula, es decir, podemos afirmar que la concentración media en la superficie es distinta a la del fondo.
Ejemplo: En un estudio, 1000 personas siguieron una dieta de adelgazamiento durante 3 meses. De las 1000 personas, 800 perdieron más de 3 kg de peso. ¿Permiten los datos afrmar, con el nivel de significación \( \alpha=0.01 \), que más del 75% de la población perderá más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo?
Se trata de un contraste sobre la proporción poblacional \( p \) de individuos que cumple cierta condición (perder más de 3 kg de peso tras la dieta). Queremos contrastar \( H_0: p\leq p_0 \), frente a \( H_1: p > p_0 \), donde \( p_0=0.75 \). Para llevar a cabo el contraste, usamos el comando prop.test. En este caso, este comando tiene cinco argumentos:
alternative y p sirven para determinar cuál es la hipótesis alternativa. El argumento p corresponde a \( p_0 \). Le damos por tanto el valor 0.75. Para alternative elegimos la opción greater. Las otras dos posibilidades son two.sided (opción por defecto que corresponde a \( H_1:p \neq p_0 \)), y less, que corresponde a \( H_1:p < p_0 \).correct=FALSE.prop.test(800, 1000, alternative = "greater", p = 0.75, correct = FALSE)
##
## 1-sample proportions test without continuity correction
##
## data: 800 out of 1000, null probability 0.75
## X-squared = 13.33, df = 1, p-value = 0.0001304
## alternative hypothesis: true p is greater than 0.75
## 95 percent confidence interval:
## 0.7784 1.0000
## sample estimates:
## p
## 0.8
El estadístico del contraste que calcula R es \[ X^2 = \left(\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}\right)^2\approx 13.33, \] que sigue una distribución aproximada \( \chi^2 \) con un grado de libertad, si \( H_0 \) es cierta. En el ejemplo, el p-valor es menor que \( \alpha=0.01 \) y, por lo tanto, rechazamos la hipótesis nula. Podemos afirmar al nivel de significación \( \alpha=0.01 \) que más del 75% de la población perderá más de 3 kg de peso.
Repite el análisis, pero aplicando la corrección por continuidad. ¿Cambian mucho los resultados?
Repite el análisis pero en el caso en que la dieta la hubieran seguido 100 personas y 80 hubieran perdido más de 3 kg de peso. ¿Cambia la proporción muestral? ¿Cambian las conclusiones?
Repite el análisis pero en el caso en que la dieta la hubieran seguido 10 personas y 8 hubieran perdido más de 3 kg de peso. Fíjate que aparece un aviso en los resultados. ¿A qué se debe?
Ejemplo: En un estudio se informa de los resultados de un experimento diseñado para comparar dos tratamientos de cierto tipo de cáncer, uno de ellos a base de quimioterapia y el otro basado en una combinación de quimioterapia y radioterapia (New Engl. J. Med., 1997, pags. 956–962). De 154 individuos que recibieron únicamente quimioterapia, 76 sobrevivieron más de 15 años mientras que 98 de los 164 individuos que recibieron la combinación de quimioterapia y radioterapia sobrevivieron más de 15 años. ¿Se puede afirmar con un nivel del 5 % que la probabilidades de sobrevivir más de 15 años es superior para el tratamiento combinado?
Sea \( p_1 \) la probabilidad de sobrevivir más de 15 años tras el tratamiento con quimioterapia, y sea \( p_2 \) la correspondiente probabilidad tras el tratamiento con quimioterapia y radioterapia. Queremos contrastar \( H_0: p_1\geq p_2 \) frente a \( H_1: p_1 < p_2 \). Para hacer el contraste utilizamos también el comando prop.test. La única diferencia respecto al contraste para una única proporción radica en la forma de introducir los datos. El primer argumento es ahora un vector de dos coordenadas correspondientes al número de individuos con la característica de interés (sobrevivir más de 15 años) en cada muestra. El segundo argumento es ahora un vector de dos coordenadas correspondientes a los dos tamaños muestrales.
x <- c(76, 98)
n <- c(154, 164)
prop.test(x, n, alternative = "less", correct = FALSE)
##
## 2-sample test for equality of proportions without continuity
## correction
##
## data: x out of n
## X-squared = 3.471, df = 1, p-value = 0.03123
## alternative hypothesis: less
## 95 percent confidence interval:
## -1.00000 -0.01263
## sample estimates:
## prop 1 prop 2
## 0.4935 0.5976
El estadístico del contraste que calcula R es \[ X^2 = \left(\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\bar{p}(1-\bar{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}\right)^2\approx 3.471, \] donde \( \bar{p} = (n_1 \hat{p}_1 + n_2\hat{p}_2)/n \) y \( n=n_1+n_2 \). Puede demostrarse que \( X^2 \) sigue una distribución aproximada \( \chi^2 \) con un grado de libertad, si \( H_0 \) es cierta. En el ejemplo, el p-valor es menor que \( \alpha=0.05 \) y, por lo tanto, rechazamos la hipótesis nula a este nivel.