En las prácticas anteriores, nos hemos enfocado en comparar medias de variables numéricas. Ahora, nos adentramos en el análisis de datos categóricos. Una de las preguntas más importantes en la experimentación es: “¿Funciona mi tratamiento?”. Dicho de otra manera, ¿la proporción de “éxito” en mi grupo de tratamiento es diferente a la proporción de “éxito” en mi grupo de control (placebo)?
La Prueba de Homogeneidad de Proporciones (χ²) es la herramienta estadística diseñada para responder exactamente a esa pregunta. Nos permite comparar la distribución de frecuencias (proporciones) de una variable categórica a través de dos o más grupos o poblaciones independientes.
Al finalizar esta práctica, serás capaz de:
Entender la lógica fundamental de la prueba Chi-cuadrada: comparar frecuencias observadas vs. esperadas. Formular correctamente la hipótesis nula y alternativa para una prueba de homogeneidad. Construir una tabla de contingencia a partir de los datos de diferentes grupos. Realizar e interpretar una prueba de homogeneidad de proporciones en R. Tomar una decisión estadística sobre si las proporciones entre los grupos son iguales o diferentes.
El principio de la prueba Chi-cuadrada es comparar las frecuencias observadas (los conteos que realmente obtuvimos) con las frecuencias esperadas (los conteos que esperaríamos tener si la proporción fuera la misma en todos los grupos).
Hipótesis Nula (H₀): La proporción de cada categoría es la misma en todos los grupos. (Ej: “La proporción de recuperación es idéntica en el grupo de tratamiento y en el grupo placebo”). No hay diferencia.
Hipótesis Alternativa (H₁): La proporción de al menos una categoría es diferente en al menos un grupo. (Ej: “La proporción de recuperación es diferente entre los dos grupos”). Sí hay una diferencia.
El estadístico Chi-cuadrado (χ²) mide qué tan lejos están nuestros datos observados de lo que esperaríamos bajo la H₀.
Si el valor de χ² es grande, significa que nuestras observaciones se desvían mucho de lo esperado, lo que nos lleva a un p-valor pequeño (< 0.05). En este caso, rechazamos H₀ y concluimos que las proporciones son diferentes. Si el valor de χ² es pequeño, nuestras observaciones son consistentes con la H₀, lo que nos lleva a un p-valor grande (≥ 0.05). En este caso, no rechazamos H₀.
Pregunta de investigación: Se prueba un nuevo fármaco para una enfermedad. Se forman dos grupos de animales enfermos: uno recibe el fármaco y el otro un placebo. ¿Es la proporción de animales que se recuperan estadísticamente la misma en ambos grupos?
H₀: La proporción de animales recuperados y no recuperados es la misma para el grupo “Fármaco” y el grupo “Placebo”.
H₁: La proporción de animales recuperados y no recuperados es diferente entre los dos grupos.
#CREAR UNA TABLA DE CONTINGENCIA (MATRIZ DE DATOS)
#Las filas representan nuestras poblaciones o grupos independientes (Fármaco vs Placebo).
#Las columnas representan las categorías de nuestra variable de resultado (Recuperado vs No Recuperado).
datos_farmaco <- matrix(c(70, 30, 50, 50), nrow = 2, byrow = TRUE,
dimnames = list(Grupo = c("Fármaco", "Placebo"),
Resultado = c("Recuperado", "No Recuperado")))
#Es una buena práctica siempre visualizar la tabla que creaste
print("Tabla de Observaciones por Grupo:")
print(datos_farmaco)
Usamos la función chisq.test() directamente sobre nuestra tabla.
resultado_homog <- chisq.test(datos_farmaco)
print(resultado_homog)
Analicemos la salida clave de la consola:
Pearson's Chi-squared test with Yates' continuity correction
data: datos_farmaco
X-squared = 7.5, df = 1, p-value = 0.00617
Interpretación del valor p: Nuestro p-value es 0.00617.
Como 0.00617 es mucho menor que 0.05, tenemos evidencia estadística fuerte para rechazar la hipótesis nula (H₀).
Respuesta a la pregunta de investigación: Rechazar la H₀ significa que la proporción de recuperación no es la misma en ambos grupos.
Conclusión: “La proporción de recuperación es significativamente diferente entre el grupo que recibió el fármaco y el grupo placebo. Por lo tanto, podemos concluir que el fármaco tuvo un efecto estadísticamente significativo en el resultado.”
Pregunta 1: Explica con tus propias palabras qué representa la Hipótesis Nula (H₀) en el contexto de esta práctica sobre el fármaco y el placebo.
Pregunta 2: Si el p-value de la prueba hubiera sido 0.45, ¿cuál habría sido tu conclusión sobre el efecto del fármaco?
Pregunta 3: En la tabla de datos original, calcula manualmente la proporción (porcentaje) de animales recuperados en el grupo “Fármaco” y en el grupo “Placebo”. ¿Cómo se relaciona esta diferencia con la conclusión de la prueba?
Pregunta 4: ¿Qué significa el valor df = 1 en la salida de la prueba?
Pregunta 5: ¿Por qué esta prueba se llama de “homogeneidad”? ¿Qué es lo que se está probando si es “homogéneo” o no?
Héctor Alexander Camarena Ledesma, Jessica González Perea, Ángel Moisés Rentería López, Marco Antonio Alvarado Salas, Argelia Ximena Hernández Recio, Carlos Leonardo Pérez Cuenca, Fabiola Asunción Flores Figueroa, Braulio Herrera Ramírez, Areli Maldonado Fernández, Arenas Escamilla Daniel, Pineda Alatriste Saúl, Rogers Montoya Nathaniel Alec, Noé Orlando Juárez López, Daniel Alonso Domínguez Olvera.