En la práctica anterior, comparamos las proporciones de una categoría entre diferentes grupos. Ahora, vamos a abordar una pregunta diferente: ¿qué tan bien se ajustan las frecuencias de una sola muestra a un modelo teórico o a una distribución de proporciones que esperamos de antemano?
La Prueba de Bondad de Ajuste (χ²) nos permite determinar si las frecuencias que hemos observado en nuestra muestra son consistentes con las frecuencias que una teoría predice. Es una herramienta fundamental para validar modelos, como los modelos genéticos Mendelianos, o para verificar si una muestra se distribuye equitativamente entre varias categorías.
Al finalizar esta práctica, serás capaz de:
Entender el propósito de una prueba de bondad de ajuste. Formular la hipótesis nula y alternativa para comparar datos observados con proporciones teóricas. Proporcionar a R un vector de conteos observados y un vector de probabilidades esperadas. Realizar e interpretar una prueba de bondad de ajuste en R. Concluir si los datos de una muestra se ajustan a un modelo teórico esperado.
Nuevamente, la lógica es comparar lo que observamos con lo que esperamos. Sin embargo, esta vez “lo esperado” no se calcula a partir de los totales de los datos, sino que viene de una teoría externa.
Hipótesis Nula (H₀): No hay diferencia significativa entre las frecuencias observadas en la muestra y las frecuencias esperadas por la teoría. “Los datos se ajustan bien al modelo”.
Hipótesis Alternativa (H₁): Hay una diferencia significativa entre las frecuencias observadas y las esperadas. “Los datos no se ajustan al modelo”.
El estadístico Chi-cuadrado (χ²) medirá la magnitud de esta diferencia. Un valor de χ² grande implica que nuestras observaciones son muy diferentes de lo que la teoría predecía, lo que nos llevará a un p-valor pequeño (< 0.05) y a rechazar la H₀.
Pregunta de investigación: Se realiza un cruce genético entre dos plantas de guisantes que son heterocigotas para el color de la flor (Pp x Pp). Según las leyes de Mendel, se espera una proporción fenotípica de 3 púrpuras por cada 1 blanca. Tras el cruce, se obtiene una descendencia de 100 plantas, de las cuales 80 son púrpuras y 20 son blancas. ¿Se ajustan estos resultados a la proporción Mendeliana esperada de 3:1?
H₀: Las frecuencias observadas (80 púrpuras, 20 blancas) se ajustan a la proporción teórica 3:1.
H₁: Las frecuencias observadas no se ajustan a la proporción teórica 3:1.
#DATOS OBSERVADOS
#Creamos un vector con los conteos que obtuvimos en nuestro experimento.
frecuencias_observadas <- c(purpuras = 80, blancas = 20)
#PROPORCIONES ESPERADAS (según la teoría)
#Creamos un vector con las probabilidades que predice el modelo de Mendel (3 a 1).
#La suma de estas proporciones debe ser 1.
proporciones_esperadas <- c(0.75, 0.25) # 3/(3+1) = 0.75 y 1/(3+1) = 0.25
#Es útil nombrar los vectores para que la salida sea más clara.
names(proporciones_esperadas) <- c("purpuras", "blancas")
print("Observado vs. Esperado:")
print(frecuencias_observadas)
print(proporciones_esperadas * sum(frecuencias_observadas)) # Mostramos conteos esperados
La función chisq.test() toma los conteos observados y, con el argumento ‘p’, las probabilidades esperadas.
resultado_bondad <- chisq.test(frecuencias_observadas, p = proporciones_esperadas)
print(resultado_bondad)
Analicemos la salida clave de la consola:
Chi-squared test for given probabilities
data: frecuencias_observadas
X-squared = 1.3333, df = 1, p-value = 0.2482
Interpretación del valor p: Nuestro p-value es 0.2482.
Como 0.2482 es mayor que 0.05, no tenemos evidencia estadística suficiente para rechazar la hipótesis nula (H₀). Respuesta a la pregunta de investigación:
No rechazar la H₀ significa que la diferencia entre lo que observamos (80 púrpuras, 20 blancas) y lo que la teoría predecía (75 púrpuras, 25 blancas) es lo suficientemente pequeña como para ser atribuida al azar del muestreo.
Conclusión: “Los resultados observados se ajustan bien al modelo genético Mendeliano de una proporción 3:1. No hay evidencia para afirmar que los datos contradicen la teoría”.
Pregunta 1: Explica con tus propias palabras cuál es el propósito de una prueba de bondad de ajuste. ¿Qué es lo que estamos comparando?
Pregunta 2: Si el p-value de la prueba hubiera sido 0.01, ¿cuál habría sido tu conclusión sobre el modelo de Mendel en este experimento?
Pregunta 3: Imagina que quieres probar si un dado de seis caras es justo (es decir, si cada cara tiene la misma probabilidad de salir). Si lanzas el dado 120 veces, ¿cuál sería tu vector de proporciones_esperadas para usar en la prueba chisq.test()?
Pregunta 4: ¿Cuál es la diferencia fundamental en cómo se definen las “frecuencias esperadas” en esta práctica (9B) en comparación con la práctica anterior de homogeneidad (9A)?
Pregunta 5: En la salida de la prueba, ¿qué significa df = 1? ¿Cómo se calcula en una prueba de bondad de ajuste? (Pista: número de categorías - 1).
Héctor Alexander Camarena Ledesma, Jessica González Perea, Ángel Moisés Rentería López, Marco Antonio Alvarado Salas, Argelia Ximena Hernández Recio, Carlos Leonardo Pérez Cuenca, Fabiola Asunción Flores Figueroa, Braulio Herrera Ramírez, Areli Maldonado Fernández, Arenas Escamilla Daniel, Pineda Alatriste Saúl, Rogers Montoya Nathaniel Alec, Noé Orlando Juárez López, Daniel Alonso Domínguez Olvera.