Origen y Distribución
Chi-cuadrado (χ²) , también llamada Ji-cuadrado, fue propuesta por Carl Pearson como un método para evaluar qué tan bien se ajustan ciertos datos a una distribución de probabilidad conocida, y con el tiempo se ha consolidado como una de las técnicas principales para contrastar hipótesis. Esta prueba estadística se utiliza cuando se comparan dos o más grupos o variables, y resulta especialmente útil cuando se trabaja con datos nominales e independientes. Su función principal es ofrecer una evaluación general sobre si existen diferencias significativas entre las categorías que componen la variable dependiente.La distribución se trata de la suma de los cuadrados de k variables aleatorias independientes que siguen una distribución normal estándar (media = 0, varianza = 1). Si Z1,Z2,…,Zk son variables aleatorias normales estándar, entonces la variable aleatoria: X=∑Zi**2, sigue una distribución chi-cuadrado con k grados de libertad. dónde los grados de libertad determinan la forma.
(Hernández. Y, et al., 2017).
Características
• La distribución χ² (chi-cuadrado) es una distribución de probabilidad continua. • Surge como la suma de los cuadrados de k variables aleatorias independientes que siguen una distribución normal estándar (media 0, varianza 1). • Se caracteriza por tener grados de libertad (k o df), los cuales determinan la forma de la distribución. • Solo toma valores no negativos: X ≥ 0 • Su media es igual a los grados de libertad μ = k= kμ = k. • Su varianza es Var(X) = 2k • Su forma es asimétrica hacia la derecha. A medida que los grados de libertad aumentan, la distribución se aproxima a una distribución normal
(Hayes, 2025).
Función de Densidad de Probabilidad (PDF)
El chi cuadrado nos presenta la siguiente fórmula matemática para representar la función de densidad de probabilidad:
Donde: • T es la función gamma.
• k es el número de grados de libertad.
• X es la variable aleatoria (y x≥0).
(Hayes, 2025).
Función de Distribución Acumulada (CDF)
El chi cuadrado nos presenta la siguiente fórmula matemática para representar la función de distribución acumulada:
(Hayes, 2025).
Representación gráfica
La función de densidad (PDF) muestra cómo se distribuyen los valores del Chi-cuadrado, iniciando en cero, creciendo hasta un pico y luego decayendo lentamente, lo que evidencia su forma asimétrica. La función acumulada (CDF), por su parte, indica la probabilidad acumulada hasta un valor dado y crece de forma continua hasta acercarse a 1. Juntas, ambas gráficas permiten comprender tanto la forma como el comportamiento probabilístico de esta distribución.:
Nombres de las gráficas:
Función de Distribución Acumulada = CDF Función de Densidad de Probabilidad = PDF
Ejemplo A un biólogo le asignan verificar en un laboratorio de genética si un carácter vegetal sigue un patrón de herencia mendeliana, para ello se cruzaron plantas de chícharo y se registró el color de las semillas en la descendencia. Se obtuvieron 150 semillas de color verde (fenotipo dominante) y 50 amarillas (recesivo), lo cual se comparó con la proporción esperada 3:1 según las Leyes de Mendel. Mediante la prueba Chi-cuadrado se evaluó si las diferencias entre los valores observados y esperados son atribuibles al azar o si indican una desviación significativa en la herencia del rasgo.
Objetivo del análisis: Un investigador está estudiando la herencia de un rasgo dominante en plantas de chícharo (verde vs amarillo). Según las leyes de Mendel, al cruzar dos heterocigotos (Aa × Aa), se espera una proporción 3:1 entre fenotipos dominantes y recesivos.
Se plantaron 200 semillas, y los resultados observados fueron:
| Fenotipo | Observado | Esperado |
|---|---|---|
| Verde (Dominante) | 150 | 150 |
| Amarillo (Recesivo) | 50 | 50 |
La prueba Chi-cuadrado se usa para verificar si los datos experimentales coinciden con la proporción esperada genéticamente.
La siguiente gráfica muestra lo esperado vs lo observado:
Interepretación de resultados:
Dado que el valor calculado de Chi-cuadrado es menor al valor crítico, se concluye que no hay evidencia para rechazar la hipótesis de herencia mendeliana, por lo que la proporción 3:1 es consistente con los datos observados.
Finalmente, se muestra gráficamente Función de Distribución Acumulada y
Función de Densidad de Probabilidad.
Aplicaciones
El chi cuadrado se ha utilizado en distintas áreas,debido a que funciona con datos categóricos, como genotipos, hábitos, niveles educativos o presencia/ausencia de rasgos. Por eso se aplica en muchas áreas: en biología para proporciones de fenotipos o resistencia a antibióticos, en ciencias sociales y psicología para asociaciones de conducta, en educación y marketing para comparar grupos, y en industria para controlar calidad. En esencia, responde a la pregunta:
¿Lo que observo ocurre por azar o hay una asociación real?
(Hernández. Y, et al., 2017).
Gráfica de la aplicación en genética mendeliana
Relaciones entre distribuciones Univariables
La distribución chi‑cuadrado (𝜒2) es una distribución continua definida solo para valores positivos y depende de un parámetro llamado grados de libertad (k). Su forma varía según ese parámetro: comienza cerca de cero, alcanza un pico y luego decae. Una propiedad clave es que la suma de variables independientes con distribuciones chi‑cuadrado también sigue una chi‑cuadrado, con grados de libertad que se suman. Esta distribución es fundamental para pruebas estadísticas, como las de bondad de ajuste y varianza.
(Lemis. L y Mcqueston. J, 2008).
Referencias Hayes, A. (2025). Chi-Square (χ2) Statistic: What It Is, Examples, How and When to Use the Test. Investopedia.
Hernández. Y. Hernández. V, Batista. N, Castañeda. E. (2017).Which of these two alternatives is the correct way to say Chi-square in Spanish?Chi cuadrado o Ji cuadrado?
Lemis. L y Mcqueston. J. (2008). Univariate Distribution Relationships.