Esta página describe en qué consisten los contrastes de hipótesis y cómo se aplican al estudio de una población.Comparando los distintos tipos y casos. Está dirigida a lectores sin experiencia previa en estaditica inferencial, aunque se presupone una base matemática. La terminología y el procedimiento siguen el libro de Triola (2009), por lo que se recomienda referirse a este en caso de duda.
Una prueba de hipótesis, o prueba de significancia, es un procedimiento para poner a prueba una afirmación sobre una propiedad de una población (Triola, 2009).
Se basan en la regla del suceso infrecuente: si, bajo un supuesto dado, la probabilidad de un resultado observado es muy pequeña, se concluye que el supuesto probablemente no es correcto. Su aplicación consiste en analizar los datos muestrales para distinguir entre resultados que pueden producirse con facilidad por azar y resultados cuya aparición por azar es muy improbable. Un resultado muy improbable admite dos explicaciones: que haya ocurrido un suceso infrecuente o que el supuesto de partida no sea cierto (Triola, 2009)..
Hipótesis: afirmación sobre una propiedad de una población.
Muestra aleatoria simple (MAS): muestra de tamaño \(n\) seleccionada de modo que todas las muestras posibles de ese tamaño tienen la misma probabilidad de ser elegidas. Si la muestra no es representativa, los resultados del contraste no son válidos.
Parámetro: valor que describe una población (proporción \(p\), media \(\mu\), desviación estándar \(\sigma\)).
Estadístico: valor calculado a partir de la muestra (proporción muestral \(\hat{p}\), media muestral \(\bar{x}\), desviación típica muestral \(s\)). Es la base para estimar el parámetro.
Hipótesis nula y alternativa
Una prueba de hipótesis no puede usarse para sustentar la afirmación de que un parámetro es igual a un valor: la igualdad se asigna siempre a \(H_0\).
Estadístico de prueba: valor con el que se decide sobre \(H_0\). Se obtiene convirtiendo el estadístico muestral en una puntuación (\(z\), \(t\) o \(\chi^2\)) bajo el supuesto de que \(H_0\) es verdadera. Según el caso:
Las fórmulas y los requisitos se detallan en la sección “Tipos de contraste según el parámetro”
Región crítica: conjunto de valores del estadístico de prueba que llevan a rechazar \(H_0\).
Nivel de significancia (\(\alpha\)): probabilidad de que el estadístico caiga en la región crítica cuando \(H_0\) es verdadera, es decir, la probabilidad de rechazar \(H_0\) siendo cierta. Valores habituales: \(0.05\), \(0.01\) y \(0.10\), el más común, \(0.05\).
Valor crítico: valor que separa la región crítica del resto. Depende de \(H_0\), de la distribución muestral y de \(\alpha\).
Colas:
La cola se determina por los valores que entrarían en conflicto con \(H_0\).
Valor P: probabilidad de obtener un estadístico de prueba por lo menos tan extremo como el observado, suponiendo \(H_0\) verdadera. A menor valor P, mayor la evidencia contra \(H_0\), se rechaza si es mas pequeño que un valor (habitualmente \(0.05\) o menos), (Triola, 2009).El procedimiento siguiente, basado en Triola (2009), describe los pasos de un contraste sobre una propiedad de una población.
Paso 1. Identificar la aseveración. Concretar qué afirmación sobre la población se quiere poner a prueba. Debe referirse a un parámetro: una proporción (\(p\)), una media (\(\mu\)) o una desviación estándar (\(\sigma\)).
Paso 2. Expresarla en forma simbólica. Traducirla al lenguaje estadístico.
Paso 3. Establecer las hipótesis. De la aseveración se derivan dos hipótesis complementarias:
El símbolo de \(H_1\) muestra el tipo de contraste a usar:
| Símbolo en \(H_1\) | Tipo de prueba | Región crítica |
|---|---|---|
| \(\neq\) | Bilateral (dos colas) | Ambos extremos |
| \(<\) | Cola izquierda | Extremo izquierdo |
| \(>\) | Cola derecha | Extremo derecho |
Paso 4. Elegir el nivel de significancia (\(\alpha\)). Es el riesgo máximo aceptado rechazar \(H_0\) siendo verdadera:
| \(\alpha\) | Uso habitual |
|---|---|
| 0.10 | Estudios exploratorios |
| 0.05 | Estándar en la mayoría de contextos científicos |
| 0.01 | Cuando se exige mucho rigor o equivocarse tiene consecuencias graves |
Paso 5. Identificar el estadístico de prueba. La elección depende del parámetro y de la información disponible:
| ¿Qué se contrasta? | ¿Se conoce \(\sigma\)? | Estadístico | Distribución |
|---|---|---|---|
| Proporción (\(p\)) | — | \(z\) | Normal |
| Media (\(\mu\)) | Sí | \(z\) | Normal |
| Media (\(\mu\)) | No | \(t\) | \(t\) de Student |
| Varianza (\(\sigma^2\)) | — | \(\chi^2\) | Chi-cuadrada |
Antes de aplicar el estadístico deben comprobarse los requisitos de cada prueba (normalidad, tamaño muestral, aleatoriedad…).
Paso 6. Calcular el estadístico. Se aplica la fórmula correspondiente:
\[z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0\,q_0}{n}}} \qquad t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} \qquad \chi^2 = \frac{(n-1)\,s^2}{\sigma_0^2}\]
Paso 7. Obtener el valor P o los valores críticos. Existen varias formas de tomar la decisión: el método del valor P, el método tradicional basado en valores críticos y en algunos casos el uso de intervalos de confianza.
Paso 8. Tomar la decisión.
| Método | Regla de decisión |
|---|---|
| Valor P | Si \(P \leq \alpha\), se rechaza \(H_0\) |
| Tradicional | Si el estadístico cae en la región crítica, se rechaza \(H_0\) |
| Intervalo | Si el valor de \(H_0\) no está en el intervalo, se rechaza \(H_0\) |
Paso 9. Redactar la conclusión. En lenguaje claro y referida a la aseveración original. Rechazar \(H_0\) no demuestra que \(H_1\) sea verdadera, solo que los datos no son compatibles con \(H_0\) al nivel elegido. No rechazar \(H_0\) no demuestra que sea verdadera, solo que la evidencia muestral no basta para descartarla.
El nivel de significancia \(\alpha\) es la probabilidad de rechazar \(H_0\) siendo verdadera. Reducir \(\alpha\) disminuye ese riesgo, pero aumenta la probabilidad de no detectar una diferencia.
El estadístico de prueba (\(z\), \(t\) o \(\chi^2\)) transforma el resultado muestral a uno identificable en una escala conocida, el valor crítico marca el umbral de rechazo y el valor P mide la probabilidad de obtener un resultado igual o más extremo que el observado.
Un contraste no prueba que una hipótesis sea verdadera o falsa, por lo que la terminología es rechazar o no rechazar \(H_0\), no “aceptarla”. Para decidir se dispone de tres métodos que en general son equivalentes (el intervalo de confianza no lo es del todo en proporciones ni en contrastes de una cola):
La prueba se elige según el parámetro que se estudia y la información disponible. Cada caso emplea un estadístico y una distribución de referencia distintos.
Objetivo: probar una hipótesis sobre una proporción poblacional.
Se aplica cuando la variable tiene dos resultados posibles: apto/no apto, defectuoso/correcto, éxito/fracaso. Se estudia si la proporción poblacional \(p\) coincide con un valor propuesto. La proporción muestral es:
\[\hat{p} = \frac{x}{n}\]
donde \(x\) es el número de casos favorables y \(n\) el tamaño muestral.
Requisitos:
Notación: \(n\) (tamaño), \(x\) (casos favorables), \(\hat{p}\) (proporción muestral), \(p_0\) (proporción propuesta en \(H_0\)), \(q_0 = 1 - p_0\).
Estadístico:
\[z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\]
Sigue aproximadamente una normal estándar si se cumplen los requisitos. La alternativa puede ser bilateral, de cola izquierda o de cola derecha: \(H_1: p \neq p_0\), \(\;H_1: p < p_0\) o \(\;H_1: p > p_0\).
Objetivo: probar una hipótesis sobre una media poblacional \(\mu\) cuando se conoce la desviación estándar poblacional \(\sigma\).
Es poco frecuente en la práctica, porque \(\sigma\) rara vez se conoce. Aparece en problemas teóricos o cuando \(\sigma\) se ha establecido antes con precisión.
Requisitos:
Notación: \(n\), \(\bar{x}\) (media muestral), \(\mu_0\) (media propuesta en \(H_0\)), \(\sigma\) (conocida).
Estadístico:
\[z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}\]
Se compara con la normal estándar. La nula es \(H_0: \mu = \mu_0\), la alternativa, \(H_1: \mu \neq \mu_0\), \(\;H_1: \mu < \mu_0\) o \(\;H_1: \mu > \mu_0\).
Objetivo: probar una hipótesis sobre una media poblacional \(\mu\) cuando se desconoce \(\sigma\).
Es el caso habitual: se dispone de datos muestrales pero no de la variabilidad exacta de la población. Se estima \(\sigma\) con la desviación típica muestral \(s\) y la distribución de referencia pasa a ser la \(t\) de Student.
Requisitos:
Notación: \(n\), \(\bar{x}\), \(\mu_0\), \(s\) (desviación típica muestral), \(gl = n - 1\) (grados de libertad).
Estadístico:
\[t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} \qquad gl = n - 1\]
La nula es \(H_0: \mu = \mu_0\), la alternativa, \(H_1: \mu \neq \mu_0\), \(\;H_1: \mu < \mu_0\) o \(\;H_1: \mu > \mu_0\).
Propiedades de la \(t\) de Student: tiene forma de campana, similar a la normal estándar, es más ancha que esta, porque incorpora la incertidumbre de estimar \(\sigma\) con \(s\), depende de los grados de libertad, y se aproxima a la normal estándar conforme aumenta \(n\). Es el contraste aplicable cuando se compara la media de varias mediciones con un valor de referencia sin conocer \(\sigma\).
Objetivo: probar una hipótesis sobre la desviación estándar \(\sigma\) o la varianza \(\sigma^2\) de la población.
Se aplica cuando interesa la dispersión y no el valor medio: si los datos son más o menos variables de lo esperado. Sirve para estudiar la estabilidad de un proceso, la precisión de un instrumento o la regularidad en la fabricación de un material.
Requisitos:
Notación: \(n\), \(s^2\) (varianza muestral), \(s\), \(\sigma_0^2\) (varianza propuesta en \(H_0\)), \(\sigma_0\), \(gl = n - 1\).
Estadístico:
\[\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \qquad gl = n - 1\]
La nula puede formularse sobre la varianza (\(H_0: \sigma^2 = \sigma_0^2\)) o sobre la desviación estándar (\(H_0: \sigma = \sigma_0\)). La alternativa, \(H_1: \sigma^2 \neq \sigma_0^2\), \(\;H_1: \sigma^2 < \sigma_0^2\) o \(\;H_1: \sigma^2 > \sigma_0^2\).
Propiedades de la chi-cuadrada: sus valores son no negativos, no es simétrica, su forma depende de los grados de libertad y se vuelve menos asimétrica conforme estos aumentan.
Se estudia si un modelo de detector de CO₂ mide correctamente una concentración conocida. El detector se coloca en una cámara que permite controlar las demás variables y mantenerla en un valor de referencia, por ejemplo 1000 ppm. Se toman varias lecturas y se comprueba si su media es compatible con el valor real.
Se tomarían mediciones repetidas del detector en las mismas condiciones, a distintos intervalos y momentos. La base de datos podría contener:
| Variable | Tipo | Descripción de la variable |
|---|---|---|
medicion |
Nominal | Número de medición realizada |
co2_real |
Numérica continua | Concentración real de CO₂ |
co2_medido |
Numérica continua | Lectura proporcionada por el detector |
error_medicion |
Numérica continua | Diferencia entre lo medido y lo real |
El error se define como \(\text{error} = CO_{2,\text{medido}} - CO_{2,\text{real}}\). ## Parámetro de interés
\[\mu = \text{lectura media del detector con una concentración real de 1000 ppm}\]
\[H_0: \mu = 1000 \qquad H_1: \mu \neq 1000\]
Es un contraste bilateral, debido a que interesa detectar desviaciones tanto por encima como por debajo del valor real.
| Estadístico | Utilidad | Ventaja | Inconveniente |
|---|---|---|---|
| Media muestral \(\bar{x}\) | Resume la lectura típica del detector | Permite la comparación directa con 1000 ppm | Sensible a lecturas anómalas |
| Desviación típica muestral \(s\) | Mide la dispersión de las lecturas | Distingue un sesgo de la falta de precisión | No indica por sí sola si hay sesgo |
| Error estándar \(s/\sqrt{n}\) | Cuantifica la incertidumbre de la media | Base del estadístico \(t\) y del intervalo de confianza | Depende del tamaño muestral |
| Estadístico \(t\) | Contrasta la media con \(\sigma\) desconocida | Aplicable cuando \(\sigma\) es desconocida | Requiere normalidad aproximada o \(n\) suficiente |
| Intervalo de confianza para \(\mu\) | Da un rango plausible para la media | Interpretación directa | Depende del nivel de confianza |
El método adecuado es un contraste sobre una media poblacional con \(\sigma\) desconocida, mediante \(t\) de Student:
\[t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}\]
con \(\bar{x}\) la media de las lecturas, \(\mu_0 = 1000\) ppm, \(s\) la desviación típica muestral, \(n\) el número de mediciones y \(n-1\) los grados de libertad.
| Método | Parámetros necesarios Aplicabilidad |
|---|
Con el método del valor P se rechaza \(H_0\) si \(P \leq \alpha\) (por ejemplo, \(\alpha = 0.05\)). Con el intervalo de confianza, se rechaza que el detector mida correctamente si las 1000 ppm quedan fuera del intervalo.
Si no se rechaza \(H_0\), las lecturas son compatibles con el valor real, esto no demuestra que el detector sea exacto, sino que no hay evidencia suficiente de un error. Si se rechaza \(H_0\), hay evidencia de que el detector mide de forma significativamente distinta al valor real, lo que desaconsejaría su comercialización hasta identificar la causa.
Se analiza si un material propuesto como aislante térmico cumple un criterio mínimo de calidad. Siponiendo que la eficacia de un aislante se mide por su conductividad térmica llamada \(\lambda\): cuanto menor es \(\lambda\), mejor aísla.
Una muestra se considera apta si su conductividad medida no supera un máximo, \(\lambda \leq \lambda_{\max}\). Se contrasta la proporción de piezas aptas no la media, esto evita que una pieza defectuosa pueda sesgar la media.
Se decide que el material es adecuado si al menos el 90 % de las muestras son aptas.
Se tomaría una muestra de probetas y se sometería a cada una a una prueba térmica controlando otras variables. Midiendo \(\lambda\) y comparándola con \(\lambda_{\max}\). La base de datos podría contener:
| Variable | Tipo | Descripción de la variable. |
|---|---|---|
muestra |
Nominal | Identificador de la probeta |
conductividad_termica |
Numérica continua | Valor medido de la conductividad térmica |
lambda_max |
Numérica continua | Valor máximo admisible |
resultado |
Categórica binaria | Clasificación de la probeta como apta o no apta |
La variable para el contraste es resultado. A partir de
ella se calcula la proporción de aptas, \(\hat{p} = x/n\), con \(x\) el número de probetas aptas y \(n\) el total.
\[p = \text{proporción de muestras del material que son aptas}\]
con valor de referencia \(p_0 = 0.90\).
El problema aparece si la proporción real de aptas es inferior al mínimo, por lo que se utiliza un contraste de cola izquierda:
\[H_0: p = 0.90 \qquad H_1: p < 0.90\]
La nula representa la situación de referencia (el material es efectivo) y la alternativa, la situación a evitar. Para el cálculo se usa la igualdad \(p_0 = 0.90\).
Con este planteamiento, no rechazar \(H_0\) equivale a considerar el material adecuado para su venta de modo que lo importante es demostrar que no lo es. Si se quisiera exigir que el material demostrara su calidad, habría que intercambiar las hipótesis.
| Estadístico | Utilidad | Ventaja | Inconveniente |
|---|---|---|---|
| Proporción muestral \(\hat{p}\) | Indica la fracción de muestra que cumple | Directa y ligada al problema | No indica si la diferencia con el 90 % es significativa |
| Número de aptas \(x\) | Cuenta las probetas que cumplen | Dato base para \(\hat{p}\) | Depende de \(n\) |
| Estadístico \(z\) para proporciones | Contrasta la hipótesis sobre \(p\) | Válido bajo la aproximación normal | Requiere un tamaño muestral suficiente |
| Valor P | Mide la compatibilidad de los datos con \(H_0\) | Permite decidir con el nivel \(\alpha\) | No es la probabilidad de que \(H_0\) sea cierta |
| Intervalo de confianza para \(p\) | Da un rango plausible para \(p\) | Interpretación directa | Depende del nivel de confianza |
El método principal es una prueba de hipótesis para una proporción, con una aproximación normal a la binomial:
\[z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\]
Para poder usar esta aproximación deben cumplirse \(np_0 \geq 5\) y \(n(1-p_0) \geq 5\)
| Método | Parámetros necesarios | Aplicabilidad |
|---|---|---|
| Contraste \(z\) para una proporción | \(\hat{p}\), \(p_0\), \(n\) y \(\alpha\) | Si el tamaño muestral permite la aproximación normal |
| Método del valor P | Estadístico \(z\) y tipo de cola | Cuantifica la evidencia contra \(H_0\) |
| Intervalo de confianza para \(p\) | \(\hat{p}\), \(n\) y nivel de confianza | Comprueba si el mínimo aceptable queda dentro del rango |
| Prueba binomial exacta | Número de aptas, \(n\) y \(p_0\) | Tamaño muestral pequeño |
| Análisis descriptivo de \(\hat{p}\) | Número de aptas y \(n\) | No permite una decisión inferencial completa |
Si no se rechaza \(H_0\), no hay evidencia suficiente para afirmar que la proporción de aptas baje del 90 %, los datos son compatibles con que el material cumple el criterio. Si se rechaza, hay evidencia de que la proporción real es inferior al mínimo planteado, lo que indicaría que el material podría no ser fiable en las condiciones del ensayo.
Triola, M. F. (2009). Estadística. Pearson Educación.
Claude, modelo Opus 4.8. Se ha utilizado para la presentación y la estructura (web, tablas, organización del contenido, etc.).