Introducción

Esta página describe en qué consisten los contrastes de hipótesis y cómo se aplican al estudio de una población.Comparando los distintos tipos y casos. Está dirigida a lectores sin experiencia previa en estaditica inferencial, aunque se presupone una base matemática. La terminología y el procedimiento siguen el libro de Triola (2009), por lo que se recomienda referirse a este en caso de duda.

¿Qué son y para qué se utilizan los contrastes de hipótesis?

Una prueba de hipótesis, o prueba de significancia, es un procedimiento para poner a prueba una afirmación sobre una propiedad de una población (Triola, 2009).

Se basan en la regla del suceso infrecuente: si, bajo un supuesto dado, la probabilidad de un resultado observado es muy pequeña, se concluye que el supuesto probablemente no es correcto. Su aplicación consiste en analizar los datos muestrales para distinguir entre resultados que pueden producirse con facilidad por azar y resultados cuya aparición por azar es muy improbable. Un resultado muy improbable admite dos explicaciones: que haya ocurrido un suceso infrecuente o que el supuesto de partida no sea cierto (Triola, 2009)..

Conceptos clave

Hipótesis: afirmación sobre una propiedad de una población.

Muestra aleatoria simple (MAS): muestra de tamaño \(n\) seleccionada de modo que todas las muestras posibles de ese tamaño tienen la misma probabilidad de ser elegidas. Si la muestra no es representativa, los resultados del contraste no son válidos.

Parámetro: valor que describe una población (proporción \(p\), media \(\mu\), desviación estándar \(\sigma\)).

Estadístico: valor calculado a partir de la muestra (proporción muestral \(\hat{p}\), media muestral \(\bar{x}\), desviación típica muestral \(s\)). Es la base para estimar el parámetro.

Hipótesis nula y alternativa

  • Nula (\(H_0\)): afirma que el parámetro es igual a un valor concreto. Se prueba de forma directa: se supone verdadera y se decide si se rechaza o no se rechaza.
  • Alternativa (\(H_1\), \(H_a\) o \(H_A\)): afirma que el parámetro difiere del valor de la nula (\(\neq\), \(<\) o \(>\)).

Una prueba de hipótesis no puede usarse para sustentar la afirmación de que un parámetro es igual a un valor: la igualdad se asigna siempre a \(H_0\).

Estadístico de prueba: valor con el que se decide sobre \(H_0\). Se obtiene convirtiendo el estadístico muestral en una puntuación (\(z\), \(t\) o \(\chi^2\)) bajo el supuesto de que \(H_0\) es verdadera. Según el caso:

  • Proporciones: \(\;z = \dfrac{\hat{p} - p_0}{\sqrt{p_0 q_0 / n}}\)
  • Medias: \(\;z = \dfrac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}\;\) (\(\sigma\) conocida) o \(\;t = \dfrac{\bar{x} - \mu_0}{s/\sqrt{n}}\;\) (\(\sigma\) desconocida).
  • Desviaciones estándar o varianzas: \(\;\chi^2 = \dfrac{(n-1)s^2}{\sigma_0^2}\)

Las fórmulas y los requisitos se detallan en la sección “Tipos de contraste según el parámetro”

Región crítica: conjunto de valores del estadístico de prueba que llevan a rechazar \(H_0\).

Nivel de significancia (\(\alpha\)): probabilidad de que el estadístico caiga en la región crítica cuando \(H_0\) es verdadera, es decir, la probabilidad de rechazar \(H_0\) siendo cierta. Valores habituales: \(0.05\), \(0.01\) y \(0.10\), el más común, \(0.05\).

Valor crítico: valor que separa la región crítica del resto. Depende de \(H_0\), de la distribución muestral y de \(\alpha\).

Colas:

  • Dos colas: región crítica en ambos extremos: \(\alpha\) se reparte por igual entre ellos.
  • Cola izquierda: región crítica en el extremo izquierdo.
  • Cola derecha: región crítica en el extremo derecho.

La cola se determina por los valores que entrarían en conflicto con \(H_0\).

Valor P: probabilidad de obtener un estadístico de prueba por lo menos tan extremo como el observado, suponiendo \(H_0\) verdadera. A menor valor P, mayor la evidencia contra \(H_0\), se rechaza si es mas pequeño que un valor (habitualmente \(0.05\) o menos), (Triola, 2009).

Algoritmo general

El procedimiento siguiente, basado en Triola (2009), describe los pasos de un contraste sobre una propiedad de una población.

Paso 1. Identificar la aseveración. Concretar qué afirmación sobre la población se quiere poner a prueba. Debe referirse a un parámetro: una proporción (\(p\)), una media (\(\mu\)) o una desviación estándar (\(\sigma\)).

Paso 2. Expresarla en forma simbólica. Traducirla al lenguaje estadístico.

Paso 3. Establecer las hipótesis. De la aseveración se derivan dos hipótesis complementarias:

  • La alternativa (\(H_1\)) no contiene igualdad y usa \(\neq\), \(<\) o \(>\). Es lo que se quiere detectar.
  • La nula (\(H_0\)) contiene la igualdad (\(=\)). Es lo que se somete a prueba directamente.

El símbolo de \(H_1\) muestra el tipo de contraste a usar:

Símbolo en \(H_1\) Tipo de prueba Región crítica
\(\neq\) Bilateral (dos colas) Ambos extremos
\(<\) Cola izquierda Extremo izquierdo
\(>\) Cola derecha Extremo derecho

Paso 4. Elegir el nivel de significancia (\(\alpha\)). Es el riesgo máximo aceptado rechazar \(H_0\) siendo verdadera:

\(\alpha\) Uso habitual
0.10 Estudios exploratorios
0.05 Estándar en la mayoría de contextos científicos
0.01 Cuando se exige mucho rigor o equivocarse tiene consecuencias graves

Paso 5. Identificar el estadístico de prueba. La elección depende del parámetro y de la información disponible:

¿Qué se contrasta? ¿Se conoce \(\sigma\)? Estadístico Distribución
Proporción (\(p\)) \(z\) Normal
Media (\(\mu\)) \(z\) Normal
Media (\(\mu\)) No \(t\) \(t\) de Student
Varianza (\(\sigma^2\)) \(\chi^2\) Chi-cuadrada

Antes de aplicar el estadístico deben comprobarse los requisitos de cada prueba (normalidad, tamaño muestral, aleatoriedad…).

Paso 6. Calcular el estadístico. Se aplica la fórmula correspondiente:

\[z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0\,q_0}{n}}} \qquad t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} \qquad \chi^2 = \frac{(n-1)\,s^2}{\sigma_0^2}\]

Paso 7. Obtener el valor P o los valores críticos. Existen varias formas de tomar la decisión: el método del valor P, el método tradicional basado en valores críticos y en algunos casos el uso de intervalos de confianza.

Paso 8. Tomar la decisión.

Método Regla de decisión
Valor P Si \(P \leq \alpha\), se rechaza \(H_0\)
Tradicional Si el estadístico cae en la región crítica, se rechaza \(H_0\)
Intervalo Si el valor de \(H_0\) no está en el intervalo, se rechaza \(H_0\)

Paso 9. Redactar la conclusión. En lenguaje claro y referida a la aseveración original. Rechazar \(H_0\) no demuestra que \(H_1\) sea verdadera, solo que los datos no son compatibles con \(H_0\) al nivel elegido. No rechazar \(H_0\) no demuestra que sea verdadera, solo que la evidencia muestral no basta para descartarla.

Los parámetros del contraste

El nivel de significancia \(\alpha\) es la probabilidad de rechazar \(H_0\) siendo verdadera. Reducir \(\alpha\) disminuye ese riesgo, pero aumenta la probabilidad de no detectar una diferencia.

El estadístico de prueba (\(z\), \(t\) o \(\chi^2\)) transforma el resultado muestral a uno identificable en una escala conocida, el valor crítico marca el umbral de rechazo y el valor P mide la probabilidad de obtener un resultado igual o más extremo que el observado.

Un contraste no prueba que una hipótesis sea verdadera o falsa, por lo que la terminología es rechazar o no rechazar \(H_0\), no “aceptarla”. Para decidir se dispone de tres métodos que en general son equivalentes (el intervalo de confianza no lo es del todo en proporciones ni en contrastes de una cola):

  • Tradicional: se rechaza \(H_0\) si el estadístico cae en la región crítica.
  • Valor P: se rechaza \(H_0\) si \(P \leq \alpha\).
  • Intervalo de confianza: se rechaza la afirmación de que el parámetro toma un valor situado fuera del intervalo.

Tipos de contraste según el parámetro (Triola, 2009).

La prueba se elige según el parámetro que se estudia y la información disponible. Cada caso emplea un estadístico y una distribución de referencia distintos.

Una aseveración sobre una proporción

Objetivo: probar una hipótesis sobre una proporción poblacional.

Se aplica cuando la variable tiene dos resultados posibles: apto/no apto, defectuoso/correcto, éxito/fracaso. Se estudia si la proporción poblacional \(p\) coincide con un valor propuesto. La proporción muestral es:

\[\hat{p} = \frac{x}{n}\]

donde \(x\) es el número de casos favorables y \(n\) el tamaño muestral.

Requisitos:

  1. Las observaciones proceden de una MAS.
  2. Se cumplen las condiciones de una distribución binomial.
  3. El tamaño muestral permite aproximar la binomial con una normal: \(np_0 \geq 5\) y \(n(1-p_0) \geq 5\).

Notación: \(n\) (tamaño), \(x\) (casos favorables), \(\hat{p}\) (proporción muestral), \(p_0\) (proporción propuesta en \(H_0\)), \(q_0 = 1 - p_0\).

Estadístico:

\[z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\]

Sigue aproximadamente una normal estándar si se cumplen los requisitos. La alternativa puede ser bilateral, de cola izquierda o de cola derecha: \(H_1: p \neq p_0\), \(\;H_1: p < p_0\) o \(\;H_1: p > p_0\).

Una aseveración sobre una media: \(\sigma\) conocida

Objetivo: probar una hipótesis sobre una media poblacional \(\mu\) cuando se conoce la desviación estándar poblacional \(\sigma\).

Es poco frecuente en la práctica, porque \(\sigma\) rara vez se conoce. Aparece en problemas teóricos o cuando \(\sigma\) se ha establecido antes con precisión.

Requisitos:

  1. Muestra aleatoria simple.
  2. Se conoce \(\sigma\).
  3. La población es normal o el tamaño muestral es grande (normalmente \(n \geq 30\)).

Notación: \(n\), \(\bar{x}\) (media muestral), \(\mu_0\) (media propuesta en \(H_0\)), \(\sigma\) (conocida).

Estadístico:

\[z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}\]

Se compara con la normal estándar. La nula es \(H_0: \mu = \mu_0\), la alternativa, \(H_1: \mu \neq \mu_0\), \(\;H_1: \mu < \mu_0\) o \(\;H_1: \mu > \mu_0\).

Una aseveración sobre una media: \(\sigma\) desconocida

Objetivo: probar una hipótesis sobre una media poblacional \(\mu\) cuando se desconoce \(\sigma\).

Es el caso habitual: se dispone de datos muestrales pero no de la variabilidad exacta de la población. Se estima \(\sigma\) con la desviación típica muestral \(s\) y la distribución de referencia pasa a ser la \(t\) de Student.

Requisitos:

  1. Muestra aleatoria simple.
  2. Se desconoce \(\sigma\).
  3. La población es aproximadamente normal o \(n \geq 30\).

Notación: \(n\), \(\bar{x}\), \(\mu_0\), \(s\) (desviación típica muestral), \(gl = n - 1\) (grados de libertad).

Estadístico:

\[t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} \qquad gl = n - 1\]

La nula es \(H_0: \mu = \mu_0\), la alternativa, \(H_1: \mu \neq \mu_0\), \(\;H_1: \mu < \mu_0\) o \(\;H_1: \mu > \mu_0\).

Propiedades de la \(t\) de Student: tiene forma de campana, similar a la normal estándar, es más ancha que esta, porque incorpora la incertidumbre de estimar \(\sigma\) con \(s\), depende de los grados de libertad, y se aproxima a la normal estándar conforme aumenta \(n\). Es el contraste aplicable cuando se compara la media de varias mediciones con un valor de referencia sin conocer \(\sigma\).

Una aseveración sobre una desviación estándar o una varianza

Objetivo: probar una hipótesis sobre la desviación estándar \(\sigma\) o la varianza \(\sigma^2\) de la población.

Se aplica cuando interesa la dispersión y no el valor medio: si los datos son más o menos variables de lo esperado. Sirve para estudiar la estabilidad de un proceso, la precisión de un instrumento o la regularidad en la fabricación de un material.

Requisitos:

  1. Muestra aleatoria simple.
  2. La población es aproximadamente normal. Este requisito es estricto: si la población se aleja de la normalidad, el contraste \(\chi^2\) para la varianza deja de ser fiable.

Notación: \(n\), \(s^2\) (varianza muestral), \(s\), \(\sigma_0^2\) (varianza propuesta en \(H_0\)), \(\sigma_0\), \(gl = n - 1\).

Estadístico:

\[\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \qquad gl = n - 1\]

La nula puede formularse sobre la varianza (\(H_0: \sigma^2 = \sigma_0^2\)) o sobre la desviación estándar (\(H_0: \sigma = \sigma_0\)). La alternativa, \(H_1: \sigma^2 \neq \sigma_0^2\), \(\;H_1: \sigma^2 < \sigma_0^2\) o \(\;H_1: \sigma^2 > \sigma_0^2\).

Propiedades de la chi-cuadrada: sus valores son no negativos, no es simétrica, su forma depende de los grados de libertad y se vuelve menos asimétrica conforme estos aumentan.

Escenario 1: fiabilidad de un detector de CO₂

Planteamiento del problema

Se estudia si un modelo de detector de CO₂ mide correctamente una concentración conocida. El detector se coloca en una cámara que permite controlar las demás variables y mantenerla en un valor de referencia, por ejemplo 1000 ppm. Se toman varias lecturas y se comprueba si su media es compatible con el valor real.

Información que se recogería

Se tomarían mediciones repetidas del detector en las mismas condiciones, a distintos intervalos y momentos. La base de datos podría contener:

Variable Tipo Descripción de la variable
medicion Nominal Número de medición realizada
co2_real Numérica continua Concentración real de CO₂
co2_medido Numérica continua Lectura proporcionada por el detector
error_medicion Numérica continua Diferencia entre lo medido y lo real

El error se define como \(\text{error} = CO_{2,\text{medido}} - CO_{2,\text{real}}\). ## Parámetro de interés

\[\mu = \text{lectura media del detector con una concentración real de 1000 ppm}\]

Hipótesis del contraste

\[H_0: \mu = 1000 \qquad H_1: \mu \neq 1000\]

Es un contraste bilateral, debido a que interesa detectar desviaciones tanto por encima como por debajo del valor real.

Estadísticos posibles

Estadístico Utilidad Ventaja Inconveniente
Media muestral \(\bar{x}\) Resume la lectura típica del detector Permite la comparación directa con 1000 ppm Sensible a lecturas anómalas
Desviación típica muestral \(s\) Mide la dispersión de las lecturas Distingue un sesgo de la falta de precisión No indica por sí sola si hay sesgo
Error estándar \(s/\sqrt{n}\) Cuantifica la incertidumbre de la media Base del estadístico \(t\) y del intervalo de confianza Depende del tamaño muestral
Estadístico \(t\) Contrasta la media con \(\sigma\) desconocida Aplicable cuando \(\sigma\) es desconocida Requiere normalidad aproximada o \(n\) suficiente
Intervalo de confianza para \(\mu\) Da un rango plausible para la media Interpretación directa Depende del nivel de confianza

Métodos de contraste posibles

El método adecuado es un contraste sobre una media poblacional con \(\sigma\) desconocida, mediante \(t\) de Student:

\[t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}\]

con \(\bar{x}\) la media de las lecturas, \(\mu_0 = 1000\) ppm, \(s\) la desviación típica muestral, \(n\) el número de mediciones y \(n-1\) los grados de libertad.

Método Parámetros necesarios Aplicabilidad
\(t\) de Student | \(\bar{x}\), \(s\), \(n\) y el valor de referencia | \(\sigma\) desconocida, que es el caso habitual |
Método del valor P | Estadístico \(t\) y grados de libertad | Cuantifica la evidencia contra \(H_0\) |
Intervalo de confianza | \(\bar{x}\), error estándar y nivel de confianza | Interpretación directa |
Contraste \(z\) | \(\bar{x}\), \(\sigma\) poblacional y \(n\) | Solo si \(\sigma\) poblacional es conocida |

Con el método del valor P se rechaza \(H_0\) si \(P \leq \alpha\) (por ejemplo, \(\alpha = 0.05\)). Con el intervalo de confianza, se rechaza que el detector mida correctamente si las 1000 ppm quedan fuera del intervalo.

Conclusiones esperadas

Si no se rechaza \(H_0\), las lecturas son compatibles con el valor real, esto no demuestra que el detector sea exacto, sino que no hay evidencia suficiente de un error. Si se rechaza \(H_0\), hay evidencia de que el detector mide de forma significativamente distinta al valor real, lo que desaconsejaría su comercialización hasta identificar la causa.

Escenario 2: capacidad aislante de un material

Planteamiento del problema

Se analiza si un material propuesto como aislante térmico cumple un criterio mínimo de calidad. Siponiendo que la eficacia de un aislante se mide por su conductividad térmica llamada \(\lambda\): cuanto menor es \(\lambda\), mejor aísla.

Una muestra se considera apta si su conductividad medida no supera un máximo, \(\lambda \leq \lambda_{\max}\). Se contrasta la proporción de piezas aptas no la media, esto evita que una pieza defectuosa pueda sesgar la media.

Se decide que el material es adecuado si al menos el 90 % de las muestras son aptas.

Información que se recogería

Se tomaría una muestra de probetas y se sometería a cada una a una prueba térmica controlando otras variables. Midiendo \(\lambda\) y comparándola con \(\lambda_{\max}\). La base de datos podría contener:

Variable Tipo Descripción de la variable.
muestra Nominal Identificador de la probeta
conductividad_termica Numérica continua Valor medido de la conductividad térmica
lambda_max Numérica continua Valor máximo admisible
resultado Categórica binaria Clasificación de la probeta como apta o no apta

La variable para el contraste es resultado. A partir de ella se calcula la proporción de aptas, \(\hat{p} = x/n\), con \(x\) el número de probetas aptas y \(n\) el total.

Parámetro de interés

\[p = \text{proporción de muestras del material que son aptas}\]

con valor de referencia \(p_0 = 0.90\).

Hipótesis del contraste

El problema aparece si la proporción real de aptas es inferior al mínimo, por lo que se utiliza un contraste de cola izquierda:

\[H_0: p = 0.90 \qquad H_1: p < 0.90\]

La nula representa la situación de referencia (el material es efectivo) y la alternativa, la situación a evitar. Para el cálculo se usa la igualdad \(p_0 = 0.90\).

Con este planteamiento, no rechazar \(H_0\) equivale a considerar el material adecuado para su venta de modo que lo importante es demostrar que no lo es. Si se quisiera exigir que el material demostrara su calidad, habría que intercambiar las hipótesis.

Estadísticos posibles

Estadístico Utilidad Ventaja Inconveniente
Proporción muestral \(\hat{p}\) Indica la fracción de muestra que cumple Directa y ligada al problema No indica si la diferencia con el 90 % es significativa
Número de aptas \(x\) Cuenta las probetas que cumplen Dato base para \(\hat{p}\) Depende de \(n\)
Estadístico \(z\) para proporciones Contrasta la hipótesis sobre \(p\) Válido bajo la aproximación normal Requiere un tamaño muestral suficiente
Valor P Mide la compatibilidad de los datos con \(H_0\) Permite decidir con el nivel \(\alpha\) No es la probabilidad de que \(H_0\) sea cierta
Intervalo de confianza para \(p\) Da un rango plausible para \(p\) Interpretación directa Depende del nivel de confianza

Métodos de contraste posibles

El método principal es una prueba de hipótesis para una proporción, con una aproximación normal a la binomial:

\[z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\]

Para poder usar esta aproximación deben cumplirse \(np_0 \geq 5\) y \(n(1-p_0) \geq 5\)

Método Parámetros necesarios Aplicabilidad
Contraste \(z\) para una proporción \(\hat{p}\), \(p_0\), \(n\) y \(\alpha\) Si el tamaño muestral permite la aproximación normal
Método del valor P Estadístico \(z\) y tipo de cola Cuantifica la evidencia contra \(H_0\)
Intervalo de confianza para \(p\) \(\hat{p}\), \(n\) y nivel de confianza Comprueba si el mínimo aceptable queda dentro del rango
Prueba binomial exacta Número de aptas, \(n\) y \(p_0\) Tamaño muestral pequeño
Análisis descriptivo de \(\hat{p}\) Número de aptas y \(n\) No permite una decisión inferencial completa

Conclusiones

Si no se rechaza \(H_0\), no hay evidencia suficiente para afirmar que la proporción de aptas baje del 90 %, los datos son compatibles con que el material cumple el criterio. Si se rechaza, hay evidencia de que la proporción real es inferior al mínimo planteado, lo que indicaría que el material podría no ser fiable en las condiciones del ensayo.

Referencias

Triola, M. F. (2009). Estadística. Pearson Educación.

Claude, modelo Opus 4.8. Se ha utilizado para la presentación y la estructura (web, tablas, organización del contenido, etc.).