Una hipótesis estadística es cualquier afirmación o conjetura que determina, total o parcialmente, la distribución de una o varias variables de la población. (Fernandez Pavard, 2024)

En general nunca se sabrá con absoluta certeza si una hipótesis estadística es cierta o falsa, ya que para ello habría que estudiar a todos los individuos de la población.

Para comprobar la veracidad o falsedad de estas hipótesis hay que contrastarlas con los resultados empíricos obtenidos de las muestras. Si los resultados observados en las muestras coinciden, dentro del margen de error admisible debido al azar, con lo que cabría esperar en caso de que la hipótesis fuese cierta, la hipótesis se aceptará como verdadera, mientras que en caso contrario se rechazará como falsa y se buscarán nuevas hipótesis capaces de explicar los datos observados.

Como las muestras se obtienen aleatoriamente, la decisión de aceptar o rechazar una hipótesis estadística se tomará sobre una base de probabilidad. (Fernandez Pavard, 2024)

La metodología que se encarga de contrastar la veracidad de las hipótesis estadísticas se conoce como contraste de hipótesis.

Algoritmo ejemplo para realizar un contraste de hipótesis

1. Plantear las hipótesis

  • Hipótesis nula: (H_0) (lo que se asume inicialmente)
  • Hipótesis alternativa: (H_1) (lo que se quiere comprobar)

Ejemplo:

  • (H_0: = _0)
  • (H_1: _0)

2. Elegir el nivel de significación

  • Se fija () (comúnmente 0.05 o 0.01)
alpha <- 0.05

3. Seleccionar el estadístico de prueba

Depende del caso:

  • Media con varianza conocida → Z
  • Media con varianza desconocida → t de Student
  • Proporciones → Z

4. Calcular el estadístico de contraste

Ejemplo (t de Student):

x_bar <- mean(muestra)
s <- sd(muestra)
n <- length(muestra)
mu_0 <- 50

t_stat <- (x_bar - mu_0) / (s / sqrt(n))
t_stat

5. Determinar la región crítica o p-valor

p_valor <- 2 * pt(-abs(t_stat), df = n - 1)
p_valor

6. Tomar una decisión

if (p_valor < alpha) {
  decision <- "Rechazar H0"
} else {
  decision <- "No rechazar H0"
}

decision

7. Conclusión en contexto

  • Interpretar el resultado en términos del problema real.

Ejemplo: “Con un nivel de significación del 5%, no hay evidencia suficiente para rechazar la hipótesis nula.”

Discusión de los parámetros del contraste de hipótesis

En un contraste de hipótesis intervienen varios parámetros clave:

t =

Indica cuántos errores estándar separan ({x}) de (_0).


Problema 1

Se desea comprobar si el proceso de fabricación de barras de acero mantiene la resistencia media especificada de 500 MPa. Para ello, se toma una muestra de barras producidas recientemente y se mide su resistencia. Debido a la variabilidad natural del proceso, no se espera que todas las barras tengan exactamente el mismo valor, por lo que se plantea un contraste de hipótesis para determinar si la media poblacional sigue siendo 500 MPa o si ha cambiado significativamente.

Es necesario recoger mediciones de la resistencia (en MPa) de una muestra representativa de barras de acero. En concreto, se deben obtener los valores individuales de resistencia para poder calcular la media muestral, la desviación estándar y el tamaño de la muestra. Además, pues, se debe conocer el valor teórico o especificado por el fabricante (en este caso, 500 MPa).

Existen varios métodos posibles según las condiciones del problema:

Método Cuándo usarlo Parámetros necesarios Ventajas Desventajas / Coste
t de Student Varianza desconocida y muestra pequeña/mediana ( {x}, s, n, _0 ) Método más realista y estándar; fácil de aplicar en R Supone normalidad; sensible a outliers
Z (distribucion normal) Varianza poblacional conocida o ( n ) grande ( {x}, , n, _0 ) Cálculo simple; resultados estables Poco realista (normalmente no se conoce ( ))
Test no paramétrico (Wilcoxon) Datos no normales o con outliers Datos ordenados, mediana No requiere normalidad; robusto Menor potencia estadística; interpretación menos directa
Intervalo de confianza Como alternativa al contraste clásico ( {x}, s, n ) Fácil interpretación; útil para informes No da decisión directa explícita (requiere comparación)
Bootstrap Muestras pequeñas o distribución desconocida Datos muestrales completos Muy flexible; pocas suposiciones Alto coste computacional; más complejo de implementar

Análisis

En este problema, el método más adecuado suele ser el t de Student, ya que:

  • La varianza poblacional es desconocida.
  • El tamaño muestral suele ser moderado.
  • Tiene buen equilibrio entre precisión y simplicidad.

Conclusiones esperadas

En el contraste de hipótesis sobre la resistencia del material se pueden obtener dos tipos de conclusiones:


Interpretación

En ambos casos, la conclusión no afirma con certeza absoluta, sino que se basa en la evidencia estadística disponible. El objetivo es tomar decisiones informadas sobre la calidad del proceso productivo.

Problema 2

Se pretende verificar si el tiempo de caída de un objeto desde una altura fija coincide con el valor teórico predicho por la física. Se realizan varias mediciones experimentales del tiempo de caída bajo condiciones similares. Dado que pueden existir pequeñas variaciones debidas a errores de medición o factores como la resistencia del aire, se plantea un contraste de hipótesis para evaluar si el tiempo medio observado difiere significativamente del valor teórico esperado.

Se deben registrar múltiples mediciones del tiempo de caída (en segundos, por convenio) desde una misma altura y bajo condiciones similares. Estos datos permiten calcular la media, la variabilidad y el tamaño muestral. También es necesario conocer el valor teórico del tiempo de caída, determinado a partir de las leyes físicas, para poder compararlo con los resultados experimentales.

Métodos de contraste

Existen varios métodos según las características de los datos:

Método Cuándo usarlo Parámetros necesarios Ventajas Desventajas / Coste
t de Student Varianza desconocida y muestra pequeña/mediana ( {x}, s, n, t_0 ) Método estándar; adecuado para experimentos físicos Supone normalidad; sensible a errores experimentales
Z (distribucion normal) Varianza conocida o ( n ) grande ( {x}, , n, t_0 ) Cálculo sencillo; buena aproximación con muestras grandes Poco realista en experimentos (no se conoce ( ))
Test no paramétrico (Wilcoxon) Datos no normales o con mediciones atípicas Datos ordenados Robusto frente a outliers; no requiere normalidad Menor potencia; no contrasta directamente la media
Intervalo de confianza Alternativa al contraste clásico ( {x}, s, n ) Interpretación intuitiva; útil en informes experimentales No proporciona decisión automática
Bootstrap Distribución desconocida o muestra pequeña Datos experimentales completos Muy flexible; útil en física experimental Alto coste computacional; implementación más compleja

Análisis

En este escenario, al igual que en el anterior, el método más adecuado suele ser el t de Student, ya que:

  • Las mediciones experimentales suelen ser pocas.
  • La varianza es desconocida.
  • Se busca comparar una media con un valor teórico.

Conclusiones esperadas

En el contraste del tiempo de caída se pueden obtener dos resultados:


Interpretación

La conclusión permite evaluar si el modelo físico es válido en condiciones reales, teniendo en cuenta que la decisión se basa en evidencia estadística y no en certeza absoluta.