Una hipótesis estadística es cualquier afirmación o conjetura que determina, total o parcialmente, la distribución de una o varias variables de la población. (Fernandez Pavard, 2024)
En general nunca se sabrá con absoluta certeza si una hipótesis estadística es cierta o falsa, ya que para ello habría que estudiar a todos los individuos de la población.
Para comprobar la veracidad o falsedad de estas hipótesis hay que contrastarlas con los resultados empíricos obtenidos de las muestras. Si los resultados observados en las muestras coinciden, dentro del margen de error admisible debido al azar, con lo que cabría esperar en caso de que la hipótesis fuese cierta, la hipótesis se aceptará como verdadera, mientras que en caso contrario se rechazará como falsa y se buscarán nuevas hipótesis capaces de explicar los datos observados.
Como las muestras se obtienen aleatoriamente, la decisión de aceptar o rechazar una hipótesis estadística se tomará sobre una base de probabilidad. (Fernandez Pavard, 2024)
La metodología que se encarga de contrastar la veracidad de las hipótesis estadísticas se conoce como contraste de hipótesis.
Ejemplo:
alpha <- 0.05
Depende del caso:
Ejemplo (t de Student):
x_bar <- mean(muestra)
s <- sd(muestra)
n <- length(muestra)
mu_0 <- 50
t_stat <- (x_bar - mu_0) / (s / sqrt(n))
t_stat
p_valor <- 2 * pt(-abs(t_stat), df = n - 1)
p_valor
if (p_valor < alpha) {
decision <- "Rechazar H0"
} else {
decision <- "No rechazar H0"
}
decision
Ejemplo: “Con un nivel de significación del 5%, no hay evidencia suficiente para rechazar la hipótesis nula.”
En un contraste de hipótesis intervienen varios parámetros clave:
Media muestral ({x}): estima el valor de la población y se compara con (_0).
Desviación estándar (s): mide la variabilidad de los datos; mayor dispersión implica menor precisión.
Tamaño muestral (n): cuanto mayor es, más fiable es la estimación.
Error estándar (): representa la incertidumbre de la media muestral.
Estadístico de contraste (t):
t =
Indica cuántos errores estándar separan ({x}) de (_0).
p-valor: probabilidad de obtener un resultado tan extremo suponiendo que (H_0) es cierta. Valores pequeños indican evidencia contra (H_0).
Nivel de significación (): umbral de decisión. Si (p < ), se rechaza (H_0).
Se desea comprobar si el proceso de fabricación de barras de acero mantiene la resistencia media especificada de 500 MPa. Para ello, se toma una muestra de barras producidas recientemente y se mide su resistencia. Debido a la variabilidad natural del proceso, no se espera que todas las barras tengan exactamente el mismo valor, por lo que se plantea un contraste de hipótesis para determinar si la media poblacional sigue siendo 500 MPa o si ha cambiado significativamente.
Es necesario recoger mediciones de la resistencia (en MPa) de una muestra representativa de barras de acero. En concreto, se deben obtener los valores individuales de resistencia para poder calcular la media muestral, la desviación estándar y el tamaño de la muestra. Además, pues, se debe conocer el valor teórico o especificado por el fabricante (en este caso, 500 MPa).
Existen varios métodos posibles según las condiciones del problema:
| Método | Cuándo usarlo | Parámetros necesarios | Ventajas | Desventajas / Coste |
|---|---|---|---|---|
| t de Student | Varianza desconocida y muestra pequeña/mediana | ( {x}, s, n, _0 ) | Método más realista y estándar; fácil de aplicar en R | Supone normalidad; sensible a outliers |
| Z (distribucion normal) | Varianza poblacional conocida o ( n ) grande | ( {x}, , n, _0 ) | Cálculo simple; resultados estables | Poco realista (normalmente no se conoce ( )) |
| Test no paramétrico (Wilcoxon) | Datos no normales o con outliers | Datos ordenados, mediana | No requiere normalidad; robusto | Menor potencia estadística; interpretación menos directa |
| Intervalo de confianza | Como alternativa al contraste clásico | ( {x}, s, n ) | Fácil interpretación; útil para informes | No da decisión directa explícita (requiere comparación) |
| Bootstrap | Muestras pequeñas o distribución desconocida | Datos muestrales completos | Muy flexible; pocas suposiciones | Alto coste computacional; más complejo de implementar |
En este problema, el método más adecuado suele ser el t de Student, ya que:
En el contraste de hipótesis sobre la resistencia del material se pueden obtener dos tipos de conclusiones:
No rechazar (H_0): Indica que no hay evidencia suficiente para afirmar que la resistencia media difiere de 500 MPa. En este caso, el proceso de fabricación se considera adecuado y dentro de las especificaciones.
Rechazar (H_0): Indica que existen diferencias significativas entre la resistencia media observada y el valor de 500 MPa. Esto sugiere que el proceso de fabricación puede haber cambiado o presentar problemas, por lo que sería necesario investigar y tomar medidas correctivas.
En ambos casos, la conclusión no afirma con certeza absoluta, sino que se basa en la evidencia estadística disponible. El objetivo es tomar decisiones informadas sobre la calidad del proceso productivo.
Se pretende verificar si el tiempo de caída de un objeto desde una altura fija coincide con el valor teórico predicho por la física. Se realizan varias mediciones experimentales del tiempo de caída bajo condiciones similares. Dado que pueden existir pequeñas variaciones debidas a errores de medición o factores como la resistencia del aire, se plantea un contraste de hipótesis para evaluar si el tiempo medio observado difiere significativamente del valor teórico esperado.
Se deben registrar múltiples mediciones del tiempo de caída (en segundos, por convenio) desde una misma altura y bajo condiciones similares. Estos datos permiten calcular la media, la variabilidad y el tamaño muestral. También es necesario conocer el valor teórico del tiempo de caída, determinado a partir de las leyes físicas, para poder compararlo con los resultados experimentales.
Existen varios métodos según las características de los datos:
| Método | Cuándo usarlo | Parámetros necesarios | Ventajas | Desventajas / Coste |
|---|---|---|---|---|
| t de Student | Varianza desconocida y muestra pequeña/mediana | ( {x}, s, n, t_0 ) | Método estándar; adecuado para experimentos físicos | Supone normalidad; sensible a errores experimentales |
| Z (distribucion normal) | Varianza conocida o ( n ) grande | ( {x}, , n, t_0 ) | Cálculo sencillo; buena aproximación con muestras grandes | Poco realista en experimentos (no se conoce ( )) |
| Test no paramétrico (Wilcoxon) | Datos no normales o con mediciones atípicas | Datos ordenados | Robusto frente a outliers; no requiere normalidad | Menor potencia; no contrasta directamente la media |
| Intervalo de confianza | Alternativa al contraste clásico | ( {x}, s, n ) | Interpretación intuitiva; útil en informes experimentales | No proporciona decisión automática |
| Bootstrap | Distribución desconocida o muestra pequeña | Datos experimentales completos | Muy flexible; útil en física experimental | Alto coste computacional; implementación más compleja |
En este escenario, al igual que en el anterior, el método más adecuado suele ser el t de Student, ya que:
En el contraste del tiempo de caída se pueden obtener dos resultados:
No rechazar (H_0): Indica que no hay evidencia suficiente para afirmar que el tiempo medio difiere del valor teórico. Esto sugiere que el modelo físico utilizado describe adecuadamente el fenómeno.
Rechazar (H_0): Indica que existen diferencias significativas entre el tiempo observado y el teórico. Esto puede deberse a errores experimentales (medición, condiciones no ideales) o a que el modelo teórico no considera todos los factores (como la resistencia del aire).
La conclusión permite evaluar si el modelo físico es válido en condiciones reales, teniendo en cuenta que la decisión se basa en evidencia estadística y no en certeza absoluta.