Actividad Estadistica 3

Una hipótesis estadística es cualquier afirmación o conjetura que determina, total o parcialmente, la distribución de una o varias variables de la población. (Fernandez Pavard, 2024)

En general nunca se sabrá con absoluta certeza si una hipótesis estadística es cierta o falsa, ya que para ello habría que estudiar a todos los individuos de la población.

Para comprobar la veracidad o falsedad de estas hipótesis hay que contrastarlas con los resultados empíricos obtenidos de las muestras. Si los resultados observados en las muestras coinciden, dentro del margen de error admisible debido al azar, con lo que cabría esperar en caso de que la hipótesis fuese cierta, la hipótesis se aceptará como verdadera, mientras que en caso contrario se rechazará como falsa y se buscarán nuevas hipótesis capaces de explicar los datos observados.

Como las muestras se obtienen aleatoriamente, la decisión de aceptar o rechazar una hipótesis estadística se tomará sobre una base de probabilidad. (Fernandez Pavard, 2024)

La metodología que se encarga de contrastar la veracidad de las hipótesis estadísticas se conoce como contraste de hipótesis.

Algoritmo ejemplo para realizar un contraste de hipótesis

1. Plantear las hipótesis

Hipótesis nula: (H_0) (lo que se asume inicialmente)
Hipótesis alternativa: (H_1) (lo que se quiere comprobar)

Ejemplo:

(H_0: = _0)
(H_1: _0)

2. Elegir el nivel de significación

Se fija () (comúnmente 0.05 o 0.01)

alpha <- 0.05

3. Seleccionar el estadístico de prueba

Depende del caso:

Media con varianza conocida → Z
Media con varianza desconocida → t de Student
Proporciones → Z

4. Calcular el estadístico de contraste

Ejemplo (t de Student):

x_bar <- mean(muestra)
s <- sd(muestra)
n <- length(muestra)
mu_0 <- 50

t_stat <- (x_bar - mu_0) / (s / sqrt(n))
t_stat

5. Determinar la región crítica o p-valor

p_valor <- 2 * pt(-abs(t_stat), df = n - 1)
p_valor

6. Tomar una decisión

if (p_valor < alpha) {
  decision <- "Rechazar H0"
} else {
  decision <- "No rechazar H0"
}

decision

7. Conclusión en contexto

Interpretar el resultado en términos del problema real.

Ejemplo: “Con un nivel de significación del 5%, no hay evidencia suficiente para rechazar la hipótesis nula.”

Discusión de los parámetros del contraste de hipótesis

En un contraste de hipótesis intervienen varios parámetros clave:

Media muestral ({x}): estima el valor de la población y se compara con (_0).
Desviación estándar (s): mide la variabilidad de los datos; mayor dispersión implica menor precisión.
Tamaño muestral (n): cuanto mayor es, más fiable es la estimación.
Error estándar (): representa la incertidumbre de la media muestral.
Estadístico de contraste (t):

t =

Indica cuántos errores estándar separan ({x}) de (_0).

p-valor: probabilidad de obtener un resultado tan extremo suponiendo que (H_0) es cierta. Valores pequeños indican evidencia contra (H_0).
Nivel de significación (): umbral de decisión. Si (p < ), se rechaza (H_0).

Problema 1

Se desea comprobar si el proceso de fabricación de barras de acero mantiene la resistencia media especificada de 500 MPa. Para ello, se toma una muestra de barras producidas recientemente y se mide su resistencia. Debido a la variabilidad natural del proceso, no se espera que todas las barras tengan exactamente el mismo valor, por lo que se plantea un contraste de hipótesis para determinar si la media poblacional sigue siendo 500 MPa o si ha cambiado significativamente.

Es necesario recoger mediciones de la resistencia (en MPa) de una muestra representativa de barras de acero. En concreto, se deben obtener los valores individuales de resistencia para poder calcular la media muestral, la desviación estándar y el tamaño de la muestra. Además, pues, se debe conocer el valor teórico o especificado por el fabricante (en este caso, 500 MPa).

Existen varios métodos posibles según las condiciones del problema:

Método	Cuándo usarlo	Parámetros necesarios	Ventajas	Desventajas / Coste
t de Student	Varianza desconocida y muestra pequeña/mediana	( {x}, s, n, _0 )	Método más realista y estándar; fácil de aplicar en R	Supone normalidad; sensible a outliers
Z (distribucion normal)	Varianza poblacional conocida o ( n ) grande	( {x}, , n, _0 )	Cálculo simple; resultados estables	Poco realista (normalmente no se conoce ( ))
Test no paramétrico (Wilcoxon)	Datos no normales o con outliers	Datos ordenados, mediana	No requiere normalidad; robusto	Menor potencia estadística; interpretación menos directa
Intervalo de confianza	Como alternativa al contraste clásico	( {x}, s, n )	Fácil interpretación; útil para informes	No da decisión directa explícita (requiere comparación)
Bootstrap	Muestras pequeñas o distribución desconocida	Datos muestrales completos	Muy flexible; pocas suposiciones	Alto coste computacional; más complejo de implementar

Análisis

En este problema, el método más adecuado suele ser el t de Student, ya que:

La varianza poblacional es desconocida.
El tamaño muestral suele ser moderado.
Tiene buen equilibrio entre precisión y simplicidad.

Conclusiones esperadas

En el contraste de hipótesis sobre la resistencia del material se pueden obtener dos tipos de conclusiones:

No rechazar (H_0): Indica que no hay evidencia suficiente para afirmar que la resistencia media difiere de 500 MPa. En este caso, el proceso de fabricación se considera adecuado y dentro de las especificaciones.
Rechazar (H_0): Indica que existen diferencias significativas entre la resistencia media observada y el valor de 500 MPa. Esto sugiere que el proceso de fabricación puede haber cambiado o presentar problemas, por lo que sería necesario investigar y tomar medidas correctivas.

Interpretación

En ambos casos, la conclusión no afirma con certeza absoluta, sino que se basa en la evidencia estadística disponible. El objetivo es tomar decisiones informadas sobre la calidad del proceso productivo.

Problema 2

Se pretende verificar si el tiempo de caída de un objeto desde una altura fija coincide con el valor teórico predicho por la física. Se realizan varias mediciones experimentales del tiempo de caída bajo condiciones similares. Dado que pueden existir pequeñas variaciones debidas a errores de medición o factores como la resistencia del aire, se plantea un contraste de hipótesis para evaluar si el tiempo medio observado difiere significativamente del valor teórico esperado.

Se deben registrar múltiples mediciones del tiempo de caída (en segundos, por convenio) desde una misma altura y bajo condiciones similares. Estos datos permiten calcular la media, la variabilidad y el tamaño muestral. También es necesario conocer el valor teórico del tiempo de caída, determinado a partir de las leyes físicas, para poder compararlo con los resultados experimentales.

Métodos de contraste

Existen varios métodos según las características de los datos:

Método	Cuándo usarlo	Parámetros necesarios	Ventajas	Desventajas / Coste
t de Student	Varianza desconocida y muestra pequeña/mediana	( {x}, s, n, t_0 )	Método estándar; adecuado para experimentos físicos	Supone normalidad; sensible a errores experimentales
Z (distribucion normal)	Varianza conocida o ( n ) grande	( {x}, , n, t_0 )	Cálculo sencillo; buena aproximación con muestras grandes	Poco realista en experimentos (no se conoce ( ))
Test no paramétrico (Wilcoxon)	Datos no normales o con mediciones atípicas	Datos ordenados	Robusto frente a outliers; no requiere normalidad	Menor potencia; no contrasta directamente la media
Intervalo de confianza	Alternativa al contraste clásico	( {x}, s, n )	Interpretación intuitiva; útil en informes experimentales	No proporciona decisión automática
Bootstrap	Distribución desconocida o muestra pequeña	Datos experimentales completos	Muy flexible; útil en física experimental	Alto coste computacional; implementación más compleja

Análisis

En este escenario, al igual que en el anterior, el método más adecuado suele ser el t de Student, ya que:

Las mediciones experimentales suelen ser pocas.
La varianza es desconocida.
Se busca comparar una media con un valor teórico.

Conclusiones esperadas

En el contraste del tiempo de caída se pueden obtener dos resultados:

No rechazar (H_0): Indica que no hay evidencia suficiente para afirmar que el tiempo medio difiere del valor teórico. Esto sugiere que el modelo físico utilizado describe adecuadamente el fenómeno.
Rechazar (H_0): Indica que existen diferencias significativas entre el tiempo observado y el teórico. Esto puede deberse a errores experimentales (medición, condiciones no ideales) o a que el modelo teórico no considera todos los factores (como la resistencia del aire).

Interpretación

La conclusión permite evaluar si el modelo físico es válido en condiciones reales, teniendo en cuenta que la decisión se basa en evidencia estadística y no en certeza absoluta.

Actividad Estadistica 3

Adrian Pena

2026-05-05

Algoritmo ejemplo para realizar un contraste de hipótesis

1. Plantear las hipótesis

2. Elegir el nivel de significación

3. Seleccionar el estadístico de prueba

4. Calcular el estadístico de contraste

5. Determinar la región crítica o p-valor

6. Tomar una decisión

7. Conclusión en contexto

Discusión de los parámetros del contraste de hipótesis

Problema 1

Análisis

Conclusiones esperadas

Interpretación

Problema 2

Métodos de contraste

Análisis

Conclusiones esperadas

Interpretación