Introducción

Este informe examina el uso del método bootstrap para estimar intervalos de confianza de la media de una población, dada una muestra de eficiencia de combustible de camiones. Dado que no se asume una distribución normal, el método bootstrap permite informarnos sobre la variabilidad de la estadística de interés (media) mediante el remuestreo de los datos.

Los datos disponibles son las siguientes mediciones de eficiencia de combustible (en millas/galón):

7.69, 4.97, 4.56, 6.49, 4.34, 6.24, 4.45

Paso 1: Datos Iniciales

Primero, definimos los datos y calculamos la media muestral.

## [1] 5.534286

Metodo 1:

set.seed(123) # Para reproducibilidad
k <- 1000  # Número de muestras bootstrap
n <- length(datos)  # Tamaño de la muestra original

# Función para generar muestras bootstrap y calcular sus medias
bootstrap_means <- replicate(k, {
  muestra_bootstrap <- sample(datos, n, replace = TRUE)
  mean(muestra_bootstrap)
})

# Calcular el intervalo de confianza
ci_method1 <- quantile(bootstrap_means, probs = c(0.025, 0.975))
ci_method1
##     2.5%    97.5% 
## 4.748393 6.508643

Metodo 2:

# Calcular percentiles:
p_2_5 <- quantile(bootstrap_means, probs = 0.025)
p_97_5 <- quantile(bootstrap_means, probs = 0.975)

# Calcular intervalo de confianza (Método 2)
ci_method2 <- c(2 * media_muestral - p_97_5, 2 * media_muestral - p_2_5)
ci_method2
##    97.5%     2.5% 
## 4.559929 6.320179

Comparación de Resultados

## Intervalo de Confianza (Método 1 - Percentiles P2.5 y P97.5): 4.748393 6.508643
## Intervalo de Confianza (Método 2 - Ajuste a Media): 4.559929 6.320179

Visualización:

Conclusiones

El objetivo de este informe fue estimar un intervalo de confianza del 95% para la media de la eficiencia de combustible de camiones utilizando el método bootstrap, dado que no tenemos información sobre la distribución de los datos. Se utilizaron los siguientes datos de eficiencia de combustible en millas/galón:

[ { 7.69, 4.97, 4.56, 6.49, 4.34, 6.24, 4.45 } ]

A través del método bootstrap, se generaron 1000 muestras para calcular las medias de cada una, lo que permitió la creación de intervalos de confianza usando dos enfoques diferentes:

Método 1: Basado en los percentiles ( P2.5 ) y ( P97.5 ) de las medias bootstrap. Método 2: Utilizando el ajuste de la media muestral respecto a los percentiles de las muestras bootstrap.

Los resultados fueron los siguientes:

El Método 1 proporcionó un intervalo de confianza directo, reflejando la variabilidad presente en las muestras bootstrap.

El Método 2 se basó en una transformación del estimador de la media, lo que puede resultar en un ajuste menos representativo si la distribución de las medias es asimétrica.

Al comparar ambos métodos, se observa que, aunque ambos proporcionan intervalos de confianza, el Método 1 parece más adecuado en situaciones donde la distribución de los datos se desconoce, dado que se basa directamente en la información empírica generada a través de los remuestreos.

Confiar en las estimaciones obtenidas es razonable, ya que el método bootstrap es robusto y aplicable a situaciones en las que no se puede asumir normalidad. Sin embargo, es importante considerar la naturaleza de la población y la posible interacción entre los datos, ya que esto puede influir en la interpretación de los intervalos de confianza calculados.