Introducción

Cuando se extrae una muestra de una población que no es normal y se requiere estimar un intervalo de confianza se pueden utilizar los métodos de estimación bootstrap. Esta metodología supone que se puede reconstruir la población objeto de estudio mediante un muestreo con reemplazo de la muestra que se tiene. El artículo de In-use Emissions from Heavy Duty Dissel Vehicles (J.Yanowitz, 2001) presenta las mediciones de eficiencia de combustible en millas/galón de una muestra de siete camiones. Los datos obtenidos son los siguientes: 7.69, 4.97, 4.56, 6.49, 4.34, 6.24 y 4.45. Se supone que es una muestra aleatoria de camiones y que se desea construir un intervalo de confianza del 95 % para la media de la eficiencia de combustible de esta población. No se tiene información de la distribución de los datos.

Metodos y resultados

Inicialmente crearemos un vector con los datos del artículo, se saca una muestra de la variable datos donde el tamaño del vector será el de la variable datos, a partir de ello se calculará la media, esto se realizará 1000 veces y quedará guardado en el ciclo for. Ahora calcularemos el método 1 y método 2.

set.seed(123)
datos <- c(7.69, 4.97, 4.56, 6.49, 4.34, 6.24, 4.45)

iteraciones <- 1000

bootstrap_medias <- numeric(iteraciones)

for (i in 1:iteraciones) {
  bootstrap_muestra <- sample(datos, size = length(datos), replace = TRUE)
  bootstrap_medias[i] <- mean(bootstrap_muestra)
}

intervalo_metodo1 <- quantile(bootstrap_medias, c(0.025, 0.975))

sample_medias <- mean(datos)
intervalo_metodo2 <- c(2 * sample_medias - intervalo_metodo1[2], 2 * sample_medias - intervalo_metodo1[1])

cat("Intervalo de confianza (Método 1):", intervalo_metodo1, "\n")
## Intervalo de confianza (Método 1): 4.748393 6.508643
cat("Intervalo de confianza (Método 2):", intervalo_metodo2, "\n")
## Intervalo de confianza (Método 2): 4.559929 6.320179

Conclusiones