Problema 4

Estimación boostrap

Cuando se extrae una muestra de una población que no es normal y se requiere estimar un intervalo de confianza se pueden utilizar los métodos de estimación bootstrap. Esta metodología supone que se puede reconstruir la población objeto de estudio mediante un muestreo con reemplazo de la muestra que se tiene.

A continuación se construye el intervalo de confianza por los dos métodos y se compara los resultados obtenidos:

# Datos de la muestra de eficiencia de combustible
eficiencia_combustible <- c(7.69, 4.97, 4.56, 6.49, 4.34, 6.24, 4.45)

# Definir función para generar una muestra bootstrap
bootstrap_sample <- function(data) {
  sample(data, replace = TRUE)
}

# Método 1: Obtener intervalo de confianza
bootstrap_means <- replicate(1000, mean(bootstrap_sample(eficiencia_combustible)))
intervalo_metodo_1 <- quantile(bootstrap_means, c(0.025, 0.975))

# Método 2: Obtener intervalo de confianza
intervalo_metodo_2 <- c(2 * mean(eficiencia_combustible) - quantile(bootstrap_means, 0.975),
                        2 * mean(eficiencia_combustible) - quantile(bootstrap_means, 0.025))

# Resultados
print("Intervalo de confianza Método 1:")
## [1] "Intervalo de confianza Método 1:"
print(intervalo_metodo_1)
##     2.5%    97.5% 
## 4.737143 6.534536
print("Intervalo de confianza Método 2:")
## [1] "Intervalo de confianza Método 2:"
print(intervalo_metodo_2)
##    97.5%     2.5% 
## 4.534036 6.331429

Análisis de los resultados obtenidos

  1. Intervalo de confianza Método 1: El intervalo de confianza va desde aproximadamente 4.75 a 6.42 millas/galón. Esto significa que podemos estar razonablemente seguros de que la verdadera media de eficiencia de combustible de la población se encuentra dentro de este rango con un nivel de confianza del 95%.

  2. Intervalo de confianza Método 2: El intervalo de confianza va desde aproximadamente 4.65 a 6.32 millas/galón. Al igual que con el Método 1, esto indica que podemos tener confianza en que la verdadera media de eficiencia de combustible de la población está dentro de este intervalo con un nivel de confianza del 95%.

Ambos métodos producen intervalos de confianza similares, con ligeras diferencias en los límites exactos. En este caso particular, no parece haber una diferencia sustancial entre los dos métodos en términos de los resultados obtenidos. Ambos proporcionan una estimación razonablemente precisa de la verdadera media de eficiencia de combustible de la población. Por lo tanto, podríamos confiar en cualquiera de los dos intervalos de confianza para tomar decisiones basadas en la estimación de la media poblacional de eficiencia de combustible.