1.Introducción

El objetivo de este informe es determinar un intervalo de confianza del 95% para la media de la eficiencia de combustible de una población de camiones. Dado que la distribución de los datos es desconocida y tenemos una muestra de siete camiones con mediciones de eficiencia de combustible en millas/galón, emplearemos el método bootstrap para obtener estimaciones robustas del intervalo de confianza.

2. Métodos

El objetivo de este informe es determinar un intervalo de confianza del 95% para la media de la eficiencia de combustible de una población de camiones. Para lograrlo, utilizaremos el método bootstrap, que nos permite estimar este intervalo incluso cuando no conocemos la distribución exacta de los datos. Tenemos datos de una muestra de siete camiones y sus mediciones de eficiencia de combustible en millas por galón.

Metodología:

El método bootstrap implica crear muchas “muestras” ficticias, llamadas muestras bootstrap, a partir de nuestra muestra original. Hacemos esto tomando aleatoriamente datos de nuestra muestra original y creando una nueva muestra del mismo tamaño, permitiendo la repetición de datos. Luego, calculamos la media de eficiencia de combustible para cada una de estas muestras bootstrap.

Después de obtener las medias de todas las muestras bootstrap, calculamos el intervalo de confianza del 95% de dos maneras:

Método 1: Encontramos los valores en el percentil 2.5 y el percentil 97.5 de todas las medias de las muestras bootstrap.

Método 2: Aplica una transformación a los percentiles calculados en el método 1.

#Problema 4R

# semilla para reproducibilidad
set.seed(123)

# Generar muchas muestras bootstrap
x <- c(7.69, 4.97, 4.56, 6.49, 4.34, 6.24, 4.45)
boot <- sample(x, 7000, replace = TRUE)

# Organizar las muestras bootstrap en una matriz
b <- matrix(boot, nrow = 1000, ncol = 7)

# Calcular las medias de las muestras bootstrap
mx <- apply(b, 1, mean)

# Calcular el intervalo de confianza del método 1
ic1 <- quantile(mx, probs = c(0.025, 0.975))

# Definir función para calcular el intervalo de confianza del método 2
calcular_ic2 <- function(mx, ic1) {
  ic2 <- c(2 * mean(mx) - ic1[2], 2 * mean(mx) - ic1[1])
  return(ic2)
}

# Calcular el intervalo de confianza del método 2 utilizando la función definida
ic2 <- calcular_ic2(mx, ic1)

3. Resultados

Luego de aplicar el método bootstrap y calcular los intervalos de confianza del 95% para la media de la eficiencia de combustible de los camiones, obtuvimos los siguientes resultados detallados:

Método 1:

En este método, se calcularon los percentiles 2.5 y 97.5 de las medias de las muestras bootstrap para determinar los límites del intervalo de confianza. El cálculo arrojó los siguientes valores:

# Mostrar los resultados
print("Intervalo de confianza - Método 1:")

## [1] "Intervalo de confianza - Método 1:"

print(ic1)

##     2.5%    97.5% 
## 4.721429 6.418643

Estos valores representan el rango en el cual, con un nivel de confianza del 95%, se espera que se encuentre la verdadera media de la eficiencia de combustible de la población de camiones.

Método 2:

En este método, se aplicó una transformación a los percentiles calculados en el Método 1 para obtener un intervalo alternativo. La fórmula utilizada en este caso ajusta los límites del intervalo de confianza y produce valores ligeramente diferentes. Los resultados fueron los siguientes:

print("Intervalo de confianza - Método 2:")

## [1] "Intervalo de confianza - Método 2:"

print(ic2)

##    97.5%     2.5% 
## 4.639526 6.336740

Comparando ambos métodos, observamos en el histograma que los intervalos de confianza obtenidos son bastante similares, aunque hay pequeñas diferencias en los valores de los límites. Específicamente, el Método 2 produce un intervalo ligeramente más estrecho que el Método 1. Esto sugiere que la transformación aplicada en el Método 2 tiene un efecto moderado en la amplitud del intervalo de confianza.

# Visualización mejorada (por ejemplo, utilizando ggplot2)
library(ggplot2)
df <- data.frame(mx = mx)
ggplot(df, aes(x = mx)) +
  geom_histogram(binwidth = 0.1, fill = "#FF5733", color = "#000000") +  # Cambiar color del histograma
  geom_vline(xintercept = ic1, color = "#FF0000", linetype = "dashed", size = 1) +  # Cambiar color de la línea para el intervalo del método 1
  geom_vline(xintercept = ic2, color = "#0000FF", linetype = "dashed", size = 1) +  # Cambiar color de la línea para el intervalo del método 2
  labs(title = "Histograma de las medias bootstrap",
       x = "Media de las muestras bootstrap",
       y = "Frecuencia",
       caption = "Intervalo de confianza Método 1 (Rojo) - Intervalo de confianza Método 2 (Azul)") +
  theme_minimal()

4. Conclusiones

Ambos métodos proporcionan intervalos de confianza del 95% para la media de la eficiencia de combustible de los camiones. Observamos que los intervalos calculados son similares, aunque el Método 2 produce límites ligeramente ajustados en comparación con el Método 1.

Estos resultados sugieren que la verdadera media de la eficiencia de combustible de los camiones probablemente se encuentre dentro de los intervalos de confianza calculados. Por lo tanto, podemos confiar en estas estimaciones para realizar inferencias sobre la población de camiones.

Sin embargo, es importante tener en cuenta las limitaciones del método bootstrap y reconocer que estos intervalos de confianza están sujetos a cierto grado de incertidumbre inherente a cualquier estimación estadística.

Informe sobre problema 4 - Estimacción boostrap

2024-03-18

1.Introducción

2. Métodos

3. Resultados

4. Conclusiones