Bootstrap en R El bootstrap es un procedimiento estadístico que sirve para aproximar características de la distribución en el muestreo de un estadístico. Para ello se emplea (normalmente) simulación, generando un gran número de muestras mediante algún tipo de remuestreo de la muestra original. Su ventaja principal es que no requiere hipótesis sobre el mecanismo generador de los datos.

El paquete bootstrap implementa funciones para calcular replicaciones y construir intervalos de confianza: 1.Calculo de replicaciones bootstrap con la función bootstrap() 2.Intervalos \(BC_a\) con la función bcanon() 3.Intevalos ABC con la función `abcnon()

Ejemplo Consideramos un conjunto de datos:

set.seed(1)
data <- runif(50)

La idea es aproximar características poblacionales por las correspondientes de la distribución empírica de los datos observados:

# Distribución bootstrap
curve(ecdf(data)(x), ylab = "FD", type = "s", lwd = 2)
# Distribución teórica
abline(a = 0, b = 1, lty = 2) 

Las características de la distribución empírica se pueden aproximar mediante simulación. Esto puede ser implementado mediante remuestreo, realizando repetidamente muestreo aleatorio con reemplazamiento del conjunto de datos original (manteniendo el tamaño muestral):

 # Muestra bootstrap
xboot <- sample(data, replace=TRUE)

Lo cual es de utilidad cuando no se dispone la distribución exacta