El metodo boostraplo que permite es construir una muestra significantemente grande que pueda representar la población y extraer intervalos de confianza de la distribución normal construida.
Es por eso, que en el presente ejercicio se realizara la construcción de mencionados intervalos de confianza a partir de pocas muestras tomadas de una población de la cual desconoce el tamaño y la distribución de densidad.
Obtener un intervalo de confianza desde el percentil 2.5% hasta el 97.5 de la distribución normal generada.
# metodo 1
n <- 7
m <- 1000 # Numero de muestras.
x <- c(7.69, 4.97, 4.56, 6.49, 4.34,6.24,4.45) # Muestras disponibles de base.
m <- sample(x, n*m, replace = TRUE) # Toma muestras de x aleatoriamente hasta llegar hasta 1000.
m <- matrix(m, ncol = 7)
mx <- apply(m, 1, mean)
q <- quantile(mx,c(0.025, 0.975))
hist(mx)
abline(v=q, col="red")
cat("Intervalos de Confianza Metodo 1:",q)
## Intervalos de Confianza Metodo 1: 4.705679 6.444536
#metodo 2
n <- 7
m <- 1000
x <- c(7.69, 4.97, 4.56, 6.49, 4.34,6.24,4.45)
m <- sample(x, n*m, replace = TRUE)
m <- matrix(m, ncol = 7)
mx <- apply(m, 1, mean)
q1 <- c(2*mean(mx)- q[2], 2*mean(mx)-q[1])
hist(mx)
abline(v=q, col="blue")
cat("Intervalos de Confianza Metodo 2:", q1)
## Intervalos de Confianza Metodo 2: 4.591696 6.330553
El metodo 1 es mas directo y obtiene los intervalos en los percentiles solicitados de la distribución de las medias de las muestras generadas, sin embargo, si los datos originales presentan un sesgo este intervalos no ofrece confianza, por otro lado, el metodo 2 estima el sesgo y le resta los intervalos de cofianza del metodo 1, esto puede ser util si se cree que los datos originales o población de las muestras presentan un sesgo, pero puede ser poco util si este sesgo es demasiado grande, sin embargo al obtener los resultados de ambos metodos los intervalos son muy similares, por lo que se podria concluir que el metodo 1 es suficiente para las observaciones tomadas.
A pesar que los metodos pueden arrojar intervalos similares, es posible que la muestra base u observaciones sean muy pocas y que la variabilidad de la estimacion sean muy altas por lo que los metodos implementados sean limitados o poco confiables, para este caso se podria aumentar el tamaño de muestreo podria dar estimaciones mas estables.
Concluyendo, de acuerdo a la poca cantidad de las observaciones se genera una gran incertidumbre en ambos metodos, por lo que no seria confiable a pesar de las similitud de resultados.