Iniciamos simulando una distribución binomial o de tipo Bernulli, para ello utilizamos la función rep valores entre 0 y 1 para obtener 500 valores de cada uno de forma aleatoria.
poblacion = rep(c(0,1), each = 500)
Construimos una función que permita obtener muestras a partir de un parámetro n y una probabilidad p, pero por defecto dejamos en 0.5.
muestra = function(n) {
m = sample(poblacion, n, replace = TRUE)
return(m)
}
Creamos una función para calcular el estimador de la proporción.
proporcion = function(n) {
return(function(list){
sum(list)/n
})
}
Ahora repetirémos estos pasos pero para tamaños de muestra que se definen en el punto D del ejercicio.
Para ello creamos una función que reciba el número de elementos y cree una matriz con dicha cantidad de elementos por fila y n columnas. Para finalmente crear dicho gráfico para cada uno de los tamaños de muestra.
graficar = function(n) {
m=500
y = matrix(muestra(n*m), ncol = n)
phat = apply(y, 1, proporcion(n))
hist(phat)
}
graficar(5)
graficar(10)
graficar(15)
graficar(20)
graficar(30)
graficar(50)
graficar(60)
graficar(100)
graficar(200)
Ahora, se realizará nuevamente la simulación pero la población consistirá en plantas en las que el 10% se encuentran enfermas.
poblacion10enfermas = c(rep(1,100), rep(0, 900))
muestra = function(n) {
m = sample(poblacion10enfermas, n, replace = TRUE)
return(m)
}
proporcion = function(n) {
return(function(list){
sum(list)/n
})
}
graficar = function(n) {
m=500
y = matrix(muestra(n*m), ncol = n)
phat = apply(y, 1, proporcion(n))
hist(phat)
}
graficar(5)
graficar(10)
graficar(15)
graficar(20)
graficar(30)
graficar(50)
graficar(60)
graficar(100)
graficar(200)
Y finalmente para una población de plantas en la que el 90% se encuentran enfermas.
poblacion10enfermas = c(rep(0,100), rep(1, 900))
muestra = function(n) {
m = sample(poblacion10enfermas, n, replace = TRUE)
return(m)
}
proporcion = function(n) {
return(function(list){
sum(list)/n
})
}
graficar = function(n) {
m=500
y = matrix(muestra(n*m), ncol = n)
phat = apply(y, 1, proporcion(n))
hist(phat)
}
graficar(5)
graficar(10)
graficar(15)
graficar(20)
graficar(30)
graficar(50)
graficar(60)
graficar(100)
graficar(200)
A medida que el tamaño de muestra aumenta, se hace evidente que todos las distribuciones tienden a ser de tipo normal, incluso si la población original no se distribuye normalmente, como es el caso de las poblaciones con porcentajes variados de plantas enfermas.
La simulación muestra que a medida que el tamaño de la muestra (n) aumenta, la distribución de la proporción muestral se vuelve más simétrica y se aproxima más a una distribución normal, al comparar los resultados para diferentes tamaños de muestra, se puede evidenciar que este tipo de distribución empieza a ser notoria a partir de tamaños de muestra superior a 30.
Para las poblaciones de plantas con proporciones extremas se puede observar la gran variabilidad en la distribución cuando se trata de tamaños de muestra pequeños, pero esta variabilidad disminuye a medida que el tamaño de muestra aumenta.
Las simulaciones reafirman la aplicabilidad del Teorema del Límite Central en la inferencia estadística, destacando su robustez y relevancia para estimaciones precisas en diversas situaciones independientemente de la distribución original de la población.