El Teorema del Límite Central es uno de los más importantes en la inferencia estadística y habla sobre la convergencia de los estimadores como la proporción muestral a la distribución normal. Algunos autores afirman que esta aproximación es bastante buena a partir del umbral n>30 .
Paso 1: Creación de la función para evalluar el teorema
funcion_sample<-function(poblacion,tamano){
muestra<-(rbinom(n=poblacion,size=tamano,p=0.5))
p.est<-(muestra/tamano)
hist(p.est,xlab = "Proporciones estimadas",ylab="Número de muestras",main="")
abline(v=0.5, col="red")
prueba<-shapiro.test(muestra)
print(prueba)
qqnorm(muestra)
}
revision5<-funcion_sample(1000,5)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.92398, p-value < 2.2e-16
## Simulación con n= 10
revision10<-funcion_sample(1000,10)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.96598, p-value = 1.569e-14
## Simulación con n= 15
revision15<-funcion_sample(1000,15)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.97625, p-value = 1.02e-11
## Simulación con n= 20
revision20<-funcion_sample(1000,20)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.98218, p-value = 1.04e-09
## Simulación con n= 30
revision30<-funcion_sample(1000,30)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.98739, p-value = 1.415e-07
## Simulación con n= 50
revision50<-funcion_sample(1000,50)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.9928, p-value = 8.92e-05
## Simulación con n= 60
revision60<-funcion_sample(1000,60)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.99256, p-value = 6.418e-05
## Simulación con n= 100
revision100<-funcion_sample(1000,100)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.99489, p-value = 0.001876
## Simulación con n= 200
revision200<-funcion_sample(1000,200)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.99706, p-value = 0.06303
## Simulación con n= 500
revision200<-funcion_sample(1000,500)
##
## Shapiro-Wilk normality test
##
## data: muestra
## W = 0.9968, p-value = 0.04092
De acuerdo a la simulación realizada a las diferentes muestras, se puede evidenciar como el teorema de limite central que para una poblacion en la cual se tiene el 50% de plantas enfermas las estimaciones tienden a estabilizar a partir de una muestra de 30 datos para la cual la grafica se empieza a tornar simetrica con respecto a la media. al aumentar el tamaño de n a mas de 100 la simetria de la distribución normal es perceptible.