Simulación con n= 5

El Teorema del Límite Central es uno de los más importantes en la inferencia estadística y habla sobre la convergencia de los estimadores como la proporción muestral a la distribución normal. Algunos autores afirman que esta aproximación es bastante buena a partir del umbral n>30 .

Paso 1: Creación de la función para evalluar el teorema

funcion_sample<-function(poblacion,tamano){
  muestra<-(rbinom(n=poblacion,size=tamano,p=0.5))
  p.est<-(muestra/tamano)
  hist(p.est,xlab = "Proporciones estimadas",ylab="Número de muestras",main="")
  abline(v=0.5, col="red")
  prueba<-shapiro.test(muestra)
  print(prueba)
  qqnorm(muestra)

}

Graficos y resultados para n= 5

revision5<-funcion_sample(1000,5)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.92398, p-value < 2.2e-16

## Simulación con n= 10

revision10<-funcion_sample(1000,10)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.96598, p-value = 1.569e-14

## Simulación con n= 15

revision15<-funcion_sample(1000,15)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.97625, p-value = 1.02e-11

## Simulación con n= 20

revision20<-funcion_sample(1000,20)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.98218, p-value = 1.04e-09

## Simulación con n= 30

revision30<-funcion_sample(1000,30)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.98739, p-value = 1.415e-07

## Simulación con n= 50

revision50<-funcion_sample(1000,50)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.9928, p-value = 8.92e-05

## Simulación con n= 60

revision60<-funcion_sample(1000,60)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.99256, p-value = 6.418e-05

## Simulación con n= 100

revision100<-funcion_sample(1000,100)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.99489, p-value = 0.001876

## Simulación con n= 200

revision200<-funcion_sample(1000,200)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.99706, p-value = 0.06303

## Simulación con n= 500

revision200<-funcion_sample(1000,500)

## 
##  Shapiro-Wilk normality test
## 
## data:  muestra
## W = 0.9968, p-value = 0.04092

Conclusiones

De acuerdo a la simulación realizada a las diferentes muestras, se puede evidenciar como el teorema de limite central que para una poblacion en la cual se tiene el 50% de plantas enfermas las estimaciones tienden a estabilizar a partir de una muestra de 30 datos para la cual la grafica se empieza a tornar simetrica con respecto a la media. al aumentar el tamaño de n a mas de 100 la simetria de la distribución normal es perceptible.