Problema 3

Teorema del Límite Central

Apliquemos las funciones definidas al problema planteado:

n_repeticiones <- 500
tamaños_muestra <- c(5, 10, 15, 20, 30, 50, 60, 100, 200, 500)
resultados <- lapply(tamaños_muestra, function(n) {
  replicate(n_repeticiones, cal_proporcion_muestral(poblacion, n))
})
names(resultados) <- paste("n=", tamaños_muestra, sep="")

## 
## Tamaño de muestra n = 5 
## Shapiro-Wilk p-value: 3.333753e-15

## 
## Tamaño de muestra n = 10 
## Shapiro-Wilk p-value: 7.877291e-10

## 
## Tamaño de muestra n = 15 
## Shapiro-Wilk p-value: 4.472199e-08

## 
## Tamaño de muestra n = 20 
## Shapiro-Wilk p-value: 7.172682e-07

## 
## Tamaño de muestra n = 30 
## Shapiro-Wilk p-value: 2.618341e-05

## 
## Tamaño de muestra n = 50 
## Shapiro-Wilk p-value: 0.003260273

## 
## Tamaño de muestra n = 60 
## Shapiro-Wilk p-value: 0.005412488

## 
## Tamaño de muestra n = 100 
## Shapiro-Wilk p-value: 0.04345206

## 
## Tamaño de muestra n = 200 
## Shapiro-Wilk p-value: 0.08366892

## 
## Tamaño de muestra n = 500 
## Shapiro-Wilk p-value: 0.1720724

analizar_proporcion <- function(proporcion_plantas_enfermas) {
  poblacion <- rbinom(N, 1, proporcion_plantas_enfermas)
  resultados <- lapply(tamaños_muestra, function(n) {
    replicate(n_repeticiones, cal_proporcion_muestral(poblacion, n))
  })
  names(resultados) <- paste("n=", tamaños_muestra, sep="")
}

## 
## Proporción = 0.5 Tamaño de muestra n = 5 
## Shapiro-Wilk p-value: 3.333753e-15

## 
## Proporción = 0.5 Tamaño de muestra n = 10 
## Shapiro-Wilk p-value: 7.877291e-10

## 
## Proporción = 0.5 Tamaño de muestra n = 15 
## Shapiro-Wilk p-value: 4.472199e-08

## 
## Proporción = 0.5 Tamaño de muestra n = 20 
## Shapiro-Wilk p-value: 7.172682e-07

## 
## Proporción = 0.5 Tamaño de muestra n = 30 
## Shapiro-Wilk p-value: 2.618341e-05

## 
## Proporción = 0.5 Tamaño de muestra n = 50 
## Shapiro-Wilk p-value: 0.003260273

## 
## Proporción = 0.5 Tamaño de muestra n = 60 
## Shapiro-Wilk p-value: 0.005412488

## 
## Proporción = 0.5 Tamaño de muestra n = 100 
## Shapiro-Wilk p-value: 0.04345206

## 
## Proporción = 0.5 Tamaño de muestra n = 200 
## Shapiro-Wilk p-value: 0.08366892

## 
## Proporción = 0.5 Tamaño de muestra n = 500 
## Shapiro-Wilk p-value: 0.1720724

Análisis

  • Con este problema se puede ver el Teorema del Limite Central en acción dado que al generar muestras de muestras notamos que podemos obtener lo mas cercano a una distribución normal de los datos a tal punto que podemos obtener la esperanza poblacional de las muestras obtenidas.
  • Notamos ademas que a medida en que obtenemos mas muestras los datos adquieren mas las caracteristicas de una distribucion normal y su varianza tiende a disminuir.
  • Al aplicar las pruebas de normalidad Shapiro-Wilk a los resultados de los experimimentos notamos la validez del Teorema del Limite Central.
  • Cuando cambiamos la probabilidad a 0.1 notamos un sesgo a la derecha, teniendo la mayoria de los datos concentrados a la izquierda.
  • Cuando cambiamos la probabilidad a 0.9 notamos un sesgo a la izquierda, teniendo la mayoria de los datos concentrados a la derecha.