Problema 3

Teorema del Límite Central

Solución

Iniciamos simulando una distribución binomial o de tipo Bernulli, para ello utilizamos la función rep valores entre 0 y 1 para obtener 500 valores de cada uno de forma aleatoria.

poblacion = rep(c(0,1), each = 500)

Construimos una función que permita obtener muestras a partir de un parámetro n y una probabilidad p, pero por defecto dejamos en 0.5.

muestra = function(n) {
  m = sample(poblacion, n, replace = TRUE)
  return(m)
}

Creamos una función para calcular el estimador de la proporción.

proporcion = function(n) {
  
  return(function(list){
  sum(list)/n
    
  })
}

Ahora repetirémos estos pasos pero para tamaños de muestra que se definen en el punto D del ejercicio.

Para ello creamos una función que reciba el número de elementos y cree una matriz con dicha cantidad de elementos por fila y n columnas. Para finalmente crear dicho gráfico para cada uno de los tamaños de muestra.

graficar = function(n) {
  m=500
  y = matrix(muestra(n*m), ncol = n)
  
  phat = apply(y, 1, proporcion(n))
  hist(phat)
}

graficar(5)

graficar(10)

graficar(15)

graficar(20)

graficar(30)

graficar(50)

graficar(60)

graficar(100)

graficar(200)

Ahora, se realizará nuevamente la simulación pero la población consistirá en plantas en las que el 10% se encuentran enfermas.

poblacion10enfermas = c(rep(1,100), rep(0, 900))
muestra = function(n) {
  m = sample(poblacion10enfermas, n, replace = TRUE)
  return(m)
}

proporcion = function(n) {
  
  return(function(list){
  sum(list)/n
    
  })
}
graficar = function(n) {
  m=500
  y = matrix(muestra(n*m), ncol = n)
  
  phat = apply(y, 1, proporcion(n))
  hist(phat)
}

graficar(5)

graficar(10)

graficar(15)

graficar(20)

graficar(30)

graficar(50)

graficar(60)

graficar(100)

graficar(200)

Y finalmente para una población de plantas en la que el 90% se encuentran enfermas.

poblacion10enfermas = c(rep(0,100), rep(1, 900))
muestra = function(n) {
  m = sample(poblacion10enfermas, n, replace = TRUE)
  return(m)
}

proporcion = function(n) {
  
  return(function(list){
  sum(list)/n
    
  })
}
graficar = function(n) {
  m=500
  y = matrix(muestra(n*m), ncol = n)
  
  phat = apply(y, 1, proporcion(n))
  hist(phat)
}

graficar(5)

graficar(10)

graficar(15)

graficar(20)

graficar(30)

graficar(50)

graficar(60)

graficar(100)

graficar(200)

Conclusiones

  • A medida que el tamaño de muestra aumenta, se hace evidente que todos las distribuciones tienden a ser de tipo normal, incluso si la población original no se distribuye normalmente, como es el caso de las poblaciones con porcentajes variados de plantas enfermas.

  • La simulación muestra que a medida que el tamaño de la muestra (n) aumenta, la distribución de la proporción muestral se vuelve más simétrica y se aproxima más a una distribución normal, al comparar los resultados para diferentes tamaños de muestra, se puede evidenciar que este tipo de distribución empieza a ser notoria a partir de tamaños de muestra superior a 30.

  • Para las poblaciones de plantas con proporciones extremas se puede observar la gran variabilidad en la distribución cuando se trata de tamaños de muestra pequeños, pero esta variabilidad disminuye a medida que el tamaño de muestra aumenta.

  • Las simulaciones reafirman la aplicabilidad del Teorema del Límite Central en la inferencia estadística, destacando su robustez y relevancia para estimaciones precisas en diversas situaciones independientemente de la distribución original de la población.