##El Teorema del Lƭmite Central es uno de los mƔs importantes en la inferencia estadƭstica

##PUNTO UNO

#a. población de N=1000 (Lote) y el 50% enfermas.

lote=c(rep("Enfermo",500),rep("sana",500))
lote
##    [1] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##    [8] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [15] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [22] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [29] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [36] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [43] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [50] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [57] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [64] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [71] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [78] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [85] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [92] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##   [99] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [106] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [113] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [120] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [127] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [134] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [141] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [148] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [155] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [162] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [169] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [176] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [183] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [190] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [197] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [204] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [211] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [218] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [225] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [232] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [239] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [246] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [253] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [260] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [267] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [274] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [281] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [288] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [295] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [302] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [309] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [316] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [323] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [330] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [337] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [344] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [351] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [358] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [365] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [372] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [379] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [386] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [393] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [400] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [407] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [414] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [421] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [428] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [435] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [442] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [449] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [456] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [463] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [470] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [477] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [484] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [491] "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo" "Enfermo"
##  [498] "Enfermo" "Enfermo" "Enfermo" "sana"    "sana"    "sana"    "sana"   
##  [505] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [512] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [519] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [526] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [533] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [540] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [547] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [554] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [561] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [568] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [575] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [582] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [589] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [596] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [603] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [610] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [617] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [624] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [631] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [638] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [645] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [652] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [659] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [666] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [673] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [680] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [687] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [694] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [701] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [708] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [715] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [722] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [729] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [736] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [743] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [750] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [757] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [764] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [771] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [778] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [785] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [792] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [799] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [806] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [813] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [820] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [827] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [834] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [841] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [848] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [855] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [862] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [869] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [876] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [883] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [890] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [897] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [904] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [911] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [918] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [925] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [932] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [939] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [946] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [953] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [960] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [967] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [974] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [981] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [988] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"    "sana"   
##  [995] "sana"    "sana"    "sana"    "sana"    "sana"    "sana"

#b. Genere una función que permita obtener una muestra aleatoria de la población y calcule el estimador de la proporción muestral para un tamaño de muestra dado n

calc_p_gorro=function(n){
  muestra=sample(lote,size = n )
  p_gorro=sum(muestra=="Enfermo")/n
  return(p_gorro)
  
}

calc_p_gorro(n=5)
## [1] 0.6

#c. Repita el escenario anterior (b) 500 veces y analice los resultados en cuanto al comportamiento de los 500 estimadores. ¿Qué tan simétricos son los datos?, ¿Son sesgados y qué pasa en cuanto a variabilidad?

pos_p_g = sapply(rep(100,10000),calc_p_gorro)

hist(pos_p_g)

mean(pos_p_g)
## [1] 0.500877
sd(pos_p_g)
## [1] 0.04703916

de acuerdo con el comportamiento de la simulación se observa que los datos son simetricos debido a que siguen la distribución normal con media 50% lo cual es igual al parÔmetro, se observa que al aumentar el valor de n el sesgo o diferencia con el parametro disminuye y la variabilidad disminuye, a su vez al aumentar el valor de n la desviación estandar disminuye.

#d. Realice los ejercicios completos b y c para tamaños de muestra n=5, 10, 15, 20, 30, 50,60, 100, 200, 500. Y compare los resultados de los estimadores en cuanto a la normalidad. Investigue y utilice pruebas de bondad y ajuste (shapiro wilks) y métodos grÔficos (grafico qq de normalidad).

N=c(5,10,15,20,30,50,60,100,200,500)

layout(matrix(c(1:1), nrow=2, byrow=FALSE))
#layout.show(12) # Muestra las doce particiones

for(i in N) {
pos_p_g=sapply(rep(i,500),calc_p_gorro)
print("RESUMEN ESTADISTICO")
print(summary(pos_p_g))
hist(pos_p_g, main = paste("Histograma n=",i), ylab = "Frecuencia", xlab = "Estimador",xlim = c(0,1))
abline(v=0.5,lwd=4)
legend(x = "topleft", legend = c("Desviación Standar=",sd(pos_p_g), "Shapiro Wilks", shapiro.test(pos_p_g)), title = "Estadísticos")
qqnorm(pos_p_g, xlab="Cuantiles teóricos", ylab="Cuantiles muestrales",las=1,main="")
qqline(pos_p_g)
}
## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.4000  0.6000  0.5128  0.6000  1.0000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.100   0.400   0.500   0.502   0.600   0.900

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.1333  0.4000  0.5333  0.5069  0.6000  1.0000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2500  0.4000  0.5000  0.5034  0.6000  0.7500

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2333  0.4333  0.5000  0.4949  0.5667  0.7333

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2800  0.4600  0.5000  0.4996  0.5400  0.7000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3167  0.4667  0.5000  0.4961  0.5333  0.6500

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3600  0.4600  0.5000  0.4994  0.5300  0.6500

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4250  0.4800  0.5000  0.4987  0.5200  0.6150

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

Se puede observar que con muestras pequeñas la distribución no es normal y en los grÔficos y pruebas de normalidad se puede observar que los puntos no se ajustan entre la densidad observada y la densidad normal, a su vez la prueba de shapiro rechaza la hipotesis de normalidad debido a que es una prueba muy estricta y todos los puntos no se ajustan a la curva de normalidad.

#e. Repita toda la simulación (puntos a – d) pero ahora con lotes con 10% y 90% de plantas enfermas. Concluya todo el ejercicio.

layout(matrix(c(1:1), nrow=2, byrow=FALSE))
#layout.show(12) # Muestra las doce particiones


poblacion_plantas1=c(rep(x=1,900),rep(x=0,100))
#poblacion_plantas1

estimador_enfermas1=function(n){
    return(sum(sample(poblacion_plantas1,size=n))/n)
}
N=c(5,10,15,20,30,50,60,100,200,500)
for(i in N) {
estimadores1=sapply(rep(i,500),estimador_enfermas1)
print("RESUMEN ESTADISTICO")
print(summary(pos_p_g))
hist(estimadores1, main = paste("Histograma n=",i), ylab = "Frecuencia", xlab = "Estimador",xlim = c(0.2,1.1))
abline(v=0.9,col="red",lwd=2)
legend(x = "topleft", legend = c("Desviación Standar=",sd(pos_p_g), "Shapiro Wilks", shapiro.test(estimadores1)), title = "Estadísticos")
qqnorm(estimadores1, xlab="Cuantiles teóricos", ylab="Cuantiles muestrales",las=1,main="")
qqline(estimadores1)
}
## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4580  0.4880  0.5000  0.4994  0.5100  0.5520

Se evidencia que la media de la distribución muestral estÔ oscilando alrededor del valor real del parÔmetro, al aumentar el valor de n disminuye la desviación estandar, se observa que el experimento es funcional para valores de n > 30 ya cuando el valor de n<=30 no se puede observar en todos los casos una distribución normal, esto confirma el teorema del límite central debido a que los valores siempre convergen alrededor del valor de la media real del parÔmetro.

PUNTO DOS

#a. Suponga un escenario en el cual usted aplicó tratamientos diferentes a dos lotes y desea analizar si alguno de los dos presenta un mejor desempeño en el control de una plaga presente en ambos al momento inicial. Para ello utilizarÔ como criterio de desempeño el tratamiento que menor % de plantas enfermas presente después de un tiempo de aplicación (es decir, si se presentan o no diferencias en las proporciones de enfermos P1 y P2). Realice una simulación en la cual genere dos poblaciones de N1=1000 (Lote1) y N2=1500 (Lote2), ademÔs asuma que el porcentaje de individuos (plantas) enfermas en ambos lotes sea la misma 10% (es decir, sin diferencias entre los tratamientos.

N1=c(rep(x=1,200),rep(x=0,800))
N2=c(rep(x=1,500),rep(x=0,1000))

#b. Genere una función que permita obtener una muestra aleatoria de los lotes y calcule el estimador de la proporción muestral para cada lote (p1 y p2) para un tamaño de muestra dado n1=n2. Calcule la diferencia entre los estimadores p1-p2.

diferencias_de_p=function(m){
  p_1=(sum(sample(N1,size=m))/m)
  p_2=(sum(sample(N2,size=m))/m)
  dif_p=p_1-p_2
  return(dif_p)
}


diferencias_de_ps=sapply(rep(300,1000),diferencias_de_p)
summary(diferencias_de_ps)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.22333 -0.15667 -0.13333 -0.13409 -0.11333 -0.03667
hist(diferencias_de_ps, main = "Diferencias de ps", ylab = "Frecuencia", xlab=expression(paste(Delta,"P")),xlim = c(-0.3,0.3))

#c. Realice los puntos b y c para tamaños de muestra n1=n2=5, 10, 15, 20, 30, 50, 60, 100, 200, 500. Y compare los resultados de los estimadores (p1-p2) en cuanto a la normalidad. También analice el comportamiento de las diferencias y evalúe. ¿Considera que es mÔs probable concluir que existen diferencias entre los tratamientos con muestras grandes que pequeñas, es decir, cuÔl considera usted que es el efecto del tamaño de muestra en el caso de la comparación de proporciones?

layout(matrix(c(1:1), nrow=2, byrow=FALSE))
#layout.show(12) # Muestra las doce particiones

N=c(5,10,15,20,30,50,60,100,200,500)
for(i in N){
diferencias_de_ps1=sapply(rep(i,1000),diferencias_de_p)
print("RESUMEN ESTADISTICO")
print(summary(diferencias_de_ps1))
hist(diferencias_de_ps1, main = paste("Histograma n=",i), ylab = "Frecuencia", xlab=expression(paste(Delta,"P")),xlim = c(-0.5,0.5))
legend(x = "topleft", legend = c("Desviación Standar=",sd(pos_p_g), "Shapiro Wilks", shapiro.test(diferencias_de_ps1)), title = "Estadísticos")
qqnorm(diferencias_de_ps1, xlab="Cuantiles teóricos", ylab="Cuantiles muestrales",las=1,main="")
qqline(diferencias_de_ps1)
}
## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -1.0000 -0.4000 -0.2000 -0.1422  0.0000  0.6000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.7000 -0.3000 -0.1000 -0.1324  0.0000  0.6000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.6000 -0.2000 -0.1333 -0.1235  0.0000  0.4000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.5500 -0.2000 -0.1500 -0.1301 -0.0500  0.2500

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.46667 -0.20000 -0.13333 -0.13187 -0.06667  0.23333

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.4000 -0.2000 -0.1200 -0.1317 -0.0800  0.1400

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.35000 -0.18333 -0.13333 -0.13427 -0.08333  0.08333

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.3400 -0.1700 -0.1300 -0.1342 -0.0900  0.0500

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.2450 -0.1600 -0.1300 -0.1331 -0.1050 -0.0050

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.1940 -0.1480 -0.1340 -0.1329 -0.1200 -0.0580

#e. Ahora realice nuevamente los puntos a-d bajo un escenario con dos lotes, pero de proporciones de enfermos diferentes (P1=0.1 y P2=0.15), es decir, el tratamiento del lote 1 si presentó un mejor desempeño reduciendo en un 5% el porcentaje de enfermos. Bajo este nuevo escenario compare la distribución de estas diferencias (p1-p2) con las observadas bajo igualdad de condiciones en los lotes.

N_1=c(rep(x=1,100),rep(x=0,900))
N_2=c(rep(x=1,225),rep(x=0,1275))

diferencias2_de_p=function(m){
  p_1=(sum(sample(N_1,size=m))/m)
  p_2=(sum(sample(N_2,size=m))/m)
  dif_p=p_2-p_1
  return(dif_p)
}

layout(matrix(c(1:1), nrow=2, byrow=FALSE))
#layout.show(12) # Muestra las doce particiones

N=c(5,10,15,20,30,50,60,100,200,500)
for(i in N){
diferencias_de_ps2=sapply(rep(i,1000),diferencias2_de_p)
print("RESUMEN ESTADISTICO")
print(summary(diferencias_de_ps2))
hist(diferencias_de_ps2, main = paste("Histograma n=",i), ylab = "Frecuencia", xlab=expression(paste(Delta,"P")),xlim = c(-0.2,0.2))
legend(x = "topleft", legend = c("Desviación Standar=",sd(pos_p_g), "Shapiro Wilks", shapiro.test(diferencias_de_ps2)), title = "Estadísticos")
qqnorm(diferencias_de_ps2, xlab="Cuantiles teóricos", ylab="Cuantiles muestrales",las=1,main="")
qqline(diferencias_de_ps2)
}
## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.6000  0.0000  0.0000  0.0502  0.2000  0.6000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.4000 -0.1000  0.0000  0.0428  0.1000  0.5000

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.33333  0.00000  0.06667  0.05033  0.13333  0.46667

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.2500  0.0000  0.0500  0.0476  0.1000  0.3500

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.23333  0.00000  0.03333  0.04740  0.10000  0.36667

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.14000  0.00000  0.04000  0.04314  0.08000  0.28000

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.13333  0.01250  0.05000  0.04742  0.08333  0.25000

## [1] "RESUMEN ESTADISTICO"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.0900  0.0200  0.0500  0.0497  0.0800  0.2000

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.03000  0.03000  0.05000  0.05165  0.07500  0.15500

## [1] "RESUMEN ESTADISTICO"
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.00600  0.03800  0.05000  0.04956  0.06000  0.11400

se evidencia que existan diferencias entre los tratamientos de las diferentes muestras cuando las proporcionalidades de las poblaciones son diferentes, en este caso uno de los conjuntos de los datos habia tenido un mejor desempeƱo reduciendo en un 5% el porcentaje de plantas enfermas.