lote=c(rep("Sanas",500),rep("enfermas",500))
head(lote,100)
## [1] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [10] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [19] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [28] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [37] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [46] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [55] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [64] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [73] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [82] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [91] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [100] "Sanas"
cal_sample <- function(n){
muestra = sample(lote,size = n)
promedio = sum(muestra == "enfermas")/n
return(promedio)
}
cal_sample(n=100)
## [1] 0.48
cal_sample(n=50)
## [1] 0.64
estimadores= sapply(rep(50,500),cal_sample)
estimadores
## [1] 0.56 0.40 0.44 0.42 0.54 0.48 0.38 0.54 0.54 0.54 0.48 0.56 0.60 0.48 0.44
## [16] 0.46 0.54 0.60 0.58 0.50 0.56 0.48 0.58 0.50 0.46 0.44 0.46 0.58 0.48 0.58
## [31] 0.52 0.50 0.54 0.66 0.50 0.50 0.54 0.48 0.62 0.52 0.44 0.46 0.50 0.58 0.42
## [46] 0.50 0.46 0.48 0.56 0.44 0.54 0.54 0.52 0.48 0.54 0.58 0.48 0.48 0.46 0.62
## [61] 0.60 0.58 0.48 0.52 0.46 0.58 0.38 0.56 0.48 0.44 0.52 0.38 0.46 0.56 0.52
## [76] 0.44 0.46 0.50 0.42 0.54 0.48 0.44 0.42 0.48 0.46 0.46 0.64 0.54 0.44 0.46
## [91] 0.42 0.46 0.48 0.36 0.56 0.56 0.46 0.54 0.52 0.58 0.60 0.50 0.44 0.62 0.58
## [106] 0.34 0.38 0.44 0.60 0.42 0.50 0.54 0.56 0.44 0.40 0.52 0.70 0.50 0.52 0.54
## [121] 0.46 0.44 0.60 0.56 0.54 0.54 0.56 0.58 0.50 0.52 0.52 0.48 0.48 0.54 0.44
## [136] 0.60 0.58 0.50 0.42 0.56 0.56 0.56 0.60 0.48 0.48 0.50 0.48 0.50 0.54 0.50
## [151] 0.42 0.56 0.52 0.46 0.40 0.34 0.50 0.54 0.42 0.50 0.46 0.38 0.56 0.44 0.50
## [166] 0.38 0.48 0.36 0.50 0.36 0.40 0.48 0.38 0.46 0.58 0.64 0.50 0.52 0.46 0.48
## [181] 0.54 0.52 0.58 0.58 0.62 0.52 0.40 0.54 0.62 0.52 0.40 0.42 0.54 0.48 0.44
## [196] 0.48 0.40 0.58 0.54 0.54 0.50 0.44 0.46 0.56 0.48 0.50 0.30 0.48 0.58 0.46
## [211] 0.44 0.46 0.48 0.54 0.46 0.44 0.46 0.52 0.42 0.46 0.46 0.54 0.42 0.50 0.52
## [226] 0.50 0.52 0.54 0.46 0.42 0.34 0.36 0.48 0.48 0.42 0.48 0.50 0.36 0.48 0.52
## [241] 0.54 0.44 0.42 0.48 0.54 0.42 0.46 0.38 0.52 0.50 0.44 0.62 0.38 0.46 0.54
## [256] 0.56 0.54 0.42 0.48 0.40 0.54 0.46 0.50 0.44 0.50 0.52 0.46 0.64 0.56 0.54
## [271] 0.56 0.50 0.48 0.42 0.60 0.40 0.44 0.48 0.52 0.46 0.62 0.50 0.50 0.50 0.50
## [286] 0.48 0.50 0.58 0.44 0.54 0.58 0.46 0.52 0.44 0.48 0.42 0.60 0.52 0.48 0.66
## [301] 0.62 0.44 0.52 0.54 0.56 0.48 0.52 0.54 0.58 0.44 0.54 0.46 0.46 0.56 0.48
## [316] 0.40 0.46 0.54 0.58 0.54 0.56 0.46 0.56 0.56 0.48 0.52 0.50 0.50 0.40 0.46
## [331] 0.48 0.38 0.40 0.44 0.48 0.32 0.58 0.44 0.60 0.40 0.58 0.56 0.50 0.44 0.46
## [346] 0.48 0.54 0.52 0.54 0.34 0.56 0.34 0.54 0.48 0.48 0.50 0.66 0.56 0.54 0.54
## [361] 0.42 0.50 0.52 0.62 0.54 0.42 0.46 0.62 0.46 0.42 0.46 0.54 0.52 0.56 0.50
## [376] 0.50 0.50 0.58 0.44 0.52 0.48 0.40 0.60 0.60 0.48 0.46 0.52 0.54 0.48 0.44
## [391] 0.34 0.50 0.46 0.52 0.58 0.54 0.52 0.52 0.56 0.46 0.54 0.54 0.62 0.46 0.50
## [406] 0.54 0.52 0.62 0.48 0.56 0.48 0.50 0.52 0.48 0.58 0.50 0.46 0.54 0.58 0.58
## [421] 0.74 0.54 0.38 0.52 0.54 0.50 0.56 0.46 0.48 0.56 0.64 0.52 0.30 0.52 0.50
## [436] 0.72 0.54 0.36 0.60 0.58 0.48 0.46 0.46 0.46 0.58 0.58 0.36 0.42 0.52 0.56
## [451] 0.58 0.58 0.54 0.58 0.48 0.42 0.40 0.50 0.52 0.56 0.52 0.56 0.50 0.54 0.60
## [466] 0.50 0.58 0.50 0.30 0.46 0.38 0.56 0.50 0.62 0.64 0.50 0.62 0.46 0.38 0.58
## [481] 0.50 0.50 0.48 0.52 0.48 0.60 0.52 0.58 0.48 0.52 0.52 0.54 0.48 0.60 0.40
## [496] 0.54 0.50 0.56 0.48 0.54
hist(estimadores)
mean(estimadores)
## [1] 0.5016
sd(estimadores)
## [1] 0.06862404
Análisis: con una muestra de 50, y 500 repeticiones, teniendo por promedio 0.50 y desviación de 0.067, tiende a distribuirse normal, pero la grafica no es tan simetrica.
cal_sample(n=100)
## [1] 0.54
estimadores= sapply(rep(50,500),cal_sample)
estimadores
## [1] 0.50 0.50 0.50 0.54 0.56 0.42 0.58 0.56 0.48 0.32 0.52 0.48 0.60 0.50 0.40
## [16] 0.56 0.48 0.44 0.60 0.50 0.56 0.46 0.56 0.62 0.50 0.52 0.42 0.48 0.62 0.54
## [31] 0.40 0.40 0.50 0.40 0.58 0.50 0.52 0.56 0.58 0.46 0.60 0.52 0.48 0.50 0.52
## [46] 0.50 0.50 0.54 0.46 0.54 0.56 0.50 0.62 0.50 0.54 0.38 0.50 0.50 0.50 0.56
## [61] 0.58 0.48 0.46 0.36 0.48 0.54 0.48 0.52 0.50 0.56 0.58 0.44 0.54 0.50 0.46
## [76] 0.42 0.44 0.46 0.62 0.54 0.52 0.52 0.56 0.50 0.44 0.48 0.38 0.46 0.44 0.54
## [91] 0.62 0.46 0.54 0.44 0.54 0.48 0.42 0.50 0.50 0.50 0.48 0.44 0.46 0.44 0.60
## [106] 0.50 0.54 0.44 0.56 0.54 0.56 0.42 0.40 0.44 0.48 0.44 0.50 0.56 0.48 0.66
## [121] 0.58 0.40 0.48 0.44 0.56 0.68 0.50 0.48 0.56 0.48 0.68 0.42 0.42 0.40 0.56
## [136] 0.48 0.58 0.50 0.54 0.52 0.46 0.48 0.54 0.60 0.64 0.52 0.52 0.50 0.48 0.50
## [151] 0.60 0.44 0.48 0.40 0.50 0.42 0.40 0.64 0.52 0.64 0.58 0.56 0.46 0.40 0.52
## [166] 0.52 0.62 0.46 0.66 0.46 0.56 0.52 0.56 0.48 0.54 0.52 0.38 0.46 0.42 0.60
## [181] 0.44 0.42 0.46 0.44 0.44 0.52 0.52 0.38 0.52 0.48 0.52 0.48 0.36 0.48 0.52
## [196] 0.52 0.54 0.46 0.40 0.34 0.48 0.50 0.62 0.72 0.42 0.54 0.48 0.54 0.40 0.46
## [211] 0.40 0.40 0.38 0.36 0.58 0.46 0.54 0.52 0.50 0.50 0.42 0.36 0.48 0.54 0.42
## [226] 0.54 0.56 0.58 0.50 0.50 0.46 0.52 0.56 0.40 0.52 0.44 0.56 0.60 0.46 0.30
## [241] 0.50 0.58 0.40 0.56 0.38 0.52 0.48 0.56 0.44 0.60 0.52 0.54 0.54 0.50 0.46
## [256] 0.52 0.62 0.54 0.36 0.68 0.60 0.42 0.52 0.48 0.42 0.52 0.46 0.50 0.42 0.44
## [271] 0.58 0.56 0.60 0.66 0.44 0.60 0.44 0.56 0.44 0.36 0.42 0.44 0.56 0.44 0.52
## [286] 0.50 0.48 0.52 0.50 0.42 0.52 0.52 0.54 0.60 0.46 0.50 0.48 0.42 0.52 0.50
## [301] 0.44 0.48 0.44 0.42 0.52 0.52 0.54 0.54 0.50 0.64 0.48 0.50 0.48 0.32 0.66
## [316] 0.44 0.50 0.60 0.46 0.60 0.60 0.50 0.48 0.60 0.40 0.52 0.46 0.42 0.50 0.52
## [331] 0.68 0.58 0.46 0.58 0.58 0.52 0.52 0.56 0.48 0.54 0.46 0.40 0.52 0.40 0.58
## [346] 0.48 0.48 0.48 0.48 0.56 0.56 0.42 0.54 0.44 0.50 0.46 0.42 0.38 0.46 0.52
## [361] 0.36 0.36 0.42 0.50 0.48 0.48 0.52 0.62 0.38 0.34 0.58 0.44 0.52 0.54 0.54
## [376] 0.56 0.52 0.56 0.46 0.56 0.54 0.56 0.58 0.58 0.44 0.50 0.48 0.56 0.46 0.50
## [391] 0.32 0.48 0.54 0.52 0.60 0.52 0.52 0.56 0.38 0.38 0.54 0.36 0.60 0.52 0.50
## [406] 0.56 0.58 0.42 0.56 0.48 0.52 0.38 0.44 0.58 0.42 0.46 0.54 0.50 0.46 0.40
## [421] 0.56 0.36 0.58 0.50 0.40 0.46 0.50 0.42 0.50 0.40 0.54 0.52 0.52 0.58 0.44
## [436] 0.50 0.38 0.54 0.48 0.54 0.48 0.64 0.58 0.46 0.44 0.58 0.46 0.46 0.50 0.50
## [451] 0.48 0.54 0.58 0.54 0.52 0.48 0.40 0.52 0.56 0.46 0.66 0.56 0.66 0.48 0.52
## [466] 0.46 0.62 0.46 0.38 0.50 0.44 0.40 0.50 0.54 0.46 0.54 0.42 0.48 0.40 0.48
## [481] 0.40 0.50 0.48 0.58 0.44 0.46 0.36 0.54 0.38 0.50 0.52 0.50 0.52 0.62 0.40
## [496] 0.64 0.56 0.56 0.52 0.52
estimadores5= sapply(rep(5,5000),cal_sample)
estimadores10= sapply(rep(10,5000),cal_sample)
estimadores15= sapply(rep(15,5000),cal_sample)
estimadores20= sapply(rep(20,5000),cal_sample)
estimadores30= sapply(rep(30,5000),cal_sample)
estimadores50= sapply(rep(50,5000),cal_sample)
estimadores60= sapply(rep(60,5000),cal_sample)
estimadores100= sapply(rep(100,5000),cal_sample)
estimadores200= sapply(rep(200,5000),cal_sample)
estimadores500= sapply(rep(500,5000),cal_sample)
resultados = data.frame(estimadores5,estimadores10,estimadores15,estimadores20,estimadores30,estimadores50,estimadores60,estimadores100,estimadores200,estimadores500)
boxplot(resultados)
abline(h=0.5,col="green",lwd=4)
Análisis: Se puede ver que todos los estimadores tienen su promedio
cercano al valor del parametro (0.5), sin embargo, al aumentar el tamaño
de la muestra, se disminuye la disperción de los datos, esto se
evidencia en el tamaño de las cajas, ya que a medida que aumenta el
tamaño de la mjuestra, disminuye el tamaño de la caja, y asi mismo, los
outliers tambien tienen a disminuir y a estar mas proximos a los cuerpos
de las cajas.
lote10=c(rep("Sanas",900),rep("enfermas",100))
head(lote10,100)
## [1] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [10] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [19] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [28] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [37] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [46] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [55] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [64] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [73] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [82] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [91] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [100] "Sanas"
cal_sample10 <- function(n){
muestra = sample(lote10,size = n)
promedio = sum(muestra == "enfermas")/n
return(promedio)
}
cal_sample10(n=100)
## [1] 0.06
Se evidencia que ahora la el estimador del promedio tiende a ser del 10%
cal_sample10(n=50)
## [1] 0.16
estimadores= sapply(rep(50,500),cal_sample10)
estimadores
## [1] 0.18 0.06 0.12 0.10 0.04 0.02 0.08 0.06 0.16 0.14 0.10 0.16 0.10 0.10 0.02
## [16] 0.10 0.08 0.08 0.02 0.08 0.12 0.04 0.10 0.14 0.12 0.16 0.04 0.06 0.08 0.10
## [31] 0.08 0.06 0.04 0.04 0.10 0.04 0.08 0.12 0.10 0.04 0.14 0.12 0.08 0.14 0.08
## [46] 0.06 0.06 0.12 0.08 0.06 0.12 0.08 0.04 0.08 0.18 0.14 0.14 0.00 0.12 0.08
## [61] 0.04 0.14 0.08 0.20 0.06 0.16 0.10 0.10 0.06 0.12 0.12 0.10 0.14 0.08 0.10
## [76] 0.12 0.04 0.22 0.06 0.08 0.12 0.14 0.10 0.10 0.16 0.12 0.06 0.02 0.08 0.14
## [91] 0.06 0.12 0.04 0.14 0.08 0.06 0.12 0.08 0.06 0.10 0.12 0.08 0.14 0.10 0.14
## [106] 0.18 0.08 0.10 0.12 0.10 0.08 0.04 0.12 0.12 0.10 0.10 0.08 0.12 0.04 0.06
## [121] 0.14 0.08 0.06 0.14 0.10 0.12 0.08 0.10 0.16 0.06 0.12 0.10 0.18 0.08 0.14
## [136] 0.12 0.14 0.12 0.12 0.18 0.12 0.04 0.14 0.12 0.10 0.12 0.06 0.14 0.10 0.08
## [151] 0.06 0.10 0.10 0.18 0.12 0.08 0.10 0.08 0.12 0.14 0.04 0.02 0.06 0.12 0.14
## [166] 0.06 0.16 0.08 0.16 0.08 0.08 0.10 0.14 0.10 0.08 0.06 0.02 0.20 0.10 0.14
## [181] 0.12 0.12 0.10 0.08 0.24 0.20 0.14 0.10 0.14 0.04 0.12 0.06 0.10 0.10 0.12
## [196] 0.08 0.10 0.04 0.12 0.12 0.10 0.10 0.12 0.08 0.10 0.06 0.08 0.12 0.06 0.06
## [211] 0.04 0.10 0.18 0.06 0.14 0.06 0.12 0.08 0.08 0.20 0.08 0.12 0.10 0.04 0.16
## [226] 0.10 0.14 0.18 0.10 0.10 0.16 0.06 0.04 0.02 0.04 0.10 0.12 0.04 0.10 0.06
## [241] 0.10 0.04 0.08 0.06 0.08 0.12 0.10 0.14 0.14 0.10 0.10 0.16 0.06 0.14 0.18
## [256] 0.12 0.10 0.08 0.06 0.08 0.08 0.10 0.06 0.14 0.10 0.06 0.12 0.12 0.08 0.10
## [271] 0.06 0.02 0.12 0.04 0.16 0.14 0.06 0.10 0.14 0.10 0.12 0.00 0.10 0.04 0.06
## [286] 0.08 0.08 0.08 0.08 0.04 0.16 0.10 0.10 0.10 0.12 0.08 0.14 0.12 0.12 0.08
## [301] 0.16 0.04 0.12 0.12 0.12 0.06 0.06 0.08 0.12 0.04 0.06 0.04 0.08 0.06 0.08
## [316] 0.06 0.06 0.14 0.10 0.10 0.10 0.06 0.08 0.08 0.12 0.16 0.18 0.16 0.16 0.04
## [331] 0.14 0.10 0.12 0.10 0.04 0.12 0.14 0.08 0.06 0.08 0.10 0.12 0.08 0.10 0.06
## [346] 0.12 0.12 0.20 0.06 0.06 0.16 0.04 0.10 0.10 0.12 0.10 0.08 0.10 0.12 0.08
## [361] 0.12 0.12 0.16 0.10 0.04 0.14 0.06 0.08 0.04 0.10 0.08 0.08 0.08 0.10 0.10
## [376] 0.08 0.08 0.02 0.10 0.08 0.06 0.12 0.12 0.12 0.10 0.04 0.16 0.08 0.04 0.06
## [391] 0.06 0.08 0.14 0.06 0.06 0.16 0.16 0.12 0.06 0.16 0.06 0.10 0.08 0.12 0.06
## [406] 0.08 0.10 0.10 0.12 0.06 0.06 0.12 0.16 0.14 0.08 0.16 0.22 0.10 0.08 0.08
## [421] 0.12 0.14 0.08 0.08 0.02 0.06 0.02 0.08 0.02 0.10 0.08 0.06 0.16 0.08 0.10
## [436] 0.10 0.16 0.10 0.08 0.14 0.08 0.16 0.10 0.12 0.12 0.08 0.08 0.12 0.06 0.04
## [451] 0.14 0.10 0.14 0.04 0.08 0.06 0.14 0.08 0.14 0.02 0.12 0.16 0.02 0.06 0.06
## [466] 0.06 0.14 0.08 0.04 0.18 0.16 0.04 0.04 0.02 0.12 0.02 0.20 0.10 0.18 0.10
## [481] 0.08 0.06 0.04 0.10 0.08 0.08 0.08 0.08 0.08 0.10 0.04 0.08 0.20 0.10 0.02
## [496] 0.12 0.08 0.08 0.16 0.06
hist(estimadores)
mean(estimadores)
## [1] 0.09704
sd(estimadores)
## [1] 0.04107814
Análisis: con una muestra de 50, y 500 repeticiones, teniendo por promedio 0.10.
cal_sample10(n=100)
## [1] 0.06
estimadores= sapply(rep(50,500),cal_sample10)
estimadores
## [1] 0.10 0.08 0.12 0.14 0.10 0.02 0.08 0.12 0.08 0.06 0.12 0.10 0.08 0.10 0.10
## [16] 0.08 0.10 0.10 0.16 0.10 0.06 0.12 0.04 0.14 0.06 0.18 0.14 0.12 0.02 0.12
## [31] 0.08 0.04 0.10 0.12 0.06 0.18 0.10 0.24 0.12 0.12 0.12 0.06 0.10 0.08 0.04
## [46] 0.12 0.08 0.10 0.06 0.14 0.10 0.08 0.22 0.08 0.08 0.06 0.08 0.08 0.10 0.12
## [61] 0.08 0.06 0.08 0.10 0.06 0.08 0.04 0.16 0.16 0.08 0.00 0.16 0.08 0.18 0.12
## [76] 0.02 0.16 0.10 0.12 0.04 0.08 0.14 0.12 0.06 0.18 0.10 0.08 0.12 0.04 0.12
## [91] 0.10 0.12 0.06 0.08 0.08 0.06 0.08 0.04 0.16 0.08 0.08 0.06 0.08 0.08 0.08
## [106] 0.08 0.10 0.20 0.18 0.06 0.08 0.14 0.10 0.16 0.12 0.16 0.06 0.12 0.10 0.08
## [121] 0.06 0.04 0.06 0.16 0.10 0.22 0.06 0.10 0.10 0.06 0.14 0.10 0.08 0.08 0.06
## [136] 0.06 0.06 0.26 0.10 0.10 0.14 0.08 0.08 0.06 0.12 0.08 0.08 0.14 0.12 0.10
## [151] 0.14 0.12 0.12 0.08 0.08 0.12 0.10 0.12 0.10 0.12 0.08 0.12 0.16 0.12 0.08
## [166] 0.12 0.10 0.08 0.16 0.06 0.02 0.12 0.10 0.10 0.12 0.10 0.10 0.08 0.16 0.04
## [181] 0.02 0.08 0.10 0.10 0.14 0.08 0.10 0.08 0.10 0.10 0.14 0.04 0.08 0.18 0.04
## [196] 0.10 0.12 0.04 0.10 0.08 0.18 0.16 0.06 0.10 0.20 0.18 0.08 0.14 0.12 0.08
## [211] 0.04 0.20 0.12 0.14 0.08 0.06 0.06 0.12 0.16 0.08 0.12 0.16 0.18 0.14 0.04
## [226] 0.14 0.10 0.04 0.08 0.14 0.14 0.16 0.14 0.10 0.04 0.08 0.14 0.10 0.12 0.10
## [241] 0.14 0.02 0.10 0.06 0.12 0.14 0.10 0.14 0.12 0.12 0.04 0.16 0.10 0.12 0.12
## [256] 0.12 0.10 0.02 0.08 0.08 0.12 0.10 0.10 0.08 0.08 0.14 0.16 0.10 0.08 0.10
## [271] 0.10 0.04 0.08 0.12 0.14 0.10 0.06 0.06 0.10 0.14 0.04 0.16 0.10 0.12 0.14
## [286] 0.10 0.10 0.16 0.04 0.06 0.08 0.24 0.08 0.10 0.16 0.10 0.04 0.08 0.04 0.10
## [301] 0.08 0.08 0.08 0.08 0.08 0.04 0.16 0.12 0.10 0.02 0.08 0.10 0.08 0.06 0.14
## [316] 0.06 0.12 0.04 0.12 0.06 0.12 0.02 0.08 0.06 0.08 0.18 0.16 0.06 0.12 0.04
## [331] 0.06 0.20 0.12 0.12 0.06 0.20 0.04 0.04 0.04 0.14 0.08 0.06 0.12 0.08 0.00
## [346] 0.24 0.10 0.18 0.14 0.16 0.10 0.06 0.22 0.04 0.08 0.10 0.10 0.08 0.10 0.02
## [361] 0.16 0.06 0.06 0.04 0.08 0.10 0.08 0.04 0.06 0.08 0.16 0.06 0.08 0.08 0.12
## [376] 0.10 0.12 0.04 0.04 0.08 0.12 0.16 0.14 0.12 0.06 0.10 0.04 0.12 0.18 0.08
## [391] 0.14 0.10 0.14 0.16 0.04 0.12 0.06 0.08 0.12 0.14 0.04 0.08 0.12 0.06 0.04
## [406] 0.12 0.10 0.02 0.08 0.18 0.16 0.10 0.12 0.14 0.12 0.12 0.08 0.08 0.06 0.10
## [421] 0.22 0.04 0.12 0.10 0.10 0.12 0.02 0.14 0.10 0.10 0.12 0.06 0.10 0.12 0.12
## [436] 0.12 0.10 0.10 0.10 0.18 0.08 0.08 0.20 0.16 0.08 0.10 0.08 0.08 0.06 0.12
## [451] 0.10 0.02 0.20 0.08 0.12 0.12 0.08 0.14 0.04 0.06 0.08 0.06 0.10 0.04 0.12
## [466] 0.08 0.06 0.06 0.12 0.10 0.12 0.12 0.06 0.04 0.14 0.10 0.24 0.08 0.14 0.12
## [481] 0.06 0.10 0.04 0.06 0.04 0.08 0.12 0.20 0.14 0.08 0.10 0.08 0.16 0.04 0.12
## [496] 0.12 0.18 0.12 0.18 0.10
estimadores5= sapply(rep(5,5000),cal_sample10)
estimadores10= sapply(rep(10,5000),cal_sample10)
estimadores15= sapply(rep(15,5000),cal_sample10)
estimadores20= sapply(rep(20,5000),cal_sample10)
estimadores30= sapply(rep(30,5000),cal_sample10)
estimadores50= sapply(rep(50,5000),cal_sample10)
estimadores60= sapply(rep(60,5000),cal_sample10)
estimadores100= sapply(rep(100,5000),cal_sample10)
estimadores200= sapply(rep(200,5000),cal_sample10)
estimadores500= sapply(rep(500,5000),cal_sample10)
resultados = data.frame(estimadores5,estimadores10,estimadores15,estimadores20,estimadores30,estimadores50,estimadores60,estimadores100,estimadores200,estimadores500)
boxplot(resultados)
abline(h=0.1,col="green",lwd=4)
Se puede ver nuevamente el mismo comportamiento que en la proporción del 50%, mostrando que cada uno de los estimadores orbita cerca al verdadero valor del parametro (10%), pero se ve una disminución en la dispersion de los datos a medida que aumenta el tamaño de la muestra.
lote90=c(rep("Sanas",100),rep("enfermas",900))
head(lote90,100)
## [1] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [10] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [19] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [28] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [37] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [46] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [55] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [64] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [73] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [82] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [91] "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas" "Sanas"
## [100] "Sanas"
cal_sample90 <- function(n){
muestra = sample(lote90,size = n)
promedio = sum(muestra == "enfermas")/n
return(promedio)
}
cal_sample90(n=100)
## [1] 0.92
Se evidencia que ahora la el estimador del promedio tiende a ser del 90%
cal_sample90(n=50)
## [1] 0.84
estimadores= sapply(rep(50,500),cal_sample90)
estimadores
## [1] 0.88 0.82 0.98 0.98 0.84 0.98 0.88 0.94 0.90 0.88 0.88 0.90 0.94 0.86 0.96
## [16] 0.88 0.92 0.84 0.98 0.92 0.86 0.88 0.92 0.84 0.86 0.86 0.94 0.98 0.92 0.94
## [31] 0.94 0.94 0.84 0.94 0.90 0.88 0.86 0.90 0.92 0.94 0.92 0.86 0.90 0.86 0.90
## [46] 0.90 0.86 0.92 0.90 0.98 0.84 0.92 0.94 0.86 0.90 0.84 0.88 0.92 0.90 0.90
## [61] 0.90 0.90 0.92 0.84 0.90 0.78 0.92 0.90 0.94 0.90 0.88 0.94 0.94 0.94 0.84
## [76] 0.88 0.92 0.84 0.96 0.90 0.86 0.92 0.88 0.90 0.90 0.86 0.86 0.86 0.92 0.94
## [91] 0.84 0.88 0.88 0.92 0.88 0.92 0.94 0.92 0.88 0.94 0.92 0.90 0.92 0.86 0.92
## [106] 0.96 0.90 0.92 0.92 0.92 0.84 0.92 0.90 0.88 0.90 0.92 0.92 0.92 0.82 0.90
## [121] 0.86 0.88 0.92 0.86 0.92 0.84 0.90 0.88 0.82 0.94 0.86 0.88 0.90 0.94 0.94
## [136] 0.92 0.96 0.94 0.88 0.90 0.90 0.88 0.94 0.86 0.88 0.94 0.88 0.92 0.88 0.92
## [151] 0.86 0.92 0.94 0.88 0.86 0.86 0.92 0.90 0.88 0.92 0.88 0.86 0.96 0.94 0.92
## [166] 0.92 0.92 0.82 0.92 0.90 0.82 0.94 0.90 0.98 0.90 0.94 0.94 0.90 0.94 0.96
## [181] 0.90 0.80 0.92 0.88 0.86 0.90 0.98 0.88 0.94 0.84 0.94 0.88 0.88 0.92 0.86
## [196] 0.96 0.98 0.94 0.82 0.86 0.90 0.92 0.82 0.88 0.92 0.94 0.94 0.88 0.82 0.86
## [211] 0.94 0.90 0.98 0.94 0.90 0.92 0.88 0.92 0.90 0.90 0.94 0.96 0.88 0.84 0.88
## [226] 0.88 0.90 0.88 0.90 0.96 0.88 0.90 0.86 0.92 0.90 0.94 0.86 0.88 0.90 0.90
## [241] 0.80 0.88 0.90 0.92 0.92 0.90 0.86 0.88 0.88 0.86 0.94 0.94 0.90 0.86 0.86
## [256] 0.86 0.92 0.90 0.90 0.80 0.92 0.88 0.90 0.92 0.90 0.92 0.92 0.86 0.90 0.92
## [271] 0.90 0.80 0.96 0.86 0.86 0.88 0.96 0.90 0.94 0.94 0.86 0.92 0.86 0.92 0.82
## [286] 0.90 0.94 0.92 0.88 0.96 0.90 0.98 0.88 0.90 0.88 0.90 0.90 0.94 0.92 0.92
## [301] 0.96 0.90 0.92 0.94 0.96 0.92 0.92 0.90 0.80 0.86 0.94 0.86 0.88 0.90 0.88
## [316] 0.94 0.86 0.90 0.96 0.88 0.82 0.92 0.86 0.92 0.92 0.88 0.90 0.84 0.90 0.90
## [331] 0.84 0.92 0.92 0.88 0.90 0.88 0.96 0.88 0.90 0.94 0.92 0.84 0.96 0.88 0.94
## [346] 0.98 0.86 0.94 0.84 0.94 0.96 0.94 0.92 0.88 0.88 0.94 0.90 0.92 0.92 0.90
## [361] 0.86 0.82 0.86 0.92 0.92 0.88 0.98 0.90 0.86 0.90 0.90 0.90 0.92 0.98 0.86
## [376] 0.94 0.92 0.88 0.86 0.98 0.80 0.92 0.96 0.88 0.94 0.86 0.88 0.88 0.90 0.90
## [391] 0.92 0.88 0.84 0.92 0.90 0.86 0.90 0.86 0.94 0.92 0.90 0.92 0.90 0.94 0.88
## [406] 0.92 0.90 0.86 0.90 0.90 0.92 0.94 0.94 0.94 0.90 0.96 0.94 0.92 0.88 0.94
## [421] 0.90 0.90 0.90 0.90 0.92 0.98 0.90 0.84 0.92 0.86 0.86 0.94 0.92 0.92 0.92
## [436] 0.86 0.90 0.90 0.96 0.86 0.92 0.84 0.90 0.94 0.96 0.92 0.88 0.94 0.86 0.90
## [451] 0.86 0.88 0.90 0.86 0.78 0.94 0.90 0.94 0.98 0.90 0.96 0.98 0.86 0.94 0.96
## [466] 0.96 1.00 0.92 0.94 0.94 0.88 0.92 0.88 0.84 0.92 0.96 0.98 0.92 0.88 0.92
## [481] 0.96 0.86 0.90 0.96 0.88 0.86 0.88 0.98 0.96 0.92 0.90 0.94 0.86 0.92 0.86
## [496] 0.96 0.96 0.78 0.92 0.96
hist(estimadores)
mean(estimadores)
## [1] 0.9024
sd(estimadores)
## [1] 0.03968614
Análisis: con una muestra de 50, y 500 repeticiones, tendiendo a tener por promedio 0.90 y desviación de 0.04, tiende a distribuirse normal.
cal_sample90(n=100)
## [1] 0.96
estimadores= sapply(rep(50,500),cal_sample90)
estimadores
## [1] 0.90 0.96 0.92 0.94 0.88 0.88 0.88 0.94 0.94 0.86 1.00 0.94 0.88 0.90 0.96
## [16] 0.94 0.90 0.92 0.92 0.96 0.92 0.88 0.86 0.94 0.90 0.86 0.92 0.94 0.84 0.94
## [31] 0.96 0.96 0.96 0.92 0.96 0.88 0.96 0.94 0.96 0.84 0.88 0.92 0.96 0.84 0.94
## [46] 0.92 0.88 0.88 0.88 0.94 0.94 0.96 0.96 0.88 0.90 0.92 0.94 0.94 0.94 0.84
## [61] 0.96 0.90 0.90 0.94 0.94 0.88 0.88 0.86 0.90 0.90 0.96 0.96 0.98 0.84 0.84
## [76] 0.92 0.88 0.88 0.84 0.90 0.96 0.94 0.94 0.82 0.90 0.98 0.88 0.82 0.88 0.86
## [91] 0.88 0.88 1.00 0.88 0.98 0.90 0.88 0.86 0.90 0.88 0.84 0.94 0.86 0.90 0.90
## [106] 0.84 0.94 0.86 0.90 0.88 0.88 0.94 0.90 0.88 0.92 0.90 0.92 0.92 0.98 0.90
## [121] 0.74 0.84 0.90 0.86 0.90 0.90 0.88 0.92 0.92 0.90 0.90 1.00 0.86 0.88 0.94
## [136] 0.94 0.86 0.94 0.92 0.98 0.94 0.90 0.94 0.80 0.94 0.88 0.90 0.88 0.86 0.90
## [151] 0.88 0.84 0.92 0.84 0.90 0.84 0.90 0.82 0.90 0.92 0.90 0.94 0.88 0.92 0.94
## [166] 0.96 0.92 0.86 0.96 0.96 0.86 0.92 0.90 0.88 0.96 0.90 0.88 0.92 0.92 0.94
## [181] 0.86 0.88 0.86 0.94 0.92 0.90 0.88 0.90 0.96 0.96 0.88 0.86 0.88 0.94 0.92
## [196] 0.90 0.90 0.92 0.86 0.96 0.88 0.86 0.90 0.82 0.96 0.84 0.94 0.80 0.86 0.92
## [211] 0.92 0.86 0.92 0.82 0.90 0.94 0.90 0.92 0.82 0.96 0.90 0.98 0.92 0.90 0.90
## [226] 0.88 0.98 0.98 0.98 0.84 0.80 0.90 0.90 0.88 0.94 0.94 0.90 0.92 0.82 0.90
## [241] 0.86 0.90 0.98 0.92 0.84 0.90 0.90 0.88 0.88 0.90 0.88 0.94 0.90 0.86 0.88
## [256] 0.88 0.96 0.88 0.92 0.84 0.92 0.90 0.94 0.90 0.88 0.94 0.88 0.92 0.94 0.98
## [271] 0.90 0.96 0.88 0.96 0.92 0.86 0.88 0.92 0.82 0.90 0.86 0.88 0.92 0.92 0.90
## [286] 0.94 0.84 0.92 0.94 0.84 0.80 0.96 0.86 0.96 0.88 0.92 0.96 0.90 0.92 0.84
## [301] 0.90 0.90 0.92 0.90 0.90 0.94 0.90 0.94 0.80 0.94 0.92 0.94 0.84 0.92 0.84
## [316] 0.84 0.86 0.94 0.86 0.92 0.92 0.84 0.90 0.92 0.88 0.94 0.92 0.88 0.94 0.90
## [331] 0.92 0.92 0.88 0.88 0.86 0.88 0.90 0.94 0.84 0.96 0.90 0.88 0.92 0.84 0.88
## [346] 0.90 0.90 0.92 0.94 0.92 0.92 0.84 0.92 0.88 0.90 0.92 0.94 0.86 0.92 0.92
## [361] 0.86 0.88 0.92 0.78 0.96 0.88 0.92 0.96 0.94 0.96 0.84 0.92 0.96 0.92 0.86
## [376] 0.86 0.90 0.88 0.90 0.92 0.90 0.92 0.90 0.88 0.94 0.88 0.82 0.86 0.90 0.92
## [391] 0.90 0.80 0.94 0.90 0.96 0.90 0.94 0.80 0.90 0.94 0.88 0.92 0.92 0.88 0.94
## [406] 0.92 0.92 0.94 0.94 0.84 0.94 0.92 0.92 0.88 0.90 0.86 0.78 0.94 0.86 0.92
## [421] 0.88 0.92 0.94 1.00 0.86 0.88 0.84 0.86 0.92 0.96 0.94 0.86 0.96 0.92 0.86
## [436] 0.96 0.86 0.86 0.90 0.88 0.94 0.90 0.90 0.90 0.90 0.94 0.84 0.88 0.94 0.96
## [451] 0.78 0.92 0.86 0.86 0.92 0.96 0.82 0.88 0.92 0.94 0.94 0.90 0.90 0.88 0.94
## [466] 0.88 0.90 0.92 0.90 0.90 0.90 0.84 0.96 0.94 0.90 0.92 0.86 0.96 0.96 0.88
## [481] 0.86 0.88 0.86 0.96 0.92 0.90 0.92 0.96 0.88 0.90 0.88 0.86 0.90 0.84 0.86
## [496] 0.90 0.94 0.86 0.92 0.94
estimadores5= sapply(rep(5,5000),cal_sample90)
estimadores10= sapply(rep(10,5000),cal_sample90)
estimadores15= sapply(rep(15,5000),cal_sample90)
estimadores20= sapply(rep(20,5000),cal_sample90)
estimadores30= sapply(rep(30,5000),cal_sample90)
estimadores50= sapply(rep(50,5000),cal_sample90)
estimadores60= sapply(rep(60,5000),cal_sample90)
estimadores100= sapply(rep(100,5000),cal_sample90)
estimadores200= sapply(rep(200,5000),cal_sample90)
estimadores500= sapply(rep(500,5000),cal_sample90)
resultados = data.frame(estimadores5,estimadores10,estimadores15,estimadores20,estimadores30,estimadores50,estimadores60,estimadores100,estimadores200,estimadores500)
boxplot(resultados)
abline(h=0.9,col="green",lwd=4)
Se puede ver nuevamente que todos los estimadores se tienen su media sobre un valor muy cercano al del parametro (90%), sin embargo, a medida que aumenta la muestra, la desviación estandar y por ende, la dispersión de los datos tiende a disminuir.
Conclusión: Análizando el comportamiento de los 3 experimientos, se puede concluir que el efecto que tiene el tamaño de la muestra en la desviación estandar, no depende de la proporción real de casos “enfermos”, mostrando que existe una relación inversa entre el tamaño de la muestra y la desviación estandar.
Lote1 = c(rep("sanas",900),rep("enfermas",100))
Lote2 = c(rep("sanas",1350),rep("enfermas",150))
dif_proms <- function(n){
sample1 = sample(Lote1,n)
sample2 = sample(Lote2,n)
X1 = sum(sample1=="enfermas")/n
X2 = sum(sample2=="enfermas")/n
diferencia = X1-X2
return(diferencia)
}
dif_proms(50)
## [1] 0
dif_proms(n=50)
## [1] 0.06
estimador = sapply(rep(50,500),dif_proms)
estimador
## [1] -0.04 0.02 -0.08 -0.04 -0.06 0.04 0.06 0.04 0.00 -0.02 0.02 0.10
## [13] 0.02 -0.02 -0.04 -0.08 -0.08 0.00 -0.04 -0.06 -0.10 0.08 0.06 0.06
## [25] 0.00 0.08 0.02 0.06 0.04 0.02 -0.04 0.04 0.02 0.06 0.00 0.08
## [37] 0.10 -0.06 0.04 -0.06 -0.08 0.02 0.00 0.08 0.06 0.10 -0.06 -0.06
## [49] -0.04 -0.08 0.00 0.06 0.02 -0.12 -0.02 0.06 0.02 0.06 0.00 0.00
## [61] -0.04 -0.02 0.12 0.10 0.04 -0.04 0.02 -0.02 0.00 0.04 0.04 -0.06
## [73] 0.08 0.04 -0.06 0.04 0.06 -0.02 0.02 0.00 -0.04 -0.02 -0.04 -0.02
## [85] 0.02 0.04 -0.04 -0.04 0.14 0.08 0.14 0.04 -0.10 0.08 0.08 -0.06
## [97] 0.00 0.06 0.00 0.02 -0.12 0.06 -0.04 0.00 -0.06 -0.10 0.04 0.00
## [109] 0.02 -0.06 -0.16 0.02 0.00 0.00 0.10 0.08 0.02 0.04 0.02 0.08
## [121] 0.00 0.06 0.06 -0.14 0.02 0.08 -0.04 -0.02 -0.02 0.00 0.08 0.04
## [133] 0.00 -0.08 -0.06 -0.06 0.16 -0.06 0.06 -0.02 0.02 0.06 0.04 0.02
## [145] 0.02 0.06 0.02 -0.04 0.04 0.04 0.06 0.04 0.04 0.04 0.06 -0.02
## [157] 0.02 0.02 -0.06 0.06 0.06 0.00 -0.06 0.08 0.06 -0.02 0.00 0.00
## [169] 0.00 -0.06 0.00 0.06 0.00 0.06 -0.08 0.04 0.02 0.02 0.00 0.00
## [181] 0.00 0.02 0.08 0.02 0.04 0.02 -0.02 0.02 -0.08 -0.02 0.02 -0.02
## [193] -0.02 -0.06 0.12 -0.10 0.04 -0.08 -0.12 0.02 0.00 0.06 0.00 -0.12
## [205] 0.08 -0.06 -0.06 0.02 0.02 0.02 0.04 -0.02 -0.06 0.10 0.10 -0.02
## [217] 0.00 0.00 -0.10 0.00 0.08 0.00 0.02 -0.08 0.04 0.06 0.00 0.08
## [229] 0.02 0.00 0.02 0.00 0.06 0.04 0.02 0.06 -0.08 -0.02 0.04 -0.06
## [241] 0.00 0.04 -0.02 0.04 0.00 0.00 -0.02 -0.16 0.04 0.02 0.06 -0.04
## [253] -0.08 0.04 0.04 -0.02 0.00 0.10 0.02 -0.04 -0.04 0.00 -0.02 -0.08
## [265] 0.04 -0.10 0.00 -0.02 -0.06 0.00 0.02 0.00 -0.06 -0.02 -0.02 -0.18
## [277] 0.12 0.04 -0.04 -0.06 0.00 -0.02 0.10 0.02 -0.02 -0.04 -0.06 0.00
## [289] 0.10 0.02 0.10 0.10 0.00 -0.02 -0.06 0.06 0.06 0.08 -0.06 -0.04
## [301] -0.08 -0.02 0.02 0.00 0.04 0.00 -0.02 0.04 -0.02 -0.06 0.10 0.00
## [313] -0.16 -0.08 0.04 0.08 0.06 0.02 -0.10 -0.02 -0.10 -0.10 -0.04 -0.06
## [325] 0.16 0.10 0.02 0.02 -0.08 0.04 0.06 -0.10 0.00 0.06 0.00 -0.06
## [337] 0.00 -0.04 0.00 0.00 0.04 -0.10 0.00 0.04 0.02 0.00 -0.08 -0.02
## [349] -0.04 -0.02 0.02 -0.04 0.02 -0.04 0.00 0.06 0.00 0.02 0.02 -0.06
## [361] -0.16 0.02 -0.02 -0.04 0.10 -0.04 0.00 0.02 0.00 0.00 0.00 0.04
## [373] 0.08 0.04 -0.08 0.08 0.10 -0.08 -0.04 0.00 0.02 0.02 0.08 0.06
## [385] 0.00 -0.04 0.06 0.00 0.00 -0.06 -0.04 -0.04 0.06 -0.02 0.02 0.04
## [397] -0.08 -0.02 0.04 -0.06 -0.02 -0.04 0.08 0.02 0.02 -0.08 -0.06 -0.08
## [409] -0.12 -0.04 0.00 0.00 -0.02 0.06 0.06 -0.02 0.10 0.06 0.00 0.02
## [421] 0.04 -0.06 -0.02 -0.02 -0.06 0.04 -0.10 -0.02 0.06 -0.02 0.00 0.00
## [433] 0.10 0.08 0.08 0.04 -0.04 -0.04 0.02 -0.04 -0.10 -0.06 0.06 0.06
## [445] 0.02 -0.08 0.04 0.04 0.02 -0.06 0.02 -0.02 -0.08 0.04 0.12 0.12
## [457] 0.06 0.04 0.04 0.06 -0.02 -0.04 -0.02 0.00 -0.02 -0.02 0.04 0.00
## [469] -0.08 0.00 0.02 -0.08 -0.04 0.02 0.04 -0.10 0.02 0.00 0.02 0.04
## [481] 0.04 0.02 0.00 -0.06 0.00 -0.04 0.04 -0.02 0.00 -0.06 -0.02 -0.10
## [493] 0.12 -0.06 0.06 0.00 0.06 -0.04 0.02 -0.04
hist(estimador)
Análisis: Se puede ver que la distribución de las diferencias de
proporciones esta centrada en el 0, lo cual indica NO que existe una
diferencia entre los individuos “enfermos” de P1 y de P2.
estimadores5= sapply(rep(5,5000),dif_proms)
estimadores10= sapply(rep(10,5000),dif_proms)
estimadores15= sapply(rep(15,5000),dif_proms)
estimadores20= sapply(rep(20,5000),dif_proms)
estimadores30= sapply(rep(30,5000),dif_proms)
estimadores50= sapply(rep(50,5000),dif_proms)
estimadores60= sapply(rep(60,5000),dif_proms)
estimadores100= sapply(rep(100,5000),dif_proms)
estimadores200= sapply(rep(200,5000),dif_proms)
estimadores500= sapply(rep(500,5000),dif_proms)
resultados = data.frame(estimadores5,estimadores10,estimadores15,estimadores20,estimadores30,estimadores50,estimadores60,estimadores100,estimadores200,estimadores500)
boxplot(resultados)
abline(h=0.0,col="green",lwd=4)
Análisis: Al graficar los estimadores de diferencia de promedios se puede ver nuevamente que la dispersión de los datos tiende a diminuir a medida que aumenta el tamaño de la muestra, lo cual esta alineado con lo encontrado en el punto 1. Por otro lado,se puede ver todos las medias de los estimadores estan sobre línea 0, lo cúal indica que estadisticamente las dos proporciones no son diferentes, y esto hace sentido al análisis, ya que los dos parametros (P1 y P2) son iguales (10%)
Lote12 = c(rep("sanas",900),rep("enfermas",100))
Lote22 = c(rep("sanas",1275),rep("enfermas",225))
dif_proms2 <- function(n){
sample1 = sample(Lote12,n)
sample2 = sample(Lote22,n)
X1 = sum(sample1=="enfermas")/n
X2 = sum(sample2=="enfermas")/n
diferencia = X1-X2
return(diferencia)
}
dif_proms(50)
## [1] 0.08
dif_proms(n=50)
## [1] -0.06
estimador = sapply(rep(50,500),dif_proms2)
estimador
## [1] -0.10 -0.04 0.06 -0.04 -0.06 0.02 -0.06 -0.08 -0.02 -0.12 -0.04 -0.18
## [13] -0.02 -0.04 0.08 -0.04 -0.04 -0.02 -0.06 -0.06 0.04 -0.06 0.04 0.04
## [25] -0.10 -0.04 -0.04 -0.02 -0.06 0.06 -0.10 -0.08 -0.14 -0.04 -0.06 -0.08
## [37] -0.02 -0.02 -0.08 -0.06 -0.06 -0.02 -0.10 -0.04 -0.02 -0.08 -0.02 -0.04
## [49] 0.02 -0.02 -0.14 0.00 -0.12 0.00 -0.06 0.00 0.04 -0.10 0.14 0.00
## [61] -0.04 0.02 -0.06 -0.04 -0.14 -0.10 -0.02 0.04 -0.14 -0.18 -0.04 -0.16
## [73] -0.04 -0.10 -0.04 -0.02 0.00 -0.20 -0.10 -0.02 -0.02 -0.10 -0.16 -0.08
## [85] -0.04 -0.06 -0.06 -0.06 0.04 -0.14 -0.10 0.00 0.04 -0.04 -0.06 -0.06
## [97] 0.04 -0.04 -0.06 -0.02 0.00 -0.14 -0.10 -0.02 -0.10 0.08 -0.18 0.10
## [109] 0.02 0.02 -0.06 -0.10 0.00 -0.06 -0.02 -0.16 0.08 0.04 -0.02 0.02
## [121] -0.18 -0.02 -0.12 -0.04 -0.12 -0.04 -0.04 0.04 0.00 -0.10 -0.06 0.00
## [133] -0.04 -0.12 0.10 -0.06 -0.18 -0.04 -0.12 0.02 -0.02 -0.02 -0.02 0.00
## [145] -0.02 -0.08 -0.08 -0.06 -0.04 -0.02 -0.08 -0.04 0.04 -0.10 -0.12 -0.08
## [157] -0.12 -0.08 -0.10 -0.06 -0.06 -0.06 -0.14 -0.10 0.02 -0.08 -0.04 -0.06
## [169] -0.06 -0.02 0.02 0.00 -0.06 -0.10 -0.06 -0.16 -0.06 -0.22 0.02 -0.04
## [181] 0.02 -0.14 -0.06 -0.04 -0.08 0.00 -0.14 0.02 -0.08 -0.06 -0.02 -0.12
## [193] -0.10 0.02 -0.16 -0.08 -0.08 -0.04 -0.02 -0.10 -0.02 -0.18 -0.12 0.00
## [205] 0.02 -0.04 -0.06 -0.06 -0.04 -0.12 -0.08 -0.02 -0.18 0.00 -0.08 -0.08
## [217] 0.02 -0.12 0.00 -0.04 -0.06 0.04 -0.04 -0.08 -0.12 -0.06 0.06 -0.04
## [229] -0.04 0.00 0.00 0.08 -0.06 -0.04 -0.02 -0.02 -0.22 -0.08 -0.16 -0.02
## [241] -0.16 -0.06 0.04 -0.12 -0.04 -0.08 0.00 -0.02 -0.06 -0.08 -0.04 0.00
## [253] -0.08 0.00 0.02 0.04 0.08 -0.06 -0.02 -0.02 0.06 -0.10 0.02 -0.02
## [265] -0.08 -0.12 0.00 -0.04 -0.04 -0.04 -0.06 -0.14 0.00 -0.14 -0.06 0.02
## [277] -0.10 0.00 -0.08 0.06 -0.10 0.00 -0.04 -0.20 -0.04 -0.06 -0.08 -0.08
## [289] -0.10 -0.10 -0.14 -0.06 -0.10 -0.08 -0.02 -0.06 0.04 0.02 0.04 -0.02
## [301] -0.02 0.12 -0.24 0.04 0.04 -0.06 0.00 0.04 -0.12 -0.02 -0.08 -0.08
## [313] 0.06 -0.14 -0.04 -0.04 -0.12 -0.14 -0.16 0.14 -0.08 -0.10 0.00 -0.04
## [325] 0.12 0.00 -0.06 -0.18 0.12 -0.02 0.08 -0.06 -0.18 -0.08 -0.06 -0.10
## [337] -0.02 0.08 0.00 -0.06 -0.02 -0.14 -0.04 -0.04 0.08 0.00 -0.18 -0.12
## [349] -0.12 0.02 -0.06 -0.02 0.04 -0.04 -0.02 0.04 -0.02 0.00 0.04 -0.08
## [361] 0.00 -0.04 -0.04 -0.06 0.00 -0.12 -0.04 -0.12 -0.04 0.00 -0.08 -0.06
## [373] -0.06 0.00 -0.02 -0.14 -0.04 -0.06 -0.06 0.00 -0.10 -0.02 -0.10 -0.06
## [385] 0.02 0.00 -0.08 -0.04 -0.08 -0.04 0.02 -0.04 -0.10 0.06 0.00 -0.02
## [397] -0.06 -0.10 -0.08 0.00 -0.02 -0.10 -0.08 -0.06 -0.06 -0.06 -0.08 -0.06
## [409] -0.06 -0.06 -0.08 0.00 0.00 -0.08 -0.02 0.06 -0.04 -0.10 0.02 -0.10
## [421] 0.12 -0.08 -0.02 -0.14 0.04 -0.22 0.08 -0.10 -0.12 -0.10 -0.12 -0.02
## [433] -0.12 0.02 -0.06 -0.04 -0.02 0.06 -0.04 0.00 0.00 -0.04 -0.16 -0.10
## [445] -0.08 -0.02 -0.14 -0.04 0.02 -0.04 -0.10 0.08 -0.08 0.04 0.00 -0.02
## [457] -0.10 -0.02 -0.14 -0.06 -0.12 -0.06 -0.06 0.08 0.06 0.06 -0.10 -0.10
## [469] -0.10 -0.06 -0.10 0.02 -0.08 0.02 -0.02 -0.12 -0.06 0.08 0.06 -0.08
## [481] -0.08 -0.18 -0.02 -0.08 -0.12 -0.08 -0.10 -0.06 0.00 -0.04 0.06 -0.16
## [493] -0.04 0.04 -0.08 -0.14 -0.02 -0.02 0.04 -0.22
hist(estimador)
Análisis: Se puede ver que la distribución de las diferencias de
proporciones esta centrada a la izquierda del 0, lo cual indica que
existe una diferencia entre los individuos “enfermos” de P1 y de P2
estimadores5= sapply(rep(5,5000),dif_proms2)
estimadores10= sapply(rep(10,5000),dif_proms2)
estimadores15= sapply(rep(15,5000),dif_proms2)
estimadores20= sapply(rep(20,5000),dif_proms2)
estimadores30= sapply(rep(30,5000),dif_proms2)
estimadores50= sapply(rep(50,5000),dif_proms2)
estimadores60= sapply(rep(60,5000),dif_proms2)
estimadores100= sapply(rep(100,5000),dif_proms2)
estimadores200= sapply(rep(200,5000),dif_proms2)
estimadores500= sapply(rep(500,5000),dif_proms2)
resultados = data.frame(estimadores5,estimadores10,estimadores15,estimadores20,estimadores30,estimadores50,estimadores60,estimadores100,estimadores200,estimadores500)
boxplot(resultados)
abline(h=0.0,col="green",lwd=4)
Análisis: Al analizar el gráfico de cajas para los estimadores, se puede ver nuevamente la relación entre el tamaño de la muestra y la dispersión de los datos, sin embargo, se puede ver que las medias de cada uno de los estimadores esta por debajo del 0, lo cual muestra que la proporción de individuos “enfermos” en la P1 es inferior que los “enfermos” de P2.