El Teorema del Límite Central es uno de los más importantes en la inferencia estadística y habla sobre la convergencia de los estimadores como la proporción muestral a la distribución normal. Algunos autores afirman que esta aproximación es bastante buena a partir del umbral n>30 .
A continuación se describen los siguientes pasos para su verificación:
Realice una simulación en la cual genere una población de n=1000 (Lote), donde el porcentaje de individuos (supongamos plantas) enfermas sea del 50%.
Genere una función que permita: Obtener una muestra aleatoria de la población y Calcule el estimador de la proporción muestral pˆ para un tamaño de muestra dado n.
Repita el escenario anterior (b) n=500 veces y analice los resultados en cuanto al comportamiento de los 500 resultados del estimador pˆ. ¿Qué tan simétricos o sesgados son los resultados obtenidos? y ¿qué se puede observar en cuanto a la variabilidad?. Realice en su informe un comentario sobre los resultados obtenidos.
Repita los puntos b y c para tamaños de muestra n=5, 10, 15, 20, 30, 50, 60, 100, 200, 500. Compare los resultados obtenidos para los diferentes tamaños de muestra en cuanto a la normalidad. Utilice pruebas de bondad y ajuste (shapiro wilks :shspiro.test()) y métodos gráficos (gráfico de normalidad: qqnorm()). Comente en su informe los resultados obtenidos
Repita toda la simulación (puntos a – d), pero ahora para lotes con 10% de plantas enfermas y de nuevo para lotes con un 90% de plantas enfermas. Concluya sobre los resultados del ejercicio
Se realizar el calculo con una distribución binomial:
## [1] 1 0 1 1 1 1 1 1 0 1 1 1 0 0 1 1 1 1 1 1 1 1 1 0 1 1 0 0 0 0 0 1 1 1 1 0 1
## [38] 1 0 1 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 1 1 0 1 1 0 1 0 0 1 0 1 1 1 0 0 0 0 1
## [75] 1 1 0 1 1 1 0 1 1 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 1 1 1 0 0 1 0 1 0 0 1 1 0
## [112] 1 1 1 0 0 0 0 1 0 1 0 1 0 0 1 1 1 1 1 1 1 0 0 0 0 1 0 0 0 0 1 1 0 1 1 1 0
## [149] 1 0 0 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0 1 1 1 1 0 1 0 1 0 0 1
## [186] 1 0 1 0 1 0 0 0 0 1 1 0 0 1 0 1 0 1 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1
## [223] 0 1 0 0 1 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 0 1 1 1 1 1 1 1 0 1 1 1 0 1 1 0 1
## [260] 0 1 1 1 0 0 1 1 1 0 0 1 1 1 1 0 1 1 0 1 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 1 1
## [297] 1 0 1 0 0 1 0 0 1 1 0 1 0 1 1 0 1 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 0
## [334] 1 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 1 0 1 0 1 1 1 1 0 0 0 0 1 0 0 0 1 0 1
## [371] 0 0 1 1 1 1 0 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 1 1 1 0 1 0 0 1 0 1
## [408] 0 1 0 1 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 1 0 1 1 0 1 0 1 0 0 1 1 1 0 0 1 1 1
## [445] 1 1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 1 0 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 0 1
## [482] 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 1 1 1 1 0 1 0 1 0 1 1 1 0 1
## [519] 1 0 1 0 1 1 0 0 0 1 0 1 1 0 0 0 1 0 0 0 1 1 0 1 1 0 1 0 0 1 0 0 1 0 0 0 0
## [556] 0 1 0 0 1 1 1 1 1 0 1 0 0 0 1 1 0 1 1 0 1 1 1 0 0 1 0 1 1 1 1 0 1 1 1 1 1
## [593] 1 0 0 0 1 0 1 0 1 1 0 1 0 1 0 1 1 0 0 0 0 0 1 0 1 1 0 1 0 0 1 0 1 0 1 0 0
## [630] 0 0 1 0 1 1 1 0 0 0 0 1 0 1 1 1 1 1 1 0 0 0 0 0 0 1 0 1 1 1 1 1 1 1 0 1 1
## [667] 1 0 0 0 1 1 1 1 1 0 0 1 1 1 1 0 1 1 0 1 0 0 0 0 1 1 0 0 1 1 0 1 1 0 1 0 0
## [704] 0 0 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 1 0 1 1 0
## [741] 1 0 1 0 1 1 1 0 1 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 1 1 1 1 0 0 1 0 1 0
## [778] 1 1 0 0 1 1 1 1 0 0 1 0 1 1 1 1 1 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 1 1 1 0 1
## [815] 1 0 0 0 1 1 0 1 1 1 1 1 0 1 1 0 0 1 1 1 0 0 1 0 0 0 0 0 0 1 0 0 0 1 1 0 1
## [852] 1 0 1 1 1 0 0 1 1 0 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 0 1 1 1 0 1 1 1 0 0 1 0
## [889] 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 1 1 1 0 0 0
## [926] 0 0 0 1 0 1 0 1 1 0 0 1 0 0 1 1 1 0 0 0 1 0 0 0 0 0 1 1 0 0 1 0 0 1 1 0 0
## [963] 0 0 1 0 1 0 1 0 1 1 1 1 1 0 0 0 1 0 0 1 1 1 1 1 1 0 1 1 1 0 1 1 0 1 0 0 0
## [1000] 0
la población tiene la siguiente estructura:
Se selecciona una muestra aleatoria entre 1 y 1000 de la problación y se hace el calculo del estimador p.
Para una muestra aleatoria de : 400,
el estimador p es :
0.52
atraves de una función “calculomedia” :
calculomedia=function(a,b) { muestra_alea=sample(a, size = b, replace = FALSE) media_estimador=mean(muestra_alea) return(media_estimador) }
# Crear un vector vacío
vector_p <- c()
for(i in 1:500)
{
y=calculomedia(poblacion,m)
vector_p=c(vector_p,y)
}
print (vector_p)
## [1] 0.5600 0.5175 0.5350 0.5075 0.5050 0.5450 0.4650 0.5350 0.5275 0.5000
## [11] 0.5200 0.5100 0.5050 0.5500 0.5450 0.5100 0.5225 0.5100 0.5175 0.5050
## [21] 0.5175 0.5175 0.5225 0.4850 0.5175 0.5000 0.5325 0.5625 0.5125 0.4975
## [31] 0.5225 0.5050 0.4800 0.5575 0.4550 0.5275 0.5325 0.5050 0.4925 0.5275
## [41] 0.5025 0.5075 0.5100 0.5300 0.5250 0.5075 0.5000 0.5350 0.5400 0.5300
## [51] 0.4975 0.5225 0.5150 0.5000 0.5350 0.5425 0.5025 0.5325 0.5375 0.4850
## [61] 0.5225 0.5075 0.5450 0.5150 0.5175 0.5425 0.4850 0.4950 0.5200 0.5125
## [71] 0.5100 0.5225 0.5300 0.5125 0.5075 0.5100 0.5125 0.5575 0.5200 0.5325
## [81] 0.5200 0.5050 0.5375 0.5250 0.5000 0.5400 0.5275 0.5000 0.5075 0.5250
## [91] 0.5100 0.5100 0.5000 0.4875 0.5025 0.4725 0.4850 0.5075 0.5325 0.5275
## [101] 0.5250 0.4950 0.5175 0.5000 0.4900 0.4875 0.5200 0.5425 0.5350 0.5175
## [111] 0.5100 0.5450 0.5050 0.5250 0.5075 0.5600 0.5175 0.5250 0.5225 0.5450
## [121] 0.5350 0.5125 0.5150 0.5325 0.5225 0.5050 0.5375 0.5500 0.5200 0.5075
## [131] 0.5125 0.5150 0.5200 0.5150 0.5025 0.5125 0.5375 0.5075 0.5100 0.5075
## [141] 0.5400 0.4975 0.5375 0.5400 0.5100 0.4800 0.5250 0.5225 0.5050 0.5425
## [151] 0.5125 0.5475 0.5425 0.5050 0.5025 0.5300 0.5375 0.5250 0.5375 0.4925
## [161] 0.5200 0.5150 0.5225 0.5175 0.5300 0.5275 0.5100 0.5300 0.5150 0.5000
## [171] 0.5150 0.4900 0.5450 0.4700 0.5050 0.5050 0.5200 0.4925 0.4950 0.5250
## [181] 0.5200 0.5250 0.5275 0.5550 0.5300 0.4875 0.5200 0.5225 0.5450 0.5350
## [191] 0.5175 0.5000 0.5100 0.5325 0.5350 0.5100 0.5175 0.5125 0.5250 0.5125
## [201] 0.5050 0.5425 0.5125 0.5025 0.5250 0.5175 0.5375 0.5050 0.5175 0.5250
## [211] 0.5050 0.4975 0.4825 0.5150 0.5225 0.5325 0.5025 0.5200 0.5100 0.5300
## [221] 0.5650 0.5200 0.5150 0.5150 0.5450 0.4850 0.5350 0.5625 0.5325 0.5050
## [231] 0.5150 0.5400 0.5250 0.4950 0.5025 0.4750 0.5275 0.5200 0.5375 0.5200
## [241] 0.5275 0.5100 0.5075 0.5400 0.4925 0.4800 0.5175 0.4750 0.5225 0.5150
## [251] 0.5600 0.5225 0.5300 0.5075 0.4900 0.5450 0.4975 0.5150 0.5150 0.4975
## [261] 0.5075 0.5375 0.5075 0.4800 0.5350 0.4825 0.5150 0.5225 0.5050 0.5350
## [271] 0.5325 0.5200 0.4925 0.4850 0.5350 0.5325 0.4825 0.5125 0.4950 0.5425
## [281] 0.5025 0.4975 0.5450 0.5275 0.5425 0.4875 0.5100 0.5700 0.5225 0.5500
## [291] 0.5050 0.5350 0.5000 0.5375 0.5050 0.4900 0.5150 0.4975 0.5550 0.5475
## [301] 0.5075 0.5350 0.4975 0.5300 0.5050 0.5050 0.5250 0.5150 0.5325 0.5025
## [311] 0.5000 0.5450 0.5475 0.4950 0.5025 0.5325 0.5100 0.5275 0.4900 0.5050
## [321] 0.5000 0.5125 0.5500 0.4975 0.5250 0.4775 0.5125 0.5125 0.4825 0.5150
## [331] 0.4950 0.5250 0.5025 0.5200 0.5150 0.5225 0.5400 0.5550 0.5200 0.5450
## [341] 0.5250 0.5300 0.5250 0.4900 0.5200 0.4850 0.5050 0.4725 0.5250 0.5000
## [351] 0.5625 0.4900 0.5500 0.5200 0.5375 0.4850 0.4975 0.5100 0.4950 0.5175
## [361] 0.5450 0.5350 0.5225 0.5125 0.5100 0.5225 0.5400 0.4975 0.5050 0.5225
## [371] 0.5200 0.5650 0.5450 0.5175 0.5250 0.4975 0.5150 0.5150 0.5075 0.4900
## [381] 0.5150 0.5625 0.4975 0.5425 0.5500 0.4975 0.4850 0.5275 0.5225 0.4750
## [391] 0.4775 0.5375 0.5375 0.5500 0.5100 0.5525 0.5425 0.4975 0.5050 0.4975
## [401] 0.5325 0.5450 0.5300 0.4775 0.5000 0.5100 0.5100 0.4950 0.5175 0.5150
## [411] 0.4950 0.5225 0.5375 0.5150 0.5450 0.5225 0.5225 0.5125 0.5275 0.4925
## [421] 0.5075 0.4825 0.5000 0.5025 0.4800 0.4850 0.4950 0.5500 0.5850 0.5275
## [431] 0.5500 0.5350 0.5100 0.5000 0.5475 0.5200 0.5100 0.5275 0.4950 0.5225
## [441] 0.5025 0.5600 0.5025 0.4825 0.5275 0.5150 0.4975 0.5200 0.4875 0.4950
## [451] 0.5300 0.5050 0.5250 0.5100 0.5050 0.4925 0.5100 0.5450 0.5175 0.5450
## [461] 0.5100 0.4975 0.5275 0.5250 0.5100 0.4950 0.5150 0.5275 0.5325 0.5125
## [471] 0.4950 0.4950 0.5125 0.5375 0.5450 0.5150 0.5150 0.4850 0.5125 0.4875
## [481] 0.5175 0.5175 0.4875 0.5300 0.5025 0.5025 0.5150 0.5000 0.4975 0.5475
## [491] 0.5325 0.5525 0.5200 0.5350 0.5150 0.5425 0.5175 0.5100 0.5000 0.5125
media_p=mean(vector_p)
sesgo_m=media_p-0.5
varianza_m=var(vector_p)
La media del estimado p, para una iteración de 500 muestras
aleatorias es : 0.51687
El sesgo es : 0.01687
La varianza es
de : 4^{-4}
boxplot(vector_p)
abline(h=0.5,col="RED",lty = 2)
d=density(vector_p)
q=paste("n=",500)
plot(d, main=" ", xlab=q)
abline(v=0.5, col="red",lty = 2)
#### Crear el gráfico Q-Q normal
qqnorm(vector_p)
#### Agregar una línea de referencia
qqline(vector_p)
n1=5
n2=10
n3=20
n4=30
n5=50
n6=60
n7=200
n8=500
x5=calculomedia(poblacion,n1)
x10=calculomedia(poblacion,n2)
x20=calculomedia(poblacion,n3)
x30=calculomedia(poblacion,n4)
x50=calculomedia(poblacion,n5)
x60=calculomedia(poblacion,n6)
x200=calculomedia(poblacion,n7)
x500=calculomedia(poblacion,n8)
base=data.frame(x5,x10,x20,x30,x50,x60,x200,x500)
q=print(base)
## x5 x10 x20 x30 x50 x60 x200 x500
## 1 0.4 0.7 0.55 0.4666667 0.66 0.45 0.485 0.516
Los estimadores p para las muestras son :
muestra 5 :
0.4
muestra 10 : 0.7
muestra 20 : 0.55
muestra 30 :
0.4666667
muestra 50 : 0.66
muestra 60 : 0.45
muestra 200
: 0.485
muestra 500 : 0.516
matriz=matrix(data=1:4000,nrow=500,ncol=8)
matriz_p=matrix(,nrow=1,ncol=8)
muestrasm=data.frame(5,10,20,30,50,60,200,500)
for(j in 1:8)
{
for(i in 1:500)
{
matriz[i,j]=calculomedia(poblacion,as.numeric(muestrasm[j]))
}
matriz_p[1,j]=colMeans(matriz)[j]
}
datos=as.data.frame(matriz)
boxplot(datos,names =muestrasm,xlab="No de muestras",ylab="Estimador p" )
abline(h=0.5)
ba5=shapiro.test(datos$V1)
ba10=shapiro.test(datos$V2)
ba20=shapiro.test(datos$V3)
ba30=shapiro.test(datos$V4)
ba50=shapiro.test(datos$V5)
ba60=shapiro.test(datos$V6)
ba200=shapiro.test(datos$V7)
ba500=shapiro.test(datos$V8)
## graficos
layout(matrix(c(1,2,3,4),nrow=2))
qqnorm(datos$V1)
qqline(datos$V1)
qqnorm(datos$V2)
qqline(datos$V2)
qqnorm(datos$V3)
qqline(datos$V3)
qqnorm(datos$V4)
qqline(datos$V4)
qqnorm(datos$V5)
qqline(datos$V5)
qqnorm(datos$V6)
qqline(datos$V6)
qqnorm(datos$V7)
qqline(datos$V7)
qqnorm(datos$V8)
qqline(datos$V8)
Prueba Bonda y ajuste para n=5, el estadistico W es : 0.9271662 y el
valor p es : 7.4043944^{-15}
Prueba Bonda y ajuste para n=10, el
estadistico W es : 0.9635513 y el valor p es : 8.4523865^{-10}
Prueba Bonda y ajuste para n=20 el estadistico W es : 0.9777528 y el
valor p es : 6.5474616^{-7}
Prueba Bonda y ajuste para n=30 el
estadistico W es : 0.9865657 y el valor p es : 1.4404084^{-4}
Prueba
Bonda y ajuste para n=50 el estadistico W es : 0.9907779 y el valor p es
: 0.0032499
Prueba Bonda y ajuste para n=60 el estadistico W es :
0.99149 y el valor p es : 0.0057314
Prueba Bonda y ajuste para n=200
el estadistico W es : 0.9957245 y el valor p es : 0.1911715
Prueba
Bonda y ajuste para n=500 el estadistico W es : 0.9960816 y el valor p
es : 0.253367
En las pruebas realizadas, se puede concluir que: a medida que el número de muestras aumenta el estadistico W aumenta y el valor_p tambien lo hace por lo tanto se hace más fuerte la normalidad de las variables.
Se realizar el calculo con una distribución binomial:
## [1] 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## [38] 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## [75] 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
## [112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0
## [149] 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0
## [186] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## [223] 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [260] 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0
## [297] 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [334] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [371] 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
## [408] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [445] 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 1 0 0 0 1 0 0 0 0 1 0 0
## [482] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## [519] 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1
## [556] 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0
## [593] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0
## [630] 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
## [667] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1
## [704] 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0
## [741] 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## [778] 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [815] 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## [852] 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0
## [889] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## [926] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 1 1
## [963] 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## [1000] 0
la población tiene la siguiente estructura:
Se selecciona una muestra aleatoria entre 1 y 1000 de la problación y se hace el calculo del estimador p.
Para una muestra aleatoria de : 400,
el estimador p es :
0.11
atraves de una función “calculomediae” :
calculomediae=function(c,d) { muestra_aleae=sample(c, size = d, replace = FALSE) media_estimadore=mean(muestra_aleae) return(media_estimadore) }
# Crear un vector vacío
vector_pe <- c()
for(i in 1:500)
{
ye=calculomediae(poblacione,me)
vector_pe=c(vector_pe,ye)
}
print (vector_pe)
## [1] 0.0900 0.1025 0.0825 0.1250 0.0900 0.0900 0.1150 0.1075 0.0875 0.0875
## [11] 0.0850 0.1000 0.0975 0.1000 0.1000 0.0875 0.1075 0.0975 0.0950 0.0950
## [21] 0.0875 0.0950 0.1025 0.1025 0.0825 0.0950 0.0875 0.0850 0.0875 0.1150
## [31] 0.0875 0.1000 0.1075 0.0975 0.0925 0.0925 0.0850 0.0925 0.1050 0.0800
## [41] 0.1075 0.0875 0.0975 0.0975 0.1025 0.0875 0.1000 0.0925 0.1025 0.1050
## [51] 0.0850 0.0925 0.0825 0.0950 0.0925 0.1050 0.1025 0.0975 0.1200 0.0975
## [61] 0.1150 0.0900 0.0925 0.1200 0.0925 0.1175 0.0950 0.0950 0.1250 0.1075
## [71] 0.1250 0.1150 0.0825 0.0775 0.1050 0.1000 0.1075 0.0900 0.1000 0.1025
## [81] 0.0900 0.1050 0.0925 0.1150 0.0875 0.0975 0.1000 0.1075 0.1050 0.1175
## [91] 0.1100 0.0825 0.0875 0.0825 0.0950 0.0925 0.0800 0.1000 0.0950 0.1075
## [101] 0.0825 0.0800 0.0950 0.0875 0.0975 0.0925 0.1175 0.0900 0.1200 0.0950
## [111] 0.1075 0.1025 0.0750 0.0925 0.1000 0.0925 0.1050 0.0875 0.0950 0.0975
## [121] 0.1150 0.0925 0.0950 0.1025 0.0750 0.0775 0.0900 0.0850 0.0850 0.0950
## [131] 0.1075 0.1025 0.0850 0.1050 0.0825 0.1000 0.0875 0.0950 0.1025 0.0900
## [141] 0.0950 0.0650 0.1075 0.1200 0.1000 0.1025 0.0975 0.1050 0.1100 0.0925
## [151] 0.1100 0.0850 0.1125 0.1275 0.1250 0.1100 0.1025 0.0925 0.1275 0.1225
## [161] 0.0800 0.1100 0.1025 0.0850 0.0925 0.1050 0.0775 0.1000 0.0925 0.0850
## [171] 0.0825 0.1000 0.0800 0.0925 0.0775 0.0750 0.0925 0.1075 0.0850 0.1100
## [181] 0.1025 0.0875 0.1200 0.1075 0.0825 0.1000 0.0975 0.0975 0.0850 0.0875
## [191] 0.1025 0.0975 0.0925 0.1050 0.0850 0.1000 0.0975 0.1025 0.0900 0.1025
## [201] 0.0950 0.0950 0.0875 0.1050 0.0650 0.0950 0.1025 0.1175 0.1050 0.0975
## [211] 0.1050 0.0850 0.1000 0.0750 0.1025 0.1025 0.1025 0.1050 0.1100 0.1250
## [221] 0.0975 0.1100 0.1025 0.1125 0.0900 0.0775 0.0875 0.1050 0.1175 0.1000
## [231] 0.0800 0.1025 0.1025 0.0750 0.0900 0.1100 0.0950 0.0925 0.0900 0.1075
## [241] 0.1025 0.0850 0.0925 0.1025 0.0975 0.0850 0.1050 0.0950 0.0925 0.0900
## [251] 0.0800 0.1000 0.1100 0.1050 0.0900 0.0975 0.1125 0.1000 0.1000 0.0900
## [261] 0.0975 0.0900 0.1050 0.1075 0.1000 0.0775 0.0975 0.0800 0.0825 0.1000
## [271] 0.1050 0.1125 0.0975 0.0950 0.1125 0.0875 0.0950 0.0900 0.1075 0.1000
## [281] 0.0900 0.1150 0.0900 0.1250 0.0875 0.0750 0.0900 0.1050 0.1025 0.0925
## [291] 0.0950 0.1000 0.0875 0.0900 0.1000 0.0775 0.1025 0.0900 0.0850 0.1050
## [301] 0.0900 0.0950 0.0900 0.0950 0.0775 0.1300 0.0800 0.0925 0.0925 0.0975
## [311] 0.0975 0.0850 0.0750 0.1000 0.0950 0.0800 0.1300 0.1025 0.0850 0.1000
## [321] 0.0900 0.0850 0.0775 0.1125 0.1175 0.0875 0.0925 0.1100 0.0975 0.0875
## [331] 0.1275 0.1075 0.0950 0.0950 0.1000 0.0950 0.0975 0.1050 0.1050 0.0975
## [341] 0.0875 0.0850 0.1000 0.1075 0.1225 0.0875 0.0825 0.1050 0.1175 0.1000
## [351] 0.0875 0.1050 0.0775 0.1000 0.1025 0.0950 0.0800 0.0975 0.1025 0.0850
## [361] 0.0975 0.0925 0.0900 0.0925 0.1000 0.0850 0.0700 0.0850 0.1075 0.0925
## [371] 0.0900 0.1000 0.1025 0.0925 0.0950 0.0750 0.0925 0.0975 0.0825 0.0675
## [381] 0.0900 0.0925 0.0775 0.0900 0.0900 0.1200 0.0850 0.1150 0.0925 0.0800
## [391] 0.1200 0.0950 0.1150 0.1000 0.0900 0.0775 0.1025 0.1100 0.1050 0.0825
## [401] 0.1025 0.1025 0.0825 0.0850 0.1050 0.0975 0.0975 0.0725 0.0750 0.0925
## [411] 0.0900 0.1000 0.0850 0.1025 0.1075 0.0925 0.0800 0.1000 0.0725 0.0925
## [421] 0.1100 0.1100 0.0900 0.0850 0.0875 0.1100 0.1150 0.0950 0.0975 0.0900
## [431] 0.0950 0.0875 0.1075 0.1050 0.0800 0.1150 0.0950 0.0925 0.0875 0.1025
## [441] 0.0850 0.0975 0.1025 0.1000 0.1025 0.0825 0.0975 0.0925 0.1100 0.1150
## [451] 0.1175 0.0825 0.0750 0.0825 0.0950 0.0900 0.1050 0.1025 0.0950 0.0925
## [461] 0.0800 0.0700 0.1050 0.0900 0.0825 0.1150 0.0925 0.1000 0.1175 0.1000
## [471] 0.1050 0.1025 0.0650 0.1050 0.0800 0.1050 0.0950 0.1000 0.1000 0.1200
## [481] 0.1100 0.1150 0.1125 0.1100 0.1225 0.1150 0.1050 0.0850 0.1150 0.0850
## [491] 0.1025 0.0900 0.1075 0.1075 0.0850 0.1125 0.0850 0.0825 0.1200 0.0950
media_pe=mean(vector_pe)
sesgo_me=media_pe-0.1
varianza_me=var(vector_pe)
La media del estimado p, para una iteración de 500 muestras
aleatorias es : 0.09678
El sesgo es : -0.00322
La varianza es
de : 1.4^{-4}
boxplot(vector_pe)
abline(h=0.1,col="RED",lty = 2)
d=density(vector_pe)
q=paste("n=",500)
plot(d, main=" ", xlab=q)
abline(v=0.1, col="red",lty = 2)
#### Crear el gráfico Q-Q normal
qqnorm(vector_pe)
#### Agregar una línea de referencia
qqline(vector_pe)
n1e=5
n2e=10
n3e=20
n4e=30
n5e=50
n6e=60
n7e=200
n8e=500
x5e=calculomediae(poblacione,n1e)
x10e=calculomediae(poblacione,n2e)
x20e=calculomediae(poblacione,n3e)
x30e=calculomediae(poblacione,n4e)
x50e=calculomediae(poblacione,n5e)
x60e=calculomediae(poblacione,n6e)
x200e=calculomediae(poblacione,n7e)
x500e=calculomediae(poblacione,n8e)
basee=data.frame(x5e,x10e,x20e,x30e,x50e,x60e,x200e,x500e)
qe=print(basee)
## x5e x10e x20e x30e x50e x60e x200e x500e
## 1 0.2 0.1 0.05 0.1333333 0.08 0.05 0.12 0.094
Los estimadores p para las muestras son :
muestra 5 :
0.2
muestra 10 : 0.1
muestra 20 : 0.05
muestra 30 :
0.1333333
muestra 50 : 0.08
muestra 60 : 0.05
muestra 200
: 0.12
muestra 500 : 0.094
matrize=matrix(data=1:4000,nrow=500,ncol=8)
matriz_pe=matrix(,nrow=1,ncol=8)
muestrasme=data.frame(5,10,20,30,50,60,200,500)
for(j in 1:8)
{
for(i in 1:500)
{
matrize[i,j]=calculomediae(poblacione,as.numeric(muestrasme[j]))
}
matriz_pe[1,j]=colMeans(matrize)[j]
}
datose=as.data.frame(matrize)
boxplot(datose,names =muestrasme,xlab="No de muestras",ylab="Estimador p" )
abline(h=0.1)
ba5e=shapiro.test(datose$V1)
ba10e=shapiro.test(datose$V2)
ba20e=shapiro.test(datose$V3)
ba30e=shapiro.test(datose$V4)
ba50e=shapiro.test(datose$V5)
ba60e=shapiro.test(datose$V6)
ba200e=shapiro.test(datose$V7)
ba500e=shapiro.test(datose$V8)
## graficos
layout(matrix(c(1,2,3,4),nrow=2))
qqnorm(datose$V1)
qqline(datose$V1)
qqnorm(datose$V2)
qqline(datose$V2)
qqnorm(datose$V3)
qqline(datose$V3)
qqnorm(datose$V4)
qqline(datose$V4)
qqnorm(datose$V5)
qqline(datose$V5)
qqnorm(datose$V6)
qqline(datose$V6)
qqnorm(datose$V7)
qqline(datose$V7)
qqnorm(datose$V8)
qqline(datose$V8)
Prueba Bonda y ajuste para n=5, el estadistico W es : 0.7049603 y el
valor p es : 1.0721331^{-28}
Prueba Bonda y ajuste para n=10, el
estadistico W es : 0.8299463 y el valor p es : 1.1511802^{-22}
Prueba Bonda y ajuste para n=20 el estadistico W es : 0.9200196 y el
valor p es : 1.244455^{-15}
Prueba Bonda y ajuste para n=30 el
estadistico W es : 0.9435786 y el valor p es : 7.4509279^{-13}
Prueba Bonda y ajuste para n=50 el estadistico W es : 0.9694469 y el
valor p es : 1.066085^{-8}
Prueba Bonda y ajuste para n=60 el
estadistico W es : 0.9755952 y el valor p es : 2.0874049^{-7}
Prueba
Bonda y ajuste para n=200 el estadistico W es : 0.9904174 y el valor p
es : 0.0024494
Prueba Bonda y ajuste para n=500 el estadistico W es
: 0.9912765 y el valor p es : 0.004829
En las pruebas realizadas, se puede concluir que: a medida que el número de muestras aumenta el estadistico W aumenta y el valor_p tambien lo hace por lo tanto se hace más fuerte la normalidad de las variables.
Se tiene el mismo comportamiento cuando el valor de p=0.5, por lo tanto, la normalidad aumenta en la medida que aumenta en numero de muestras y el estadistico se hace más fuerte en 0.1 lo que significa que el 10% de las plantas podrian estar enfermas.