3er Ejercicio

Teorema del limite central

El Teorema del Límite Central es uno de los más importantes en la inferencia estadística y habla sobre la convergencia de los estimadores como la proporción muestral a la distribución normal. Algunos autores afirman que esta aproximación es bastante buena a partir del umbral n>30 .

A continuación se describen los siguientes pasos para su verificación:

  1. Realice una simulación en la cual genere una población de n=1000 (Lote), donde el porcentaje de individuos (supongamos plantas) enfermas sea del 50%.

  2. Genere una función que permita: Obtener una muestra aleatoria de la población y Calcule el estimador de la proporción muestral pˆ para un tamaño de muestra dado n.

  3. Repita el escenario anterior (b) n=500 veces y analice los resultados en cuanto al comportamiento de los 500 resultados del estimador pˆ. ¿Qué tan simétricos o sesgados son los resultados obtenidos? y ¿qué se puede observar en cuanto a la variabilidad?. Realice en su informe un comentario sobre los resultados obtenidos.

  4. Repita los puntos b y c para tamaños de muestra n=5, 10, 15, 20, 30, 50, 60, 100, 200, 500. Compare los resultados obtenidos para los diferentes tamaños de muestra en cuanto a la normalidad. Utilice pruebas de bondad y ajuste (shapiro wilks :shspiro.test()) y métodos gráficos (gráfico de normalidad: qqnorm()). Comente en su informe los resultados obtenidos

  5. Repita toda la simulación (puntos a – d), pero ahora para lotes con 10% de plantas enfermas y de nuevo para lotes con un 90% de plantas enfermas. Concluya sobre los resultados del ejercicio

Desarrollo

a) Población

Se realizar el calculo con una distribución binomial:

##    [1] 1 0 1 1 1 1 1 1 0 1 1 1 0 0 1 1 1 1 1 1 1 1 1 0 1 1 0 0 0 0 0 1 1 1 1 0 1
##   [38] 1 0 1 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 1 1 0 1 1 0 1 0 0 1 0 1 1 1 0 0 0 0 1
##   [75] 1 1 0 1 1 1 0 1 1 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 1 1 1 0 0 1 0 1 0 0 1 1 0
##  [112] 1 1 1 0 0 0 0 1 0 1 0 1 0 0 1 1 1 1 1 1 1 0 0 0 0 1 0 0 0 0 1 1 0 1 1 1 0
##  [149] 1 0 0 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0 1 1 1 1 0 1 0 1 0 0 1
##  [186] 1 0 1 0 1 0 0 0 0 1 1 0 0 1 0 1 0 1 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1
##  [223] 0 1 0 0 1 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 0 1 1 1 1 1 1 1 0 1 1 1 0 1 1 0 1
##  [260] 0 1 1 1 0 0 1 1 1 0 0 1 1 1 1 0 1 1 0 1 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 1 1
##  [297] 1 0 1 0 0 1 0 0 1 1 0 1 0 1 1 0 1 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 0
##  [334] 1 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 1 0 1 0 1 1 1 1 0 0 0 0 1 0 0 0 1 0 1
##  [371] 0 0 1 1 1 1 0 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 1 1 1 0 1 0 0 1 0 1
##  [408] 0 1 0 1 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 1 0 1 1 0 1 0 1 0 0 1 1 1 0 0 1 1 1
##  [445] 1 1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 1 0 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 0 1
##  [482] 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 1 1 1 1 0 1 0 1 0 1 1 1 0 1
##  [519] 1 0 1 0 1 1 0 0 0 1 0 1 1 0 0 0 1 0 0 0 1 1 0 1 1 0 1 0 0 1 0 0 1 0 0 0 0
##  [556] 0 1 0 0 1 1 1 1 1 0 1 0 0 0 1 1 0 1 1 0 1 1 1 0 0 1 0 1 1 1 1 0 1 1 1 1 1
##  [593] 1 0 0 0 1 0 1 0 1 1 0 1 0 1 0 1 1 0 0 0 0 0 1 0 1 1 0 1 0 0 1 0 1 0 1 0 0
##  [630] 0 0 1 0 1 1 1 0 0 0 0 1 0 1 1 1 1 1 1 0 0 0 0 0 0 1 0 1 1 1 1 1 1 1 0 1 1
##  [667] 1 0 0 0 1 1 1 1 1 0 0 1 1 1 1 0 1 1 0 1 0 0 0 0 1 1 0 0 1 1 0 1 1 0 1 0 0
##  [704] 0 0 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 1 0 1 1 0
##  [741] 1 0 1 0 1 1 1 0 1 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 1 1 1 1 0 0 1 0 1 0
##  [778] 1 1 0 0 1 1 1 1 0 0 1 0 1 1 1 1 1 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 1 1 1 0 1
##  [815] 1 0 0 0 1 1 0 1 1 1 1 1 0 1 1 0 0 1 1 1 0 0 1 0 0 0 0 0 0 1 0 0 0 1 1 0 1
##  [852] 1 0 1 1 1 0 0 1 1 0 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 0 1 1 1 0 1 1 1 0 0 1 0
##  [889] 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 1 1 1 0 0 0
##  [926] 0 0 0 1 0 1 0 1 1 0 0 1 0 0 1 1 1 0 0 0 1 0 0 0 0 0 1 1 0 0 1 0 0 1 1 0 0
##  [963] 0 0 1 0 1 0 1 0 1 1 1 1 1 0 0 0 1 0 0 1 1 1 1 1 1 0 1 1 1 0 1 1 0 1 0 0 0
## [1000] 0
  • la población tiene la siguiente estructura:

    • El promedio de la población es: 500
    • La varianza de la población es: 250
    • La desviación estandar de la población es: 15.8113883

b) Función

Se selecciona una muestra aleatoria entre 1 y 1000 de la problación y se hace el calculo del estimador p.

Para una muestra aleatoria de : 400,
el estimador p es : 0.52

atraves de una función “calculomedia” :

calculomedia=function(a,b) { muestra_alea=sample(a, size = b, replace = FALSE) media_estimador=mean(muestra_alea) return(media_estimador) }

C) 500 iteraciones.

# Crear un vector vacío
vector_p <- c()

for(i in 1:500)
{
  
  y=calculomedia(poblacion,m)
  vector_p=c(vector_p,y)
}

print (vector_p)
##   [1] 0.5600 0.5175 0.5350 0.5075 0.5050 0.5450 0.4650 0.5350 0.5275 0.5000
##  [11] 0.5200 0.5100 0.5050 0.5500 0.5450 0.5100 0.5225 0.5100 0.5175 0.5050
##  [21] 0.5175 0.5175 0.5225 0.4850 0.5175 0.5000 0.5325 0.5625 0.5125 0.4975
##  [31] 0.5225 0.5050 0.4800 0.5575 0.4550 0.5275 0.5325 0.5050 0.4925 0.5275
##  [41] 0.5025 0.5075 0.5100 0.5300 0.5250 0.5075 0.5000 0.5350 0.5400 0.5300
##  [51] 0.4975 0.5225 0.5150 0.5000 0.5350 0.5425 0.5025 0.5325 0.5375 0.4850
##  [61] 0.5225 0.5075 0.5450 0.5150 0.5175 0.5425 0.4850 0.4950 0.5200 0.5125
##  [71] 0.5100 0.5225 0.5300 0.5125 0.5075 0.5100 0.5125 0.5575 0.5200 0.5325
##  [81] 0.5200 0.5050 0.5375 0.5250 0.5000 0.5400 0.5275 0.5000 0.5075 0.5250
##  [91] 0.5100 0.5100 0.5000 0.4875 0.5025 0.4725 0.4850 0.5075 0.5325 0.5275
## [101] 0.5250 0.4950 0.5175 0.5000 0.4900 0.4875 0.5200 0.5425 0.5350 0.5175
## [111] 0.5100 0.5450 0.5050 0.5250 0.5075 0.5600 0.5175 0.5250 0.5225 0.5450
## [121] 0.5350 0.5125 0.5150 0.5325 0.5225 0.5050 0.5375 0.5500 0.5200 0.5075
## [131] 0.5125 0.5150 0.5200 0.5150 0.5025 0.5125 0.5375 0.5075 0.5100 0.5075
## [141] 0.5400 0.4975 0.5375 0.5400 0.5100 0.4800 0.5250 0.5225 0.5050 0.5425
## [151] 0.5125 0.5475 0.5425 0.5050 0.5025 0.5300 0.5375 0.5250 0.5375 0.4925
## [161] 0.5200 0.5150 0.5225 0.5175 0.5300 0.5275 0.5100 0.5300 0.5150 0.5000
## [171] 0.5150 0.4900 0.5450 0.4700 0.5050 0.5050 0.5200 0.4925 0.4950 0.5250
## [181] 0.5200 0.5250 0.5275 0.5550 0.5300 0.4875 0.5200 0.5225 0.5450 0.5350
## [191] 0.5175 0.5000 0.5100 0.5325 0.5350 0.5100 0.5175 0.5125 0.5250 0.5125
## [201] 0.5050 0.5425 0.5125 0.5025 0.5250 0.5175 0.5375 0.5050 0.5175 0.5250
## [211] 0.5050 0.4975 0.4825 0.5150 0.5225 0.5325 0.5025 0.5200 0.5100 0.5300
## [221] 0.5650 0.5200 0.5150 0.5150 0.5450 0.4850 0.5350 0.5625 0.5325 0.5050
## [231] 0.5150 0.5400 0.5250 0.4950 0.5025 0.4750 0.5275 0.5200 0.5375 0.5200
## [241] 0.5275 0.5100 0.5075 0.5400 0.4925 0.4800 0.5175 0.4750 0.5225 0.5150
## [251] 0.5600 0.5225 0.5300 0.5075 0.4900 0.5450 0.4975 0.5150 0.5150 0.4975
## [261] 0.5075 0.5375 0.5075 0.4800 0.5350 0.4825 0.5150 0.5225 0.5050 0.5350
## [271] 0.5325 0.5200 0.4925 0.4850 0.5350 0.5325 0.4825 0.5125 0.4950 0.5425
## [281] 0.5025 0.4975 0.5450 0.5275 0.5425 0.4875 0.5100 0.5700 0.5225 0.5500
## [291] 0.5050 0.5350 0.5000 0.5375 0.5050 0.4900 0.5150 0.4975 0.5550 0.5475
## [301] 0.5075 0.5350 0.4975 0.5300 0.5050 0.5050 0.5250 0.5150 0.5325 0.5025
## [311] 0.5000 0.5450 0.5475 0.4950 0.5025 0.5325 0.5100 0.5275 0.4900 0.5050
## [321] 0.5000 0.5125 0.5500 0.4975 0.5250 0.4775 0.5125 0.5125 0.4825 0.5150
## [331] 0.4950 0.5250 0.5025 0.5200 0.5150 0.5225 0.5400 0.5550 0.5200 0.5450
## [341] 0.5250 0.5300 0.5250 0.4900 0.5200 0.4850 0.5050 0.4725 0.5250 0.5000
## [351] 0.5625 0.4900 0.5500 0.5200 0.5375 0.4850 0.4975 0.5100 0.4950 0.5175
## [361] 0.5450 0.5350 0.5225 0.5125 0.5100 0.5225 0.5400 0.4975 0.5050 0.5225
## [371] 0.5200 0.5650 0.5450 0.5175 0.5250 0.4975 0.5150 0.5150 0.5075 0.4900
## [381] 0.5150 0.5625 0.4975 0.5425 0.5500 0.4975 0.4850 0.5275 0.5225 0.4750
## [391] 0.4775 0.5375 0.5375 0.5500 0.5100 0.5525 0.5425 0.4975 0.5050 0.4975
## [401] 0.5325 0.5450 0.5300 0.4775 0.5000 0.5100 0.5100 0.4950 0.5175 0.5150
## [411] 0.4950 0.5225 0.5375 0.5150 0.5450 0.5225 0.5225 0.5125 0.5275 0.4925
## [421] 0.5075 0.4825 0.5000 0.5025 0.4800 0.4850 0.4950 0.5500 0.5850 0.5275
## [431] 0.5500 0.5350 0.5100 0.5000 0.5475 0.5200 0.5100 0.5275 0.4950 0.5225
## [441] 0.5025 0.5600 0.5025 0.4825 0.5275 0.5150 0.4975 0.5200 0.4875 0.4950
## [451] 0.5300 0.5050 0.5250 0.5100 0.5050 0.4925 0.5100 0.5450 0.5175 0.5450
## [461] 0.5100 0.4975 0.5275 0.5250 0.5100 0.4950 0.5150 0.5275 0.5325 0.5125
## [471] 0.4950 0.4950 0.5125 0.5375 0.5450 0.5150 0.5150 0.4850 0.5125 0.4875
## [481] 0.5175 0.5175 0.4875 0.5300 0.5025 0.5025 0.5150 0.5000 0.4975 0.5475
## [491] 0.5325 0.5525 0.5200 0.5350 0.5150 0.5425 0.5175 0.5100 0.5000 0.5125
media_p=mean(vector_p)
sesgo_m=media_p-0.5
varianza_m=var(vector_p)

La media del estimado p, para una iteración de 500 muestras aleatorias es : 0.51687
El sesgo es : 0.01687
La varianza es de : 4^{-4}

boxplot(vector_p)
abline(h=0.5,col="RED",lty = 2)

d=density(vector_p)
q=paste("n=",500)
plot(d, main=" ", xlab=q)
abline(v=0.5, col="red",lty = 2)

#### Crear el gráfico Q-Q normal
qqnorm(vector_p)

#### Agregar una línea de referencia
qqline(vector_p)

d) repetir los puntos b y c para tamanos de muestra n=5,10,20,30,50,60,200,500

n1=5
n2=10
n3=20
n4=30
n5=50
n6=60
n7=200
n8=500

x5=calculomedia(poblacion,n1)
x10=calculomedia(poblacion,n2)
x20=calculomedia(poblacion,n3)
x30=calculomedia(poblacion,n4)
x50=calculomedia(poblacion,n5)
x60=calculomedia(poblacion,n6)
x200=calculomedia(poblacion,n7)
x500=calculomedia(poblacion,n8)

base=data.frame(x5,x10,x20,x30,x50,x60,x200,x500)

q=print(base)
##    x5 x10  x20       x30  x50  x60  x200  x500
## 1 0.4 0.7 0.55 0.4666667 0.66 0.45 0.485 0.516

Los estimadores p para las muestras son :

muestra 5 : 0.4
muestra 10 : 0.7
muestra 20 : 0.55
muestra 30 : 0.4666667
muestra 50 : 0.66
muestra 60 : 0.45
muestra 200 : 0.485
muestra 500 : 0.516

matriz=matrix(data=1:4000,nrow=500,ncol=8)

matriz_p=matrix(,nrow=1,ncol=8)


muestrasm=data.frame(5,10,20,30,50,60,200,500)

for(j in 1:8)
  {
    for(i in 1:500)
    {
      matriz[i,j]=calculomedia(poblacion,as.numeric(muestrasm[j]))
    }
    matriz_p[1,j]=colMeans(matriz)[j]
}

datos=as.data.frame(matriz)

boxplot(datos,names =muestrasm,xlab="No de muestras",ylab="Estimador p" )
abline(h=0.5)

ba5=shapiro.test(datos$V1)
ba10=shapiro.test(datos$V2)
ba20=shapiro.test(datos$V3)
ba30=shapiro.test(datos$V4)
ba50=shapiro.test(datos$V5)
ba60=shapiro.test(datos$V6)
ba200=shapiro.test(datos$V7)
ba500=shapiro.test(datos$V8)

## graficos

layout(matrix(c(1,2,3,4),nrow=2))

qqnorm(datos$V1)
qqline(datos$V1)

qqnorm(datos$V2)
qqline(datos$V2)

qqnorm(datos$V3)
qqline(datos$V3)

qqnorm(datos$V4)
qqline(datos$V4)

qqnorm(datos$V5)
qqline(datos$V5)

qqnorm(datos$V6)
qqline(datos$V6)

qqnorm(datos$V7)
qqline(datos$V7)

qqnorm(datos$V8)
qqline(datos$V8)

Prueba Bonda y ajuste para n=5, el estadistico W es : 0.9271662 y el valor p es : 7.4043944^{-15}
Prueba Bonda y ajuste para n=10, el estadistico W es : 0.9635513 y el valor p es : 8.4523865^{-10}
Prueba Bonda y ajuste para n=20 el estadistico W es : 0.9777528 y el valor p es : 6.5474616^{-7}
Prueba Bonda y ajuste para n=30 el estadistico W es : 0.9865657 y el valor p es : 1.4404084^{-4}
Prueba Bonda y ajuste para n=50 el estadistico W es : 0.9907779 y el valor p es : 0.0032499
Prueba Bonda y ajuste para n=60 el estadistico W es : 0.99149 y el valor p es : 0.0057314
Prueba Bonda y ajuste para n=200 el estadistico W es : 0.9957245 y el valor p es : 0.1911715
Prueba Bonda y ajuste para n=500 el estadistico W es : 0.9960816 y el valor p es : 0.253367

Conclusión

En las pruebas realizadas, se puede concluir que: a medida que el número de muestras aumenta el estadistico W aumenta y el valor_p tambien lo hace por lo tanto se hace más fuerte la normalidad de las variables.

e) simulacion con p=0.10

Se realizar el calculo con una distribución binomial:

##    [1] 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
##   [38] 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
##   [75] 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
##  [112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0
##  [149] 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0
##  [186] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
##  [223] 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
##  [260] 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0
##  [297] 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
##  [334] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
##  [371] 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
##  [408] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
##  [445] 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 1 0 0 0 1 0 0 0 0 1 0 0
##  [482] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
##  [519] 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1
##  [556] 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0
##  [593] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0
##  [630] 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
##  [667] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1
##  [704] 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0
##  [741] 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
##  [778] 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
##  [815] 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
##  [852] 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0
##  [889] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
##  [926] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 1 1
##  [963] 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## [1000] 0
  • la población tiene la siguiente estructura:

    • El promedio de la población es: 100
    • La varianza de la población es: 90
    • La desviación estandar de la población es: 9.486833

b) Función

Se selecciona una muestra aleatoria entre 1 y 1000 de la problación y se hace el calculo del estimador p.

Para una muestra aleatoria de : 400,
el estimador p es : 0.11

atraves de una función “calculomediae” :

calculomediae=function(c,d) { muestra_aleae=sample(c, size = d, replace = FALSE) media_estimadore=mean(muestra_aleae) return(media_estimadore) }

C) 500 iteraciones.

# Crear un vector vacío
vector_pe <- c()

for(i in 1:500)
{
  
  ye=calculomediae(poblacione,me)
  vector_pe=c(vector_pe,ye)
}

print (vector_pe)
##   [1] 0.0900 0.1025 0.0825 0.1250 0.0900 0.0900 0.1150 0.1075 0.0875 0.0875
##  [11] 0.0850 0.1000 0.0975 0.1000 0.1000 0.0875 0.1075 0.0975 0.0950 0.0950
##  [21] 0.0875 0.0950 0.1025 0.1025 0.0825 0.0950 0.0875 0.0850 0.0875 0.1150
##  [31] 0.0875 0.1000 0.1075 0.0975 0.0925 0.0925 0.0850 0.0925 0.1050 0.0800
##  [41] 0.1075 0.0875 0.0975 0.0975 0.1025 0.0875 0.1000 0.0925 0.1025 0.1050
##  [51] 0.0850 0.0925 0.0825 0.0950 0.0925 0.1050 0.1025 0.0975 0.1200 0.0975
##  [61] 0.1150 0.0900 0.0925 0.1200 0.0925 0.1175 0.0950 0.0950 0.1250 0.1075
##  [71] 0.1250 0.1150 0.0825 0.0775 0.1050 0.1000 0.1075 0.0900 0.1000 0.1025
##  [81] 0.0900 0.1050 0.0925 0.1150 0.0875 0.0975 0.1000 0.1075 0.1050 0.1175
##  [91] 0.1100 0.0825 0.0875 0.0825 0.0950 0.0925 0.0800 0.1000 0.0950 0.1075
## [101] 0.0825 0.0800 0.0950 0.0875 0.0975 0.0925 0.1175 0.0900 0.1200 0.0950
## [111] 0.1075 0.1025 0.0750 0.0925 0.1000 0.0925 0.1050 0.0875 0.0950 0.0975
## [121] 0.1150 0.0925 0.0950 0.1025 0.0750 0.0775 0.0900 0.0850 0.0850 0.0950
## [131] 0.1075 0.1025 0.0850 0.1050 0.0825 0.1000 0.0875 0.0950 0.1025 0.0900
## [141] 0.0950 0.0650 0.1075 0.1200 0.1000 0.1025 0.0975 0.1050 0.1100 0.0925
## [151] 0.1100 0.0850 0.1125 0.1275 0.1250 0.1100 0.1025 0.0925 0.1275 0.1225
## [161] 0.0800 0.1100 0.1025 0.0850 0.0925 0.1050 0.0775 0.1000 0.0925 0.0850
## [171] 0.0825 0.1000 0.0800 0.0925 0.0775 0.0750 0.0925 0.1075 0.0850 0.1100
## [181] 0.1025 0.0875 0.1200 0.1075 0.0825 0.1000 0.0975 0.0975 0.0850 0.0875
## [191] 0.1025 0.0975 0.0925 0.1050 0.0850 0.1000 0.0975 0.1025 0.0900 0.1025
## [201] 0.0950 0.0950 0.0875 0.1050 0.0650 0.0950 0.1025 0.1175 0.1050 0.0975
## [211] 0.1050 0.0850 0.1000 0.0750 0.1025 0.1025 0.1025 0.1050 0.1100 0.1250
## [221] 0.0975 0.1100 0.1025 0.1125 0.0900 0.0775 0.0875 0.1050 0.1175 0.1000
## [231] 0.0800 0.1025 0.1025 0.0750 0.0900 0.1100 0.0950 0.0925 0.0900 0.1075
## [241] 0.1025 0.0850 0.0925 0.1025 0.0975 0.0850 0.1050 0.0950 0.0925 0.0900
## [251] 0.0800 0.1000 0.1100 0.1050 0.0900 0.0975 0.1125 0.1000 0.1000 0.0900
## [261] 0.0975 0.0900 0.1050 0.1075 0.1000 0.0775 0.0975 0.0800 0.0825 0.1000
## [271] 0.1050 0.1125 0.0975 0.0950 0.1125 0.0875 0.0950 0.0900 0.1075 0.1000
## [281] 0.0900 0.1150 0.0900 0.1250 0.0875 0.0750 0.0900 0.1050 0.1025 0.0925
## [291] 0.0950 0.1000 0.0875 0.0900 0.1000 0.0775 0.1025 0.0900 0.0850 0.1050
## [301] 0.0900 0.0950 0.0900 0.0950 0.0775 0.1300 0.0800 0.0925 0.0925 0.0975
## [311] 0.0975 0.0850 0.0750 0.1000 0.0950 0.0800 0.1300 0.1025 0.0850 0.1000
## [321] 0.0900 0.0850 0.0775 0.1125 0.1175 0.0875 0.0925 0.1100 0.0975 0.0875
## [331] 0.1275 0.1075 0.0950 0.0950 0.1000 0.0950 0.0975 0.1050 0.1050 0.0975
## [341] 0.0875 0.0850 0.1000 0.1075 0.1225 0.0875 0.0825 0.1050 0.1175 0.1000
## [351] 0.0875 0.1050 0.0775 0.1000 0.1025 0.0950 0.0800 0.0975 0.1025 0.0850
## [361] 0.0975 0.0925 0.0900 0.0925 0.1000 0.0850 0.0700 0.0850 0.1075 0.0925
## [371] 0.0900 0.1000 0.1025 0.0925 0.0950 0.0750 0.0925 0.0975 0.0825 0.0675
## [381] 0.0900 0.0925 0.0775 0.0900 0.0900 0.1200 0.0850 0.1150 0.0925 0.0800
## [391] 0.1200 0.0950 0.1150 0.1000 0.0900 0.0775 0.1025 0.1100 0.1050 0.0825
## [401] 0.1025 0.1025 0.0825 0.0850 0.1050 0.0975 0.0975 0.0725 0.0750 0.0925
## [411] 0.0900 0.1000 0.0850 0.1025 0.1075 0.0925 0.0800 0.1000 0.0725 0.0925
## [421] 0.1100 0.1100 0.0900 0.0850 0.0875 0.1100 0.1150 0.0950 0.0975 0.0900
## [431] 0.0950 0.0875 0.1075 0.1050 0.0800 0.1150 0.0950 0.0925 0.0875 0.1025
## [441] 0.0850 0.0975 0.1025 0.1000 0.1025 0.0825 0.0975 0.0925 0.1100 0.1150
## [451] 0.1175 0.0825 0.0750 0.0825 0.0950 0.0900 0.1050 0.1025 0.0950 0.0925
## [461] 0.0800 0.0700 0.1050 0.0900 0.0825 0.1150 0.0925 0.1000 0.1175 0.1000
## [471] 0.1050 0.1025 0.0650 0.1050 0.0800 0.1050 0.0950 0.1000 0.1000 0.1200
## [481] 0.1100 0.1150 0.1125 0.1100 0.1225 0.1150 0.1050 0.0850 0.1150 0.0850
## [491] 0.1025 0.0900 0.1075 0.1075 0.0850 0.1125 0.0850 0.0825 0.1200 0.0950
media_pe=mean(vector_pe)
sesgo_me=media_pe-0.1
varianza_me=var(vector_pe)

La media del estimado p, para una iteración de 500 muestras aleatorias es : 0.09678
El sesgo es : -0.00322
La varianza es de : 1.4^{-4}

boxplot(vector_pe)
abline(h=0.1,col="RED",lty = 2)

d=density(vector_pe)
q=paste("n=",500)
plot(d, main=" ", xlab=q)
abline(v=0.1, col="red",lty = 2)

#### Crear el gráfico Q-Q normal
qqnorm(vector_pe)

#### Agregar una línea de referencia
qqline(vector_pe)

d) repetir los puntos b y c para tamanos de muestra n=5,10,20,30,50,60,200,500

n1e=5
n2e=10
n3e=20
n4e=30
n5e=50
n6e=60
n7e=200
n8e=500

x5e=calculomediae(poblacione,n1e)
x10e=calculomediae(poblacione,n2e)
x20e=calculomediae(poblacione,n3e)
x30e=calculomediae(poblacione,n4e)
x50e=calculomediae(poblacione,n5e)
x60e=calculomediae(poblacione,n6e)
x200e=calculomediae(poblacione,n7e)
x500e=calculomediae(poblacione,n8e)

basee=data.frame(x5e,x10e,x20e,x30e,x50e,x60e,x200e,x500e)

qe=print(basee)
##   x5e x10e x20e      x30e x50e x60e x200e x500e
## 1 0.2  0.1 0.05 0.1333333 0.08 0.05  0.12 0.094

Los estimadores p para las muestras son :

muestra 5 : 0.2
muestra 10 : 0.1
muestra 20 : 0.05
muestra 30 : 0.1333333
muestra 50 : 0.08
muestra 60 : 0.05
muestra 200 : 0.12
muestra 500 : 0.094

matrize=matrix(data=1:4000,nrow=500,ncol=8)

matriz_pe=matrix(,nrow=1,ncol=8)


muestrasme=data.frame(5,10,20,30,50,60,200,500)

for(j in 1:8)
  {
    for(i in 1:500)
    {
      matrize[i,j]=calculomediae(poblacione,as.numeric(muestrasme[j]))
    }
    matriz_pe[1,j]=colMeans(matrize)[j]
}

datose=as.data.frame(matrize)

boxplot(datose,names =muestrasme,xlab="No de muestras",ylab="Estimador p" )
abline(h=0.1)

ba5e=shapiro.test(datose$V1)
ba10e=shapiro.test(datose$V2)
ba20e=shapiro.test(datose$V3)
ba30e=shapiro.test(datose$V4)
ba50e=shapiro.test(datose$V5)
ba60e=shapiro.test(datose$V6)
ba200e=shapiro.test(datose$V7)
ba500e=shapiro.test(datose$V8)

## graficos

layout(matrix(c(1,2,3,4),nrow=2))

qqnorm(datose$V1)
qqline(datose$V1)

qqnorm(datose$V2)
qqline(datose$V2)

qqnorm(datose$V3)
qqline(datose$V3)

qqnorm(datose$V4)
qqline(datose$V4)

qqnorm(datose$V5)
qqline(datose$V5)

qqnorm(datose$V6)
qqline(datose$V6)

qqnorm(datose$V7)
qqline(datose$V7)

qqnorm(datose$V8)
qqline(datose$V8)

Prueba Bonda y ajuste para n=5, el estadistico W es : 0.7049603 y el valor p es : 1.0721331^{-28}
Prueba Bonda y ajuste para n=10, el estadistico W es : 0.8299463 y el valor p es : 1.1511802^{-22}
Prueba Bonda y ajuste para n=20 el estadistico W es : 0.9200196 y el valor p es : 1.244455^{-15}
Prueba Bonda y ajuste para n=30 el estadistico W es : 0.9435786 y el valor p es : 7.4509279^{-13}
Prueba Bonda y ajuste para n=50 el estadistico W es : 0.9694469 y el valor p es : 1.066085^{-8}
Prueba Bonda y ajuste para n=60 el estadistico W es : 0.9755952 y el valor p es : 2.0874049^{-7}
Prueba Bonda y ajuste para n=200 el estadistico W es : 0.9904174 y el valor p es : 0.0024494
Prueba Bonda y ajuste para n=500 el estadistico W es : 0.9912765 y el valor p es : 0.004829

Conclusión

En las pruebas realizadas, se puede concluir que: a medida que el número de muestras aumenta el estadistico W aumenta y el valor_p tambien lo hace por lo tanto se hace más fuerte la normalidad de las variables.

Se tiene el mismo comportamiento cuando el valor de p=0.5, por lo tanto, la normalidad aumenta en la medida que aumenta en numero de muestras y el estadistico se hace más fuerte en 0.1 lo que significa que el 10% de las plantas podrian estar enfermas.