Asignatura: Métodos y Simulación Estadistica

Profesor: David Arango Londoño
Maestria en Ciencia de Datos
Universidad Javeriana de Cali

1

El Teorema del Límite Central es uno de los más importantes en la inferencia estadística y habla sobre la convergencia de los estimadores como la proporción muestral a la distribución normal. Algunos autores afirman que esta aproximación es bastante buena a partir del umbral n>30.

  1. Realice una simulación en la cual genere una población de N=1000 (Lote) y además que el porcentaje de individuos (plantas) enfermas sea del 50%.
generar_poblacion = function(n_Poblacion, sanos, enfermos)
{
  return(c(rep("enfermos", enfermos * n_Poblacion), rep("sanos", sanos * n_Poblacion)))
}
poblacion = generar_poblacion(1000, 0.5, 0.5)
  1. Genere una función que permita obtener una muestra aleatoria de la población y calcule el estimador de la proporción muestral para un tamaño de muestra dado n.
obtener_P_muestra = function(n_Muestra)
{
  muestra = sample(poblacion, n_Muestra)
  return(sum(muestra=="enfermos")/n_Muestra)
}
obtener_P_muestra(50)
## [1] 0.36
  1. Repita el escenario anterior (b) 500 veces y analice los resultados en cuanto al comportamiento de los 500 estimadores. ¿Qué tan simétricos son los datos?, ¿Son sesgados y qué pasa en cuanto a variabilidad?
  n_Muestra = 100
  porcentajes_muestra = sapply(rep(n_Muestra, 500),obtener_P_muestra)
  summary(porcentajes_muestra)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3700  0.4700  0.5000  0.5014  0.5300  0.6300

Respuesta: Los datos son simetricos y centran en la media (0.5)

  1. Realice los ejercicios completos b y c para tamaños de muestra n=5, 10, 15, 20, 30, 50, 60, 100, 200, 500. Y compare los resultados de los estimadores en cuanto a la normalidad. Investigue y utilice pruebas de bondad y ajuste (shapiro wilks) y métodos gráficos (grafico qq de normalidad).
poblacion = generar_poblacion(1000, 0.5, 0.5)
summary(poblacion)
##    Length     Class      Mode 
##      1000 character character
obtener_P_muestra(50)
## [1] 0.46
mi_color = "green"
Escenario_Completo()

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.400   0.400   0.494   0.600   1.000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 3.627774e-15
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.021166e-52
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.4000  0.5000  0.5008  0.6000  0.9000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 7.087483e-10
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 6.089946e-28
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.1333  0.4000  0.4667  0.4953  0.6000  0.8667 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 5.352067e-08
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 5.470581e-18
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2000  0.4000  0.5000  0.5021  0.5500  0.8500 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 4.339718e-06
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 3.025837e-11
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2333  0.4333  0.5000  0.5063  0.5667  0.7667 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.0001999855
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 4.161514e-08
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3200  0.4600  0.5000  0.5003  0.5400  0.7000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.00025045
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 4.446527e-09
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3333  0.4667  0.5000  0.4960  0.5333  0.6667 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.002058198
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.948717e-06
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3700  0.4700  0.5000  0.5032  0.5400  0.6400 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.0928239
## [1] "SE ACEPTA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILk"
## [1] 0.002065845
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.405   0.480   0.500   0.499   0.520   0.610 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.09480375
## [1] "SE ACEPTA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILk"
## [1] 0.009344461
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4560  0.4900  0.5000  0.5007  0.5100  0.5440 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.2247761
## [1] "SE ACEPTA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILk"
## [1] 0.01153888
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
n Shapiro_Wilk kolmogorov
5 0.0000000 0.0000000
10 0.0000000 0.0000000
15 0.0000001 0.0000000
20 0.0000043 0.0000000
30 0.0002000 0.0000000
50 0.0002504 0.0000000
60 0.0020582 0.0000029
100 0.0928239 0.0020658
200 0.0948037 0.0093445
500 0.2247761 0.0115389

Repita toda la simulación (puntos a – d) pero ahora con lotes con 10% y 90% de plantas enfermas. Concluya todo el ejercicio.

poblacion = generar_poblacion(1000, 0.1, 0.9)
summary(poblacion)
##    Length     Class      Mode 
##      1000 character character
obtener_P_muestra(50)
## [1] 0.88
mi_color = "yellow"
Escenario_Completo()

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2000  0.8000  1.0000  0.8984  1.0000  1.0000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 5.941057e-29
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 3.888711e-188
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.6000  0.9000  0.9000  0.9086  1.0000  1.0000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.356239e-22
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.456433e-77
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.6667  0.8667  0.9333  0.9017  0.9333  1.0000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 8.18876e-18
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.164996e-68
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.7000  0.8500  0.9000  0.8988  0.9500  1.0000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 9.517522e-15
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.4867e-46
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.7667  0.8667  0.9000  0.9041  0.9333  1.0000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 3.719507e-12
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.003211e-31
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.7600  0.8800  0.9000  0.8982  0.9200  1.0000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.64058e-07
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.594853e-14
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.7667  0.8833  0.9000  0.9023  0.9333  0.9833 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 8.449155e-10
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 6.521483e-20
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.8200  0.8800  0.9000  0.9007  0.9200  0.9700 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 5.829737e-05
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.535324e-12
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.850   0.890   0.900   0.901   0.915   0.960 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.01065316
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.749906e-06
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.872   0.894   0.900   0.900   0.906   0.928 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.02065008
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 4.144832e-06
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
n Shapiro_Wilk kolmogorov
5 0.0000000 0.0e+00
10 0.0000000 0.0e+00
15 0.0000000 0.0e+00
20 0.0000000 0.0e+00
30 0.0000000 0.0e+00
50 0.0000002 0.0e+00
60 0.0000000 0.0e+00
100 0.0000583 0.0e+00
200 0.0106532 2.7e-06
500 0.0206501 4.1e-06

Conclusiones:

  1. La simulación permite visualizar el cumplimiento del Teorema del Límite Central. Es evidente que al incrementar el tamaño (n) de las muestras, los datos empiezan a converger a una distribución normal con media \(mu\) y varianza \((sigma^2)/n)\).

  2. Convergencia temprana cuando los datos están centrados: La convergencia a una distribución normal se evidencia de manera temprana (n=15) cuando las proporciones están balanceadas hacia el 50%.

  3. La prueba de Normalidad Shapiro – Wilk y Kolmogorov son Test que permiten verificar si los datos cumplen las condiciones de una distribución normal. Investigando en fuentes de internet recomienda usar Shapiro-Wilk para n<50 y Kolmogorov para n>50, sin embargo en las simulaciones se encontraron casos que contradicen la recomendación.

2

La comparación de tratamientos es una práctica fundamental en las ciencias agropecuarias y para esto a nivel estadístico se cuenta con algunas herramientas para apoyar el proceso de toma de decisiones y lograr concluir con algún grado de confianza que los resultados observados en una muestra son representativos y se pueden asociar a los tratamientos y no se deben únicamente al azar. Por medio una simulación validemos algunos de estos resultados.

  1. Suponga un escenario en el cual usted aplicó tratamientos diferentes a dos lotes y desea analizar si alguno de los dos presenta un mejor desempeño en el control de una plaga presente en ambos al momento inicial. Para ello utilizará como criterio de desempeño el tratamiento que menor % de plantas enfermas presente después de un tiempo de aplicación (es decir, si se presentan o no diferencias en las proporciones de enfermos P1 y P2). Realice una simulación en la cual genere dos poblaciones de N1=1000 (Lote1) y N2=1500 (Lote2), además asuma que el porcentaje de individuos (plantas) enfermas en ambos lotes sea la misma 10% (es decir, sin diferencias entre los tratamientos).
##Generar los lotes

lote1=c(rep("enfermo",100),rep("sanos",900))
lote2=c(rep("enfermo",150),rep("sanos",1350))

P1=sum(lote1=="enfermo")/length(lote1)
P2=sum(lote2=="enfermo")/length(lote2)

P1
## [1] 0.1
P2
## [1] 0.1
  1. Genere una función que permita obtener una muestra aleatoria de los lotes y calcule el estimador de la proporción muestral para cada lote (p1 y p2) para un tamaño de muestra dado n1=n2. Calcule la diferencia entre los estimadores p1-p2.
Calcular_Diferencia=function(n1){

  n2=n1
  muestra1=sample(lote1,n1)
  p1=sum(muestra1=="enfermo")/n1
  muestra2=sample(lote2,n2)
  p2=sum(muestra2=="enfermo")/n2
  dif_p=p1-p2
  return(dif_p)
  
}

Calcular_Diferencia(n1 = 50)
## [1] 0
  1. Repita el escenario anterior (b) 500 veces y analice los resultados en cuanto al comportamiento de los 500 estimadores (diferencias p1-p2). ¿Qué tan simétricos son los datos?, ¿Son siempre cero las diferencias?
Ejecutar_Escenario_Lote(n = 60)

## 
## FALSE  TRUE 
##   886   114 
##       Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
## -0.1500000 -0.0333333  0.0000000  0.0005167  0.0333333  0.1666667 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 7.331847e-07
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.426402e-14
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
  1. Realice los puntos b y c para tamaños de muestra n1=n2=5, 10, 15, 20, 30, 50, 60, 100, 200, 500. Y compare los resultados de los estimadores (p1-p2) en cuanto a la normalidad. También analice el comportamiento de las diferencias y evalúe. ¿Considera que es más probable concluir que existen diferencias entre los tratamientos con muestras grandes que pequeñas, es decir, cuál considera usted que es el efecto del tamaño de muestra en el caso de la comparación de proporciones?
mi_color="magenta"
Ejecutar_Escenario_Lote(n = 5)

## 
## FALSE  TRUE 
##   548   452 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.8000 -0.2000  0.0000  0.0026  0.2000  0.8000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 2.649307e-24
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.163996e-148
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 10)

## 
## FALSE  TRUE 
##   688   312 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.4000 -0.1000  0.0000  0.0052  0.1000  0.4000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 7.648734e-18
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.123784e-73
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 15)

## 
## FALSE  TRUE 
##   749   251 
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -0.533333 -0.066667  0.000000 -0.003333  0.066667  0.466667 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.166567e-14
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 5.850226e-48
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 20)

## 
## FALSE  TRUE 
##   776   224 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.30000 -0.05000  0.00000  0.00185  0.05000  0.30000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 9.827079e-13
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 7.476639e-41
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 30)

## 
## FALSE  TRUE 
##   825   175 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.26667 -0.03333  0.00000 -0.00110  0.06667  0.23333 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 7.821872e-10
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.174425e-23
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 50)

## 
## FALSE  TRUE 
##   848   152 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.20000 -0.04000  0.00000 -0.00124  0.04000  0.18000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.304233e-07
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 2.661668e-15
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 60)

## 
## FALSE  TRUE 
##   889   111 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.18333 -0.03333  0.00000  0.00050  0.03333  0.18333 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 9.976921e-07
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 4.653891e-14
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 100)

## 
## FALSE  TRUE 
##   899   101 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.14000 -0.03000  0.00000  0.00027  0.03000  0.14000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.0004203108
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 5.029583e-08
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 200)

## 
## FALSE  TRUE 
##   923    77 
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -0.085000 -0.020000  0.000000 -0.000135  0.020000  0.095000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.0283444
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.974137e-05
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 500)

## 
## FALSE  TRUE 
##   959    41 
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -0.052000 -0.010000  0.000000  0.000268  0.010000  0.038000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.0009018681
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 0.0001473197
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
  1. Ahora realice nuevamente los puntos a-d bajo un escenario con dos lotes, pero de proporciones de enfermos diferentes (P1=0.1 y P2=0.15), es decir, el tratamiento del lote 1 si presentó un mejor desempeño reduciendo en un 5% el porcentaje de enfermos. Bajo este nuevo escenario compare la distribución de estas diferencias (p1-p2) con las observadas bajo igualdad de condiciones en los lotes. ¿Qué puede concluir? ¿Existen puntos en los cuales es posible que se observen diferencias de p1- p2 bajo ambos escenarios (escenario 1: sin diferencias entre P1 y P2, escenario 2: diferencia de 5%)?
lote1=c(rep("enfermo",100),rep("sanos",900))
lote2=c(rep("enfermo",225),rep("sanos",1275))

P1=sum(lote1=="enfermo")/length(lote1)
P2=sum(lote2=="enfermo")/length(lote2)

P1
## [1] 0.1
P2
## [1] 0.15
mi_color="gray"
Ejecutar_Escenario_Lote(n = 5)

## 
## FALSE  TRUE 
##   602   398 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.6000 -0.2000  0.0000 -0.0412  0.0000  0.6000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.075953e-22
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.260927e-122
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 10)

## 
## FALSE  TRUE 
##   737   263 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.5000 -0.1000  0.0000 -0.0436  0.1000  0.4000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.355913e-15
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 8.284619e-54
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 15)

## 
## FALSE  TRUE 
##   789   211 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.46667 -0.13333 -0.06667 -0.05487  0.00000  0.26667 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.409861e-13
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.266679e-41
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 20)

## 
## FALSE  TRUE 
##   855   145 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -0.4000 -0.1500 -0.0500 -0.0519  0.0500  0.2500 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 4.851182e-10
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 1.883406e-26
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 30)

## 
## FALSE  TRUE 
##   872   128 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.30000 -0.10000 -0.06667 -0.05303  0.00000  0.20000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 2.146838e-08
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 4.187324e-18
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 50)

## 
## FALSE  TRUE 
##   916    84 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   -0.24   -0.10   -0.06   -0.05    0.00    0.20 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 5.033405e-06
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 3.669267e-14
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 60)

## 
## FALSE  TRUE 
##   932    68 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.26667 -0.08333 -0.05000 -0.05028 -0.01667  0.15000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 1.502476e-05
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 7.317513e-12
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 100)

## 
## FALSE  TRUE 
##   970    30 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.19000 -0.08000 -0.05000 -0.05098 -0.02000  0.09000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.0001870227
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 4.821009e-09
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 200)

## 
## FALSE  TRUE 
##   983    17 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.15500 -0.07000 -0.05000 -0.04991 -0.03000  0.04000 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.02438106
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILK"
## [1] 0.0001825529
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"
Ejecutar_Escenario_Lote(n = 500)

## 
## FALSE 
##  1000 
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.09800 -0.06000 -0.05000 -0.04967 -0.03800  0.00800 
## [1] "#######################################################"
## [1] "Prueba Shapiro-Wilk y Kolmogorov"
## [1] 0.1147869
## [1] "SE ACEPTA HIPOTESIS DE NORMALIDAD POR SHAPIRO-WILk"
## [1] 0.009810778
## [1] "SE RECHAZA HIPOTESIS DE NORMALIDAD POR KOLMOGOROV"
## [1] "#######################################################"

Conclusiones:

  1. La simulación permite visualizar que la media de las diferencia para la primera simulación es 0 y para la segunda es 0.5.

  2. Existe convergencia a una normal. A medida que crecen los tamaños de las muestras la desviación estandar se reduce concentrando los valores en la media

  3. La prueba de Normalidad Shapiro – Wilk y Kolmogorov aceptan la hipotesis con mayor frecuencia en n>200.