A- Se genera una población de n=1000 donde el porcentaje de plantas enfermas es del 50%.
Se define la función para crear una población binomial y se obtiene un valor cercano al 50 % de las plantas enfermas de las muestra, siendo este valos el llamado estimador pˆ.
B- Generamos una función que permite obtener una muestra aleatoria de la población y Calcular el estimador de la proporción muestral pˆ para un tamaño de muestra dado n
Generamos una muestra aleatotia de n=100 y calculamos el estimador de la proporción muestral pˆ
## [1] 54
## El estimador de la proporción muestral pˆ es: 54 %
C- Se repite el escenario anterior (b) n = 500 veces y se analiza los resultados en cuanto al comportamiento de los 500 resultados del estimador pˆ.
## El estimador de la proporción muestral pˆ medio para las 500 simulaciones es: 49.94 %.
## [1] "Coeficiente de asimetría: 0.08"
## [1] "Coeficiente de variación: 10.64%"
¿Qué tan simétricos o sesgados son los resultados obtenidos? ¿qué se puede observar en cuanto a la variabilidad?
Simetría o sesgo: El histograma muestra una similitud con la campana de Gauss, lo que sugiere una distribución aproximadamente normal de los estimadores. La alta simetría observada en el histograma indica que los datos están bien distribuidos alrededor de la media, lo que es consistente con una distribución normal. Los resultados sugieren que no hay sesgo significativo.
Variabilidad: El cálculo de la varianza muestra un valor cercano a cero, lo que indica que los datos están agrupados alrededor de la media y tienen poca dispersión.
D- Se repite los puntos anteriores para tamaños de muestra n=5, 10, 15, 20, 30, 50, 60, 100, 200, 500.
E- Se repite toda la simulación (puntos a – d) ahora para lotes con 10% de plantas enfermas y lotes con 90% de plantas enfermas.
Para los puntos E y D se realizó las corridas en Rstudio y se comparó con los resultados obtenidos para los diferentes tamaños de muestra,lotes con 10% de plantas enfermas y lotes con un 90% de plantas enfermas, en donde el analisis se enfoca en la normalidad, pruebas de bondad y ajuste (shapiro wilks :shspiro.test()), simetria, variabilidad y métodos gráficos de normalidad (qqnorm).
## Tamaño de muestra: 5 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 5 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: -0.04"
## [1] "Prueba Shapiro-Wilk: 0.58"
## [1] "Coeficiente de variación: 4.22%"
##
## Tamaño de muestra: 10 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 10 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: 0.03"
## [1] "Prueba Shapiro-Wilk: 0.63"
## [1] "Coeficiente de variación: 3.01%"
##
## Tamaño de muestra: 15 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 15 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: 0.06"
## [1] "Prueba Shapiro-Wilk: 0.49"
## [1] "Coeficiente de variación: 2.41%"
##
## Tamaño de muestra: 20 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 20 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: 0.07"
## [1] "Prueba Shapiro-Wilk: 0.18"
## [1] "Coeficiente de variación: 2.21%"
##
## Tamaño de muestra: 30 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 30 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: -0.13"
## [1] "Prueba Shapiro-Wilk: 0.65"
## [1] "Coeficiente de variación: 1.73%"
##
## Tamaño de muestra: 50 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 50 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: -0.02"
## [1] "Prueba Shapiro-Wilk: 0.80"
## [1] "Coeficiente de variación: 1.32%"
##
## Tamaño de muestra: 60 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 60 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: 0.03"
## [1] "Prueba Shapiro-Wilk: 0.81"
## [1] "Coeficiente de variación: 1.22%"
##
## Tamaño de muestra: 100 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 100 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: -0.12"
## [1] "Prueba Shapiro-Wilk: 0.32"
## [1] "Coeficiente de variación: 0.97%"
##
## Tamaño de muestra: 200 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 200 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: -0.25"
## [1] "Prueba Shapiro-Wilk: 0.07"
## [1] "Coeficiente de variación: 0.67%"
##
## Tamaño de muestra: 500 y Probabilidad: 0.1
## [1] "Tamaño de muestra: 500 y Probabilidad: 0.1"
## [1] "Coeficiente de asimetría: 0.13"
## [1] "Prueba Shapiro-Wilk: 0.48"
## [1] "Coeficiente de variación: 0.44%"
##
## Tamaño de muestra: 5 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 5 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: -0.02"
## [1] "Prueba Shapiro-Wilk: 0.28"
## [1] "Coeficiente de variación: 1.43%"
##
## Tamaño de muestra: 10 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 10 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: 0.17"
## [1] "Prueba Shapiro-Wilk: 0.02"
## [1] "Coeficiente de variación: 0.92%"
##
## Tamaño de muestra: 15 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 15 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: -0.15"
## [1] "Prueba Shapiro-Wilk: 0.07"
## [1] "Coeficiente de variación: 0.82%"
##
## Tamaño de muestra: 20 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 20 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: -0.01"
## [1] "Prueba Shapiro-Wilk: 0.62"
## [1] "Coeficiente de variación: 0.71%"
##
## Tamaño de muestra: 30 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 30 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: 0.11"
## [1] "Prueba Shapiro-Wilk: 0.52"
## [1] "Coeficiente de variación: 0.59%"
##
## Tamaño de muestra: 50 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 50 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: -0.08"
## [1] "Prueba Shapiro-Wilk: 0.92"
## [1] "Coeficiente de variación: 0.45%"
##
## Tamaño de muestra: 60 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 60 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: 0.04"
## [1] "Prueba Shapiro-Wilk: 0.92"
## [1] "Coeficiente de variación: 0.37%"
##
## Tamaño de muestra: 100 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 100 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: 0.04"
## [1] "Prueba Shapiro-Wilk: 0.96"
## [1] "Coeficiente de variación: 0.32%"
##
## Tamaño de muestra: 200 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 200 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: 0.10"
## [1] "Prueba Shapiro-Wilk: 0.22"
## [1] "Coeficiente de variación: 0.22%"
##
## Tamaño de muestra: 500 y Probabilidad: 0.5
## [1] "Tamaño de muestra: 500 y Probabilidad: 0.5"
## [1] "Coeficiente de asimetría: 0.13"
## [1] "Prueba Shapiro-Wilk: 0.07"
## [1] "Coeficiente de variación: 0.13%"
##
## Tamaño de muestra: 5 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 5 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: 0.06"
## [1] "Prueba Shapiro-Wilk: 0.12"
## [1] "Coeficiente de variación: 0.48%"
##
## Tamaño de muestra: 10 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 10 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.24"
## [1] "Prueba Shapiro-Wilk: 0.10"
## [1] "Coeficiente de variación: 0.34%"
##
## Tamaño de muestra: 15 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 15 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.05"
## [1] "Prueba Shapiro-Wilk: 0.67"
## [1] "Coeficiente de variación: 0.29%"
##
## Tamaño de muestra: 20 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 20 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.16"
## [1] "Prueba Shapiro-Wilk: 0.73"
## [1] "Coeficiente de variación: 0.23%"
##
## Tamaño de muestra: 30 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 30 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.08"
## [1] "Prueba Shapiro-Wilk: 0.03"
## [1] "Coeficiente de variación: 0.19%"
##
## Tamaño de muestra: 50 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 50 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: 0.26"
## [1] "Prueba Shapiro-Wilk: 0.04"
## [1] "Coeficiente de variación: 0.14%"
##
## Tamaño de muestra: 60 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 60 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.05"
## [1] "Prueba Shapiro-Wilk: 0.55"
## [1] "Coeficiente de variación: 0.14%"
##
## Tamaño de muestra: 100 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 100 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.14"
## [1] "Prueba Shapiro-Wilk: 0.23"
## [1] "Coeficiente de variación: 0.11%"
##
## Tamaño de muestra: 200 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 200 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.04"
## [1] "Prueba Shapiro-Wilk: 0.92"
## [1] "Coeficiente de variación: 0.08%"
##
## Tamaño de muestra: 500 y Probabilidad: 0.9
## [1] "Tamaño de muestra: 500 y Probabilidad: 0.9"
## [1] "Coeficiente de asimetría: -0.13"
## [1] "Prueba Shapiro-Wilk: 0.58"
## [1] "Coeficiente de variación: 0.05%"
Debido a que las simulaciones mencionadas anteriormente, dan como salida una gran cantidad de graficas, se realizaron 3 tablas para una visualización mas compacta y poder realizar un mejor analisis a los resultados obtenidos; Cada tabla contiene probabilidades del 10%, 50%, 90% , para cada uno de los tamaños de muestra solicitados.
##
## Resumen para Probabilidad = 0.1 :
## Estimador_p Prueba_Shaprio_Wilk Coeficiente_asimetria Coeficiente_variacion
## 5 10.011600 0.41829750 0.088436253 4.1384441
## 10 10.001160 0.26692648 0.088572705 3.0231421
## 15 10.003667 0.19829906 0.148513775 2.4433699
## 20 9.985480 0.80347120 -0.024018920 2.2400277
## 30 10.005267 0.85954783 -0.059042058 1.6554056
## 50 9.991296 0.26730202 -0.133291106 1.3750226
## 60 10.000717 0.98312273 -0.027705742 1.2558069
## 100 10.004978 0.67639365 -0.056764902 0.9211920
## 200 9.996106 0.03112543 0.241458428 0.6697377
## 500 10.003136 0.97350053 -0.009696395 0.4117060
##
## Resumen para Probabilidad = 0.5 :
## Estimador_p Prueba_Shaprio_Wilk Coeficiente_asimetria Coeficiente_variacion
## 5 49.98144 0.58619319 0.044692924 1.3881878
## 10 49.99486 0.17672104 -0.029265597 0.9868257
## 15 49.97037 0.31208360 -0.174616329 0.8336551
## 20 49.99612 0.20198238 0.175255708 0.6985509
## 30 49.97724 0.60886419 0.074842260 0.5937045
## 50 49.99385 0.06914502 -0.160085008 0.4455751
## 60 49.99785 0.69297254 -0.046983798 0.4052801
## 100 50.02031 0.29754552 -0.041572544 0.3134565
## 200 50.00191 0.46713821 -0.105620010 0.2292489
## 500 49.99518 0.99170968 0.003012898 0.1360841
##
## Resumen para Probabilidad = 0.9 :
## Estimador_p Prueba_Shaprio_Wilk Coeficiente_asimetria Coeficiente_variacion
## 5 89.99220 0.24891363 0.13398290 0.47906688
## 10 90.00196 0.36719817 0.17253788 0.34287685
## 15 89.98700 0.07950219 -0.01861383 0.26958102
## 20 89.98512 0.21137712 -0.18282478 0.23235663
## 30 89.99538 0.09670377 -0.03755162 0.18715594
## 50 89.99122 0.35951729 0.14420318 0.14123818
## 60 90.00125 0.30174857 0.14246697 0.13377673
## 100 89.99576 0.94467936 0.01376217 0.10090092
## 200 90.00288 0.49072565 0.13708355 0.07170737
## 500 90.00120 0.11555856 0.07883788 0.04702248
CONCLUSIONES
A medida que aumenta el tamaño de la muestra, las estimaciones tienden a ser más precisas y estables. Esto se debe a la convergencia de la distribución muestral hacia una distribución normal, como lo establece el Teorema del Límite Central. Por lo tanto, muestras más grandes proporcionan una mejor aproximación del verdadero valor de la proporción en la población.
En tamaños de muestra pequeños, es común que los valores de la prueba Shapiro-Wilk no sigan una distribución normal. A medida que los tamaños de muestra aumentan, es más probable que los datos tiendan a una distribución normal, especialmente para probabilidades cercanas a 0.5.
Las probabilidades extremas (0.1 y 0.9) tienden a mostrar más asimetría y una mayor variabilidad en los resultados, especialmente en tamaños de muestra pequeños. Para probabilidades intermedias (como 0.5), los datos son más simétricos y estables, y con tamaños de muestra mayores, los resultados se aproximan a una distribución normal.
Respecto al coeficiente de variacion en tamaños de muestra más pequeños, se obtien un coeficiente de variación más alto, debido a la mayor variabilidad en las simulaciones. A medida que aumenta el tamaño de muestra, el coeficiente de variación se reduce, reflejando una mayor precisión en la estimación de la proporción de plantas no enfermas.
A partir de un tamaño de muestra de al menos n = 50, las muestras son estadísticamente significativas para un nivel de confianza del 95%. Esto indica que para tamaños de muestra más grandes, hay mayor confianza en la representatividad de las muestras y en la validez de las inferencias estadísticas sobre la población.
En resumen, los resultados sugieren que tanto el tamaño de muestra como la probabilidad tienen un impacto directo en la precisión y la distribución de las simulaciones. Los tamaños de muestra más grandes mejoran la precisión y la normalidad de las distribuciones, mientras que las probabilidades extremas presentan más desafíos en términos de asimetría y variabilidad.