Problema 3 Teorema del Límite Central

El tamaño de muestra es de 500.

Shapiro-Wilk normality test

data: muestra W = 0.99703, p-value = 0.06013

Lilliefors (Kolmogorov-Smirnov) normality test

data: muestra D = 0.046622, p-value = 2.509e-05

Shapiro-Francia normality test

data: muestra W = 0.99719, p-value = 0.07376

Se puede ver en el histograma que la distribución del estimador de proporción no tiene un sesgo considerable y su distribución es normal. Para confirmar su normalidad las pruebas Shapiro-Wilk y Shapiro-Francia tienen valores mayores a 0.05 lo que confirma la normalidad del indicador.
Con la grafica Q-Q podemos terminar de asegurar la normalidad de los datos porque la mayoría de los puntos están sobre la línea medía que representa datos normales, en los cuartiles teóricos los extremos se pueden ver algunos valores atípicos que se salen de la curva.

Tamaño de la muestra n=5

Shapiro-Wilk normality test

data: n5 W = 0.92662, p-value < 2.2e-16

Lilliefors (Kolmogorov-Smirnov) normality test

data: n5 D = 0.17793, p-value < 2.2e-16

Shapiro-Francia normality test

data: n5 W = 0.92748, p-value < 2.2e-16


Tamaño de la muestra n=10

Shapiro-Wilk normality test

data: n10 W = 0.96576, p-value = 1.384e-14

Lilliefors (Kolmogorov-Smirnov) normality test

data: n10 D = 0.12658, p-value < 2.2e-16

Shapiro-Francia normality test

data: n10 W = 0.96597, p-value = 3.831e-13


Tamaño de la muestra n=15

Shapiro-Wilk normality test

data: n15 W = 0.97562, p-value = 6.544e-12

Lilliefors (Kolmogorov-Smirnov) normality test

data: n15 D = 0.10413, p-value < 2.2e-16

Shapiro-Francia normality test

data: n15 W = 0.97604, p-value = 9.893e-11


Tamaño de la muestra n=20

Shapiro-Wilk normality test

data: n20 W = 0.98084, p-value = 3.38e-10

Lilliefors (Kolmogorov-Smirnov) normality test

data: n20 D = 0.096586, p-value < 2.2e-16

Shapiro-Francia normality test

data: n20 W = 0.9808, p-value = 2.384e-09


Tamaño de la muestra n=30

Shapiro-Wilk normality test

data: n30 W = 0.98686, p-value = 8.148e-08

Lilliefors (Kolmogorov-Smirnov) normality test

data: n30 D = 0.084572, p-value < 2.2e-16

Shapiro-Francia normality test

data: n30 W = 0.98688, p-value = 3.131e-07


Tamaño de la muestra n=50

Shapiro-Wilk normality test

data: n50 W = 0.9915, p-value = 1.611e-05

Lilliefors (Kolmogorov-Smirnov) normality test

data: n50 D = 0.070555, p-value = 9.812e-13

Shapiro-Francia normality test

data: n50 W = 0.99161, p-value = 3.797e-05


Tamaño de la muestra n=60

Shapiro-Wilk normality test

data: n60 W = 0.99116, p-value = 1.044e-05

Lilliefors (Kolmogorov-Smirnov) normality test

data: n60 D = 0.081247, p-value < 2.2e-16

Shapiro-Francia normality test

data: n60 W = 0.99161, p-value = 3.771e-05


Tamaño de la muestra n=100

Shapiro-Wilk normality test

data: n100 W = 0.99346, p-value = 0.0002247

Lilliefors (Kolmogorov-Smirnov) normality test

data: n100 D = 0.061205, p-value = 1.965e-09

Shapiro-Francia normality test

data: n100 W = 0.99348, p-value = 0.0003654


Tamaño de la muestra n=200

Shapiro-Wilk normality test

data: n200 W = 0.99568, p-value = 0.00658

Lilliefors (Kolmogorov-Smirnov) normality test

data: n200 D = 0.045099, p-value = 5.687e-05

Shapiro-Francia normality test

data: n200 W = 0.99504, p-value = 0.002973


Tamaño de la muestra n=500

Shapiro-Wilk normality test

data: n500 W = 0.99734, p-value = 0.09955

Lilliefors (Kolmogorov-Smirnov) normality test

data: n500 D = 0.045762, p-value = 3.998e-05

Shapiro-Francia normality test

data: n500 W = 0.99745, p-value = 0.1105

En los primeros tamaños de muestras, 5-60, lo más cercano a una distribución normal se ve en los histogramas, pero tanto las pruebas de normalidad como la grafica Q-Q demuestran que los datos están lejos de una distribución normal.
A partir de las muestras de tamaño 100 es que se empiezan a encontrar valores p más cercanos a 0.05 y los valores en la grafica Q-Q más cercanos a la diagonal normal.

Cuando se llega a la muestra de tamaño 500 podemos confirmar que la distribución de las medias muestrales tiene una distribución normal por valores p de las pruebas Shapiro-Wilk y Shapiro-Francia, la prueba Lilliefors no permite llegar a la misma conclusión, pero puede ser porque la prueba funciona con tamaños de muestras más pequeños.


lotes con 10% de plantas enfermas

Tamaño de la muestra n=5


Tamaño de la muestra n=10


Tamaño de la muestra n=15


Tamaño de la muestra n=20


Tamaño de la muestra n=30


Tamaño de la muestra n=50


Tamaño de la muestra n=60

Shapiro-Wilk normality test

data: n60 W = 0.97724, p-value = 2.1e-11

Lilliefors (Kolmogorov-Smirnov) normality test

data: n60 D = 0.11129, p-value < 2.2e-16

Shapiro-Francia normality test

data: n60 W = 0.97724, p-value = 2.112e-10


Tamaño de la muestra n=100

Shapiro-Wilk normality test

data: n100 W = 0.98679, p-value = 7.629e-08

Lilliefors (Kolmogorov-Smirnov) normality test

data: n100 D = 0.08512, p-value < 2.2e-16

Shapiro-Francia normality test

data: n100 W = 0.98665, p-value = 2.558e-07


Tamaño de la muestra n=200

Shapiro-Wilk normality test

data: n200 W = 0.9919, p-value = 2.675e-05

Lilliefors (Kolmogorov-Smirnov) normality test

data: n200 D = 0.07015, p-value = 1.398e-12

Shapiro-Francia normality test

data: n200 W = 0.99195, p-value = 5.617e-05


Tamaño de la muestra n=500

Shapiro-Wilk normality test

data: n500 W = 0.99486, p-value = 0.001781

Lilliefors (Kolmogorov-Smirnov) normality test

data: n500 D = 0.046601, p-value = 2.537e-05

Shapiro-Francia normality test

data: n500 W = 0.99495, p-value = 0.002593


lotes con 90% de plantas enfermas

Tamaño de la muestra n=5


Tamaño de la muestra n=10


Tamaño de la muestra n=15


Tamaño de la muestra n=20


Tamaño de la muestra n=30


Tamaño de la muestra n=50


Tamaño de la muestra n=60

Shapiro-Wilk normality test

data: n60 W = 0.97945, p-value = 1.119e-10

Lilliefors (Kolmogorov-Smirnov) normality test

data: n60 D = 0.097023, p-value < 2.2e-16

Shapiro-Francia normality test

data: n60 W = 0.97949, p-value = 9.462e-10


Tamaño de la muestra n=100

Shapiro-Wilk normality test

data: n100 W = 0.98583, p-value = 2.904e-08

Lilliefors (Kolmogorov-Smirnov) normality test

data: n100 D = 0.080234, p-value < 2.2e-16

Shapiro-Francia normality test

data: n100 W = 0.98613, p-value = 1.615e-07


Tamaño de la muestra n=200

Shapiro-Wilk normality test

data: n200 W = 0.99298, p-value = 0.0001142

Lilliefors (Kolmogorov-Smirnov) normality test

data: n200 D = 0.07302, p-value = 1.082e-13

Shapiro-Francia normality test

data: n200 W = 0.99291, p-value = 0.000178


Tamaño de la muestra n=500

Shapiro-Wilk normality test

data: n500 W = 0.99407, p-value = 0.0005421

Lilliefors (Kolmogorov-Smirnov) normality test

data: n500 D = 0.054748, p-value = 1.855e-07

Shapiro-Francia normality test

data: n500 W = 0.99437, p-value = 0.001165


En ambos casos al cambiar el porcentaje de éxitos de la población las muestras se volvieron extremadamente sesgadas hacia los lados, esto se ve en las muestras de tamaño 60 y menores, a partir de las muestras de tamaño 100 se empiezan a ver distribuciones cercanas a la normal, pero al llegar a las muestras de 500 los resultados no son los mismos que cuando el porcentaje de éxito era de 50%.
Las gráficas no muestran una distribución tan cercana a la normal y ninguna de las pruebas tiene valores p lo suficientemente grandes para asegurar normalidad. Si se agrandara el tamaño de la muestra se podría compensar el sesgo de los datos y llegar a una distribución normal de las medias muestrales.