El tamaño de muestra es de 500.
Shapiro-Wilk normality test
data: muestra W = 0.99703, p-value = 0.06013
Lilliefors (Kolmogorov-Smirnov) normality test
data: muestra D = 0.046622, p-value = 2.509e-05
Shapiro-Francia normality test
data: muestra W = 0.99719, p-value = 0.07376
Se puede ver en el histograma que la distribución del estimador de
proporción no tiene un sesgo considerable y su distribución es normal.
Para confirmar su normalidad las pruebas Shapiro-Wilk y Shapiro-Francia
tienen valores mayores a 0.05 lo que confirma la normalidad del
indicador.
Con la grafica Q-Q podemos terminar de asegurar la
normalidad de los datos porque la mayoría de los puntos están sobre la
línea medía que representa datos normales, en los cuartiles teóricos los
extremos se pueden ver algunos valores atípicos que se salen de la
curva.
Tamaño de la muestra n=5
Shapiro-Wilk normality test
data: n5 W = 0.92662, p-value < 2.2e-16
Lilliefors (Kolmogorov-Smirnov) normality test
data: n5 D = 0.17793, p-value < 2.2e-16
Shapiro-Francia normality test
data: n5 W = 0.92748, p-value < 2.2e-16
Tamaño de la muestra n=10
Shapiro-Wilk normality test
data: n10 W = 0.96576, p-value = 1.384e-14
Lilliefors (Kolmogorov-Smirnov) normality test
data: n10 D = 0.12658, p-value < 2.2e-16
Shapiro-Francia normality test
data: n10 W = 0.96597, p-value = 3.831e-13
Tamaño de la muestra n=15
Shapiro-Wilk normality test
data: n15 W = 0.97562, p-value = 6.544e-12
Lilliefors (Kolmogorov-Smirnov) normality test
data: n15 D = 0.10413, p-value < 2.2e-16
Shapiro-Francia normality test
data: n15 W = 0.97604, p-value = 9.893e-11
Tamaño de la muestra n=20
Shapiro-Wilk normality test
data: n20 W = 0.98084, p-value = 3.38e-10
Lilliefors (Kolmogorov-Smirnov) normality test
data: n20 D = 0.096586, p-value < 2.2e-16
Shapiro-Francia normality test
data: n20 W = 0.9808, p-value = 2.384e-09
Tamaño de la muestra n=30
Shapiro-Wilk normality test
data: n30 W = 0.98686, p-value = 8.148e-08
Lilliefors (Kolmogorov-Smirnov) normality test
data: n30 D = 0.084572, p-value < 2.2e-16
Shapiro-Francia normality test
data: n30 W = 0.98688, p-value = 3.131e-07
Tamaño de la muestra n=50
Shapiro-Wilk normality test
data: n50 W = 0.9915, p-value = 1.611e-05
Lilliefors (Kolmogorov-Smirnov) normality test
data: n50 D = 0.070555, p-value = 9.812e-13
Shapiro-Francia normality test
data: n50 W = 0.99161, p-value = 3.797e-05
Tamaño de la muestra n=60
Shapiro-Wilk normality test
data: n60 W = 0.99116, p-value = 1.044e-05
Lilliefors (Kolmogorov-Smirnov) normality test
data: n60 D = 0.081247, p-value < 2.2e-16
Shapiro-Francia normality test
data: n60 W = 0.99161, p-value = 3.771e-05
Tamaño de la muestra n=100
Shapiro-Wilk normality test
data: n100 W = 0.99346, p-value = 0.0002247
Lilliefors (Kolmogorov-Smirnov) normality test
data: n100 D = 0.061205, p-value = 1.965e-09
Shapiro-Francia normality test
data: n100 W = 0.99348, p-value = 0.0003654
Tamaño de la muestra n=200
Shapiro-Wilk normality test
data: n200 W = 0.99568, p-value = 0.00658
Lilliefors (Kolmogorov-Smirnov) normality test
data: n200 D = 0.045099, p-value = 5.687e-05
Shapiro-Francia normality test
data: n200 W = 0.99504, p-value = 0.002973
Tamaño de la muestra n=500
Shapiro-Wilk normality test
data: n500 W = 0.99734, p-value = 0.09955
Lilliefors (Kolmogorov-Smirnov) normality test
data: n500 D = 0.045762, p-value = 3.998e-05
Shapiro-Francia normality test
data: n500 W = 0.99745, p-value = 0.1105
En los primeros tamaños de muestras, 5-60, lo más cercano a una
distribución normal se ve en los histogramas, pero tanto las pruebas de
normalidad como la grafica Q-Q demuestran que los datos están lejos de
una distribución normal.
A partir de las muestras de tamaño 100 es
que se empiezan a encontrar valores p más cercanos a 0.05 y los valores
en la grafica Q-Q más cercanos a la diagonal normal.
Cuando se llega a la muestra de tamaño 500 podemos confirmar que la distribución de las medias muestrales tiene una distribución normal por valores p de las pruebas Shapiro-Wilk y Shapiro-Francia, la prueba Lilliefors no permite llegar a la misma conclusión, pero puede ser porque la prueba funciona con tamaños de muestras más pequeños.
Tamaño de la muestra n=5
Tamaño de la muestra n=10
Tamaño de la muestra n=15
Tamaño de la muestra n=20
Tamaño de la muestra n=30
Tamaño de la muestra n=50
Tamaño de la muestra n=60
Shapiro-Wilk normality test
data: n60 W = 0.97724, p-value = 2.1e-11
Lilliefors (Kolmogorov-Smirnov) normality test
data: n60 D = 0.11129, p-value < 2.2e-16
Shapiro-Francia normality test
data: n60 W = 0.97724, p-value = 2.112e-10
Tamaño de la muestra n=100
Shapiro-Wilk normality test
data: n100 W = 0.98679, p-value = 7.629e-08
Lilliefors (Kolmogorov-Smirnov) normality test
data: n100 D = 0.08512, p-value < 2.2e-16
Shapiro-Francia normality test
data: n100 W = 0.98665, p-value = 2.558e-07
Tamaño de la muestra n=200
Shapiro-Wilk normality test
data: n200 W = 0.9919, p-value = 2.675e-05
Lilliefors (Kolmogorov-Smirnov) normality test
data: n200 D = 0.07015, p-value = 1.398e-12
Shapiro-Francia normality test
data: n200 W = 0.99195, p-value = 5.617e-05
Tamaño de la muestra n=500
Shapiro-Wilk normality test
data: n500 W = 0.99486, p-value = 0.001781
Lilliefors (Kolmogorov-Smirnov) normality test
data: n500 D = 0.046601, p-value = 2.537e-05
Shapiro-Francia normality test
data: n500 W = 0.99495, p-value = 0.002593
Tamaño de la muestra n=5
Tamaño de la muestra n=10
Tamaño de la muestra n=15
Tamaño de la muestra n=20
Tamaño de la muestra n=30
Tamaño de la muestra n=50
Tamaño de la muestra n=60
Shapiro-Wilk normality test
data: n60 W = 0.97945, p-value = 1.119e-10
Lilliefors (Kolmogorov-Smirnov) normality test
data: n60 D = 0.097023, p-value < 2.2e-16
Shapiro-Francia normality test
data: n60 W = 0.97949, p-value = 9.462e-10
Tamaño de la muestra n=100
Shapiro-Wilk normality test
data: n100 W = 0.98583, p-value = 2.904e-08
Lilliefors (Kolmogorov-Smirnov) normality test
data: n100 D = 0.080234, p-value < 2.2e-16
Shapiro-Francia normality test
data: n100 W = 0.98613, p-value = 1.615e-07
Tamaño de la muestra n=200
Shapiro-Wilk normality test
data: n200 W = 0.99298, p-value = 0.0001142
Lilliefors (Kolmogorov-Smirnov) normality test
data: n200 D = 0.07302, p-value = 1.082e-13
Shapiro-Francia normality test
data: n200 W = 0.99291, p-value = 0.000178
Tamaño de la muestra n=500
Shapiro-Wilk normality test
data: n500 W = 0.99407, p-value = 0.0005421
Lilliefors (Kolmogorov-Smirnov) normality test
data: n500 D = 0.054748, p-value = 1.855e-07
Shapiro-Francia normality test
data: n500 W = 0.99437, p-value = 0.001165
En ambos casos al cambiar el porcentaje de éxitos de la
población las muestras se volvieron extremadamente sesgadas hacia los
lados, esto se ve en las muestras de tamaño 60 y menores, a partir de
las muestras de tamaño 100 se empiezan a ver distribuciones cercanas a
la normal, pero al llegar a las muestras de 500 los resultados no son
los mismos que cuando el porcentaje de éxito era de 50%.
Las
gráficas no muestran una distribución tan cercana a la normal y ninguna
de las pruebas tiene valores p lo suficientemente grandes para asegurar
normalidad. Si se agrandara el tamaño de la muestra se podría compensar
el sesgo de los datos y llegar a una distribución normal de las medias
muestrales.