Consideremos primero el caso de calcular una muestra de tamaño \(n\) de una población de \(N\) sujetos en base al Muestreo Aleatorio Simple (MAS), para lo cual se usa la ecuación del tamaño de la muestra de proporciones que se obtiene fijando el error máximo admisible y el nivel de confianza asociado a la estimación.
\[\begin{equation} n=\frac{Z^2_{_{\alpha/2}}Npq}{e^2(N-1)+Z^2_{_{\alpha/2}}pq} \end{equation}\]
Según Vivanco (2005), “el tamaño de la muestra de proporciones presenta las mismas características analíticas que el tamaño de muestra de medias” (p. 77).
En la ecuación \(N\) es la población o universo, \(Z_{_{\alpha/2}}\) es el valor tabulado del coeficiente de confianza, el coeficiente de confianza es la probabilidad que los resultados de nuestro estudio sean ciertos. El valor \(Z_{_{\alpha/2}}\) es una constante que depende del coeficiente de confianza elegido, la Tabla 1 muestra los valores de \(Z_{_{\alpha/2}}\) asociados a los niveles de confianza.
Tabla 1
Valores \(Z_{_{\alpha/2}}\) por nivel de confianza
\(Z_{_{\alpha/2}}\) | \(1.595\) | \(1.645\) | \(1.755\) | \(1.885\) | \(1.960\) | \(2.170\) | \(2.325\) | \(2.575\) |
---|---|---|---|---|---|---|---|---|
Nivel de confianza | \(89\%\) | \(90\%\) | \(92\%\) | \(94\%\) | \(95\%\) | \(97\%\) | \(98\%\) | \(99\%\) |
El producto \(pq\) es la varianza de las proporciones, donde \(p\) es la proporción que presenta el atributo y \(q\) su complementario. En otras palabras \(p\) es la proporción de individuos que poseen en la población la característica de estudio y \(q\) es la proporción de individuos que no poseen en la población las características de estudio, es decir, \(q=1-p\).
Normalmente el valor de la varianza (producto \(pq\)) es desconocido asignado \(p=q=0.5\) que garantiza la varianza máxima y por ende maximiza el valor de \(n\).
Por último, \(e^2\) es el error máximo admisible, en tanto por ciento, cuando se desconoce su valor, entonces el investigador fija un criterio que puede variar entre el 1% (0.01) y 9% (0.09).
Calcular el tamaño \(n\) de una muestra aleatoria simple de una población \(N=10, 000\) habitantes de una comunidad, fijando un error máximo admisible del 4%, un nivel de confianza del 90% y varianza máxima de \(pq=0.25\).
Solución: La varianza es máxima, por tanto, \(p=q=0.5\), el nivel de confianza es del 90%, entonces \(\alpha=10\%=0.1\) y \(Z_{_{\alpha/2}}=Z_{_{0.1/2}}=Z_{_{0.05}}=1.645\), la muestra es:
\[\begin{eqnarray} n&=&\frac{(1.645)^2(10,000)(0.25)}{(0.04)^2(10,000-1)+(1.645)^2(0.25)}=\frac{(2.706025)(10,000)(0.25)}{(0.0016)(9,999)+(2.706025)(0.25)}=\frac{6,765.0625}{15.9984+0.67650625}\\[0.30cm] &=&\frac{6,765.0625}{16.67490625}=405.7031805\approx 406 \end{eqnarray}\]
Para generar este resultado en R se implementa el siguientes código:
Z=1.645;p=0.5;q=1-p;N=10000;e=0.04
n=(Z^2*N*p*q)/(e^2*(N-1)+Z^2*p*q)
n
## [1] 405.7032
round(n,0)
## [1] 406