Rafael Borges, Escuela de Estadística, ULA, Mérida, Venezuela, borgesr@gmail.com
Este algoritmo fue propuesto por Fan, Muller & Rezucha (1962) y es muy eficiente para la selección de unidades muestrales en un Muestreo Aleatorio Simple sin reemplazo, incluso es más eficiente que otros algoritmos, como por ejemplo el de Hàjek, y puede ser usado en muchas situaciones prácticas.
El algoritmo genera de m variables aleatorias IID como una distribución uniforme U(0,1), y usar un criterio de inclusión en la muestra basado en umbral n/N, donde n van disminuyendo a medida que se va recorriendo la población.
Para mas detalles sobre este algoritmo se recomienda revisar el libro de Silva, Bianchini & Dias (2020).
Para ilustrar este algoritmo, resolvamos el ejemplo 4.2 Silva et al. (2020), del cual se ha tomado el código para la implementación del algoritmo.
Ejemplo 4.2. Supongamos una población de tamaño N=1000 unidades de la cual se desea seleccionar una muestra de tamaño n=20 unidades, utilizando el algoritmo de de Fan, Muller & Rezucha.
# # Algoritmo de Fan, Muller & Rezucha para la selección de una muestra # de n unidades de una población de tamaño NN =1000n =20s =NULL# Vector para guardar los índices de las unidades de la muestrai =0# Contador de las unidades populacionalesj =0# Contador de las unidades de la muestrawhile (n >0& N >0) { i=i+1# Geración de número pseudoaleatorio uniforme entre 0 e 1 y# comparación com la fração muestral actualizada. si es menor# qu la unidad entra en la muestra.if (runif(1) < n/N){ j = j+1 s[j]=i n = n-1# Actualizació de las cantidades de las unidades que faltan para la muestra } N = N-1# Actualiza de las unidades de la población para la selección}s=data.frame(s)names(s)=c("i")# La muestra es formada por las siguientes unidadess
Fan, C. T.; Muller, M. E. e Rezucha, I. (1962). Development of Sampling Plans by Using Sequential (Item by Item) Selection Techniques and Digital Computers. Journal of the American Statistical Association, 57(298), 387–402