Definicion

Una muestra aleatoria sistemática es un método de selección de una muestra de una población en la que los elementos se eligen de manera sistemática y equidistante. En otras palabras, en lugar de seleccionar elementos al azar, se elige un punto de partida al azar y luego se elige cada “k-ésimo” elemento, donde “k” es un número fijo que se determina de antemano.

El proceso de selección de una muestra aleatoria sistemática implica los siguientes pasos:

1. Definir la población (N).

2. Determinar el tamaño de la muestra (n).

3. Calcular el intervalo: El intervalo “k” se calcula dividiendo el tamaño de la población (N) entre el tamaño de la muestra deseada (n). Esto proporciona el número de elementos entre cada selección. El cálculo es: \[k = N / n\]

4. Elegir un número aleatorio: Se elige un número aleatorio entre 1 y k como punto de partida.

5. Seleccionar elementos sistemáticamente: A partir del número aleatorio seleccionado en el paso anterior, se elige cada “k-ésimo” elemento de la población hasta que se haya seleccionado el tamaño de muestra deseado.\[8+10*0=8\] \[8+10*1=18\] \[8+10*2=28\] \[8+10*2=38\] \[8+10*2=48\]

La ventaja de utilizar una muestra aleatoria sistemática es que tiende a ser más representativa que simplemente tomar elementos al azar, ya que sigue un patrón que abarca toda la población. Sin embargo, es importante destacar que si la población tiene algún tipo de patrón o ciclo intrínseco que coincide con el intervalo sistemático, la muestra podría sesgarse. Por lo tanto, es importante seleccionar el intervalo “k” de manera adecuada y asegurarse de que sea suficientemente grande para reducir cualquier sesgo potencial.

Para ampliacion del tema: https://www.netquest.com/blog/muestreo-sistematico.

Ejemplo

Supongamos que tenemos una lista ordenada de 50 estudiantes y queremos seleccionar una muestra de 5 estudiantes.

secuencia <- seq(1, min(50, length(seq(1, 50))))
secuencia_en_columnas <- matrix(secuencia, ncol = 5, nrow = 10, byrow = FALSE)

print(secuencia_en_columnas)
##       [,1] [,2] [,3] [,4] [,5]
##  [1,]    1   11   21   31   41
##  [2,]    2   12   22   32   42
##  [3,]    3   13   23   33   43
##  [4,]    4   14   24   34   44
##  [5,]    5   15   25   35   45
##  [6,]    6   16   26   36   46
##  [7,]    7   17   27   37   47
##  [8,]    8   18   28   38   48
##  [9,]    9   19   29   39   49
## [10,]   10   20   30   40   50

Calcular el intervalo de muestreo:

# Parámetros
N <- 50
n <- 5
k <- N / n

cat("Intervalo de muestreo:", k)
## Intervalo de muestreo: 10

Se elegi un numero aleatorio

archivo_numero_aleatorio <- "numero_aleatorio.txt"

# Leer el número aleatorio desde el archivo o generar uno nuevo
if (file.exists(archivo_numero_aleatorio)) {
  numero_aleatorio <- as.numeric(readLines(archivo_numero_aleatorio))
  cat("Número aleatorio recuperado desde el archivo:", numero_aleatorio, "\n")
} else {
  numero_aleatorio <- sample(1:k, 1)
  cat("Primer número aleatorio generado:", numero_aleatorio, "\n")
# Guardar el número aleatorio en el archivo
  writeLines(as.character(numero_aleatorio), archivo_numero_aleatorio)
}
## Número aleatorio recuperado desde el archivo: 8

Se calculan los elementos seleccionados de la muestra

# Generar la secuencia y la muestra utilizando el mismo número aleatorio
muestra <- seq(from = numero_aleatorio, by = k, length.out = n)
muestra <- muestra[muestra <= N]

cat("Elementos seleccionados:", muestra, "\n")
## Elementos seleccionados: 8 18 28 38 48

Error sistematico

# Calcular la desviación estándar de la muestra
desviacion_estandar <- sd(muestra)
desviacion_estandar
## [1] 15.81139
# Calcular el error estándar
tamano_muestra <- length(muestra)
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)

# Imprimir el resultado
print(error_estandar)
## [1] 7.071068

Es importante tener en cuenta que el muestre aleatorio sistematico es utilizado cuando la poblacion esta ordenada de alguna manera.