Muestreo Aleatorio Simple

Muestreo Aleatorio con Reposición

  • Si seleccionamos una muestra de tamaño n de una población de tamaño N.
  • Cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada (equiprobable).

Muestreo aleatorio con reposición al dataset Iris tomando una muestra de tamaño 10:

sample.10.cr = sample(1:nrow(iris),10, replace = TRUE)
iris[sample.10.cr, ]

Muestreo Aleatorio sin Reposición

Repetimos el sample, pero esta vez sin devolver la muestra a la población. En este caso no se cumple la equiprobabilidad de las muestras, a no ser que se extraigan al mismo tiempo.

sample.10.sr = sample(1:nrow(iris), 10, replace = FALSE)
iris[sample.10.sr,]

Si el tamaño de la población es muy grande en relación al de la muestra, 1.000 veces mayor al menos, ambos muestreos serían equivalentes.

Muestreo Sistemático

Elegimos al azar un elemento de la población y luego tomamos en intervalos constantes los demás elementos.

primera.flor = sample(1:nrow(iris), 1)
primera.flor
## [1] 109

incremento

incremento = floor(150/10)
incremento
## [1] 15

elección

flores.elegidas.10.sis = seq(from = primera.flor, by = incremento, length.out = 10)
flores.elegidas.10.sis
##  [1] 109 124 139 154 169 184 199 214 229 244

etiquetas elegidas

flores.elegidas.10.sis = flores.elegidas.10.sis%%150
flores.elegidas.10.sis
##  [1] 109 124 139   4  19  34  49  64  79  94

subtabla de muestra

muestra.iris.10.sis = iris[flores.elegidas.10.sis,]
muestra.iris.10.sis

Muestreo Aleatorio Estratificado

El dataset Iris está compuesta por tres tipos de especies. Queremos tomar una muestra de tamaño 12

fls.muestra.setosa = sample(1:50, 4, replace = TRUE)
fls.muestra.versicolor = sample(51:100, 4, replace = TRUE)
fls.muestra.virginia = sample(101:150, 4, replace = TRUE)
muestra.iris.est = rbind(iris[fls.muestra.setosa,],
                         iris[fls.muestra.versicolor,],
                         iris[fls.muestra.virginia,])
muestra.iris.est

Muestreo por Conglomerados

Dataset WorldCup

library(faraway)
## Warning: package 'faraway' was built under R version 4.0.3
head(worldcup)

Tenemos 32 países, queremos elegir 4 conglomerados considerando tosos los jugadores de esos 4 países.

num.paises.elegidos = sample(1:32, 4, replace = FALSE)
paises.elegidos = unique(worldcup$Team)[num.paises.elegidos]
paises.elegidos
## [1] Serbia Italy  Brazil Japan 
## 32 Levels: Algeria Argentina Australia Brazil Cameroon Chile ... Uruguay
muestra.worldcup.con = worldcup[worldcup$Team%in%paises.elegidos,]
head(muestra.worldcup.con)

Muestreo Polietápico

Muestra aleatoria después de seleccionar los subconjuntos (conglomerados)

worldcup.pais1 = worldcup[worldcup$Team == paises.elegidos[1],]
worldcup.pais2 = worldcup[worldcup$Team == paises.elegidos[2],]
worldcup.pais3 = worldcup[worldcup$Team == paises.elegidos[3],]
worldcup.pais4 = worldcup[worldcup$Team == paises.elegidos[4],]

elegimos 5 jugadores de cada país

jugadores.pais1 = sample(1:dim(worldcup.pais1)[1],5,replace = FALSE)
jugadores.pais2 = sample(1:dim(worldcup.pais2)[1],5,replace = FALSE)
jugadores.pais3 = sample(1:dim(worldcup.pais3)[1],5,replace = FALSE)
jugadores.pais4 = sample(1:dim(worldcup.pais4)[1],5,replace = FALSE)
muestra.worldcup.pol = rbind(worldcup.pais1[jugadores.pais1,],
                             worldcup.pais2[jugadores.pais2,],
                             worldcup.pais3[jugadores.pais3,],
                             worldcup.pais4[jugadores.pais4,])
muestra.worldcup.pol