Muestreo aleatorio con reposición al dataset Iris tomando una muestra de tamaño 10:
sample.10.cr = sample(1:nrow(iris),10, replace = TRUE)
iris[sample.10.cr, ]
Repetimos el sample, pero esta vez sin devolver la muestra a la población. En este caso no se cumple la equiprobabilidad de las muestras, a no ser que se extraigan al mismo tiempo.
sample.10.sr = sample(1:nrow(iris), 10, replace = FALSE)
iris[sample.10.sr,]
Si el tamaño de la población es muy grande en relación al de la muestra, 1.000 veces mayor al menos, ambos muestreos serían equivalentes.
Elegimos al azar un elemento de la población y luego tomamos en intervalos constantes los demás elementos.
primera.flor = sample(1:nrow(iris), 1)
primera.flor
## [1] 109
incremento
incremento = floor(150/10)
incremento
## [1] 15
elección
flores.elegidas.10.sis = seq(from = primera.flor, by = incremento, length.out = 10)
flores.elegidas.10.sis
## [1] 109 124 139 154 169 184 199 214 229 244
etiquetas elegidas
flores.elegidas.10.sis = flores.elegidas.10.sis%%150
flores.elegidas.10.sis
## [1] 109 124 139 4 19 34 49 64 79 94
subtabla de muestra
muestra.iris.10.sis = iris[flores.elegidas.10.sis,]
muestra.iris.10.sis
El dataset Iris está compuesta por tres tipos de especies. Queremos tomar una muestra de tamaño 12
fls.muestra.setosa = sample(1:50, 4, replace = TRUE)
fls.muestra.versicolor = sample(51:100, 4, replace = TRUE)
fls.muestra.virginia = sample(101:150, 4, replace = TRUE)
muestra.iris.est = rbind(iris[fls.muestra.setosa,],
iris[fls.muestra.versicolor,],
iris[fls.muestra.virginia,])
muestra.iris.est
library(faraway)
## Warning: package 'faraway' was built under R version 4.0.3
head(worldcup)
Tenemos 32 países, queremos elegir 4 conglomerados considerando tosos los jugadores de esos 4 países.
num.paises.elegidos = sample(1:32, 4, replace = FALSE)
paises.elegidos = unique(worldcup$Team)[num.paises.elegidos]
paises.elegidos
## [1] Serbia Italy Brazil Japan
## 32 Levels: Algeria Argentina Australia Brazil Cameroon Chile ... Uruguay
muestra.worldcup.con = worldcup[worldcup$Team%in%paises.elegidos,]
head(muestra.worldcup.con)
Muestra aleatoria después de seleccionar los subconjuntos (conglomerados)
worldcup.pais1 = worldcup[worldcup$Team == paises.elegidos[1],]
worldcup.pais2 = worldcup[worldcup$Team == paises.elegidos[2],]
worldcup.pais3 = worldcup[worldcup$Team == paises.elegidos[3],]
worldcup.pais4 = worldcup[worldcup$Team == paises.elegidos[4],]
elegimos 5 jugadores de cada país
jugadores.pais1 = sample(1:dim(worldcup.pais1)[1],5,replace = FALSE)
jugadores.pais2 = sample(1:dim(worldcup.pais2)[1],5,replace = FALSE)
jugadores.pais3 = sample(1:dim(worldcup.pais3)[1],5,replace = FALSE)
jugadores.pais4 = sample(1:dim(worldcup.pais4)[1],5,replace = FALSE)
muestra.worldcup.pol = rbind(worldcup.pais1[jugadores.pais1,],
worldcup.pais2[jugadores.pais2,],
worldcup.pais3[jugadores.pais3,],
worldcup.pais4[jugadores.pais4,])
muestra.worldcup.pol