Muestreo

Muestreo aleatorio simple (M.A.S.)

  • Para esto se usaran datos de crímenes del Reino Unido
  • Student's

  • Conocer las dimensiones de los datos a usar

crime <- data.frame(crimtab)
dim(crime)
## [1] 924   3
  • Seleccionar 30 elementos al azar
#set.seed(1): fija los números para que no salgan diferentes
set.seed(1)
n <- 100
muestra <- sample(1:nrow(crime), size=n, replace = FALSE) #Con false no se repite con true si
muestra
##   [1] 836 679 129 509 471 299 270 187 307 597 277 874 494 330 775 841 591 725
##  [19]  37 105 729 878 485 677 802 913 382 601 801 852 326 911 554 422 111 404
##  [37] 532 506 556 343 582 121  40 684 537 375 248 198 378  39 435 810 390 280
##  [55] 672 526 642  45 402  22 718 742 193 371 499 104 894 767 492 838 616 615
##  [73] 843 465 525 808 904 176 345 791 110  84  29 141 252 733 620 304 545 557
##  [91] 661 287 614 145 329 487 630 498 816 619

*Asignar los elemntos de la muestra al marco de datos

crimemuestra <- crime[muestra,]
head(crimemuestra)
##     Var1   Var2 Freq
## 836 13.1  190.5    0
## 679   10 182.88    0
## 129  9.6 149.86    0
## 509  9.8 172.72    0
## 471 10.2 170.18    0
## 299  9.8 160.02    0

*Muestreo ponderado (pesos)

library(tidyverse)
## -- Attaching packages ------------------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.3     v dplyr   1.0.2
## v tidyr   1.1.1     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## -- Conflicts --------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
crimemuestra2 <- crime %>% #pipe
  sample_n(size = n, weight = Freq)
head(crimemuestra2)
##   Var1   Var2 Freq
## 1 11.3 167.64   26
## 2 12.2 170.18   17
## 3 10.1 154.94    1
## 4 11.3 160.02   24
## 5 11.1  165.1   26
## 6 11.3  165.1   39