Muestreo
Muestreo aleatorio simple (M.A.S.)
- Para esto se usaran datos de crímenes del Reino Unido
Student's
Conocer las dimensiones de los datos a usar
crime <- data.frame(crimtab)
dim(crime)## [1] 924 3
- Seleccionar 30 elementos al azar
#set.seed(1): fija los números para que no salgan diferentes
set.seed(1)
n <- 100
muestra <- sample(1:nrow(crime), size=n, replace = FALSE) #Con false no se repite con true si
muestra## [1] 836 679 129 509 471 299 270 187 307 597 277 874 494 330 775 841 591 725
## [19] 37 105 729 878 485 677 802 913 382 601 801 852 326 911 554 422 111 404
## [37] 532 506 556 343 582 121 40 684 537 375 248 198 378 39 435 810 390 280
## [55] 672 526 642 45 402 22 718 742 193 371 499 104 894 767 492 838 616 615
## [73] 843 465 525 808 904 176 345 791 110 84 29 141 252 733 620 304 545 557
## [91] 661 287 614 145 329 487 630 498 816 619
*Asignar los elemntos de la muestra al marco de datos
crimemuestra <- crime[muestra,]
head(crimemuestra)## Var1 Var2 Freq
## 836 13.1 190.5 0
## 679 10 182.88 0
## 129 9.6 149.86 0
## 509 9.8 172.72 0
## 471 10.2 170.18 0
## 299 9.8 160.02 0
*Muestreo ponderado (pesos)
library(tidyverse)## -- Attaching packages ------------------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.2 v purrr 0.3.4
## v tibble 3.0.3 v dplyr 1.0.2
## v tidyr 1.1.1 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.5.0
## -- Conflicts --------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
crimemuestra2 <- crime %>% #pipe
sample_n(size = n, weight = Freq)
head(crimemuestra2)## Var1 Var2 Freq
## 1 11.3 167.64 26
## 2 12.2 170.18 17
## 3 10.1 154.94 1
## 4 11.3 160.02 24
## 5 11.1 165.1 26
## 6 11.3 165.1 39