Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población. En las investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger información sobre poblaciones.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.
-> Para esto vamos a usar datos de crímenes de reino unido
Student’s 3000 Criminals Data Data of 3000 male criminals over 20 years old undergoing their sentences in the chief prisons of England and Wales.
## [1] 924 3
## [1] 836 679 129 509 471 299 270 187 307 597 277 874 494 330 775 841 591 725
## [19] 37 105 729 878 485 677 802 913 382 601 801 852 326 911 554 422 111 404
## [37] 532 506 556 343 582 121 40 684 537 375 248 198 378 39 435 810 390 280
## [55] 672 526 642 45 402 22 718 742 193 371 499 104 894 767 492 838 616 615
## [73] 843 465 525 808 904 176 345 791 110 84 29 141 252 733 620 304 545 557
## [91] 661 287 614 145 329 487 630 498 816 619
## Var1 Var2 Freq
## 836 13.1 190.5 0
## 679 10 182.88 0
## 129 9.6 149.86 0
## 509 9.8 172.72 0
## 471 10.2 170.18 0
## 299 9.8 160.02 0
Ahora usamos tidyverse dplyr
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Var1 Var2 Freq
## 1 13.1 190.5 0
## 2 10 182.88 0
## 3 9.6 149.86 0
## 4 9.8 172.72 0
## 5 10.2 170.18 0
## 6 9.8 160.02 0
## Var1 Var2 Freq
## 1 11.3 167.64 26
## 2 12.2 170.18 17
## 3 10.1 154.94 1
## 4 11.3 160.02 24
## 5 11.1 165.1 26
## 6 11.3 165.1 39
crimd <- data.frame(crimtab)
n <- 50
crimen <- sample(1:nrow(crimd), size = n, replace = FALSE)
crimen## [1] 40 777 818 604 634 664 138 719 500 761 672 229 423 421 140 126 526 508 628
## [20] 16 271 130 577 512 451 504 457 358 785 724 127 645 41 876 885 840 548 305
## [39] 809 413 576 129 309 895 874 441 856 117 882 470
## Var1 Var2 Freq
## 836 13.1 190.5 0
## 679 10 182.88 0
## 129 9.6 149.86 0
## 509 9.8 172.72 0
## 471 10.2 170.18 0
## 299 9.8 160.02 0
## Var1 Var2 Freq
## 1 11.9 177.8 9
## 2 10.9 175.26 0
## 3 13.5 160.02 0
## 4 13.5 187.96 0
## 5 10.3 187.96 0
## 6 10.6 162.56 6
## [1] 37 3
Población por estado en México en el año 2010
*Leer datos y asignar carpeta de trabajo
## Estado Poblacion
## 1 Aguascalientes 1,184,924
## 2 Baja California 3,154,174
## 3 Baja California Sur 637,065
## 4 Campeche 822,001
## 5 Coahuila 2,748,366
## 6 Colima 650,129
Estado <- demografiamx$Estado
Poblacion <- demografiamx$Poblacion
dfc <- data.frame(Estado,Poblacion)
dim(dfc)## [1] 32 2
—-> 3 filas y 2 columnas (población para c/estado)
Seleccionamos la población de 8 estados en total de manera aleatoria:
## [1] 2,767,552 822,001 4,793,406 1,184,924 3,154,174 1,324,257
## [7] 5,485,971 7,350,355
## 32 Levels: 1,084,957 1,169,825 1,184,924 1,324,257 ... 822,001
## Estado Poblacion
## 16 Michoacán 4,348,485
## 32 Zacatecas 1,490,550
## 24 San Luis Potosí 2,585,942
## 3 Baja California Sur 637,065
## 17 Morelos 1,776,727
## 4 Campeche 822,001
## Estado Poblacion
## 1 Sinaloa 2,767,552
## 2 Campeche 822,001
## 3 Chiapas 4,793,406
## 4 Aguascalientes 1,184,924
## 5 Baja California 3,154,174
## 6 Quintana Roo 1,324,257
## Estado Poblacion
## 1 Distrito Federal 8,873,017
## 2 Colima 650,129
## 3 Jalisco 7,350,355
## 4 Baja California 3,154,174
## 5 Chiapas 4,793,406
## 6 Hidalgo 2,664,969
## [1] 7,350,355 1,632,860 4,793,406 8,873,017 15,174,272
## [6] 5,779,007 2,748,366 1,169,825
## 32 Levels: 1,084,957 1,169,825 1,184,924 1,324,257 ... 822,001
## Estado Poblacion
## 29 Tlaxcala 1,169,825
## 6 Colima 650,129
## 24 San Luis Potosí 2,585,942
## 31 Yucatán 1,953,027
## 10 Durango 1,632,860
## 26 Sonora 2,662,432