Objetivo

Determinar y simular muestreos

Descripción

Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.

1. Cargar librerías

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(mosaic)
## Warning: package 'mosaic' was built under R version 4.0.3
## Registered S3 method overwritten by 'mosaic':
##   method                           from   
##   fortify.SpatialPolygonsDataFrame ggplot2
## 
## The 'mosaic' package masks several functions from core packages in order to add 
## additional features.  The original behavior of these functions should not be affected by this.
## 
## Attaching package: 'mosaic'
## The following object is masked from 'package:Matrix':
## 
##     mean
## The following object is masked from 'package:ggplot2':
## 
##     stat
## The following objects are masked from 'package:dplyr':
## 
##     count, do, tally
## The following objects are masked from 'package:stats':
## 
##     binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
##     quantile, sd, t.test, var
## The following objects are masked from 'package:base':
## 
##     max, mean, min, prod, range, sample, sum
library(readr)
library(ggplot2)  
library(knitr)    
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:mosaic':
## 
##     sd, var
## The following objects are masked from 'package:stats':
## 
##     sd, var

2. Cargar datos

2.1. Cargar datos de nombres de personas * Se carga un conjunto de 100 nombres de personas con sus atributo de género y la actividad deportiva o cultura que practican, * Cargando un datos llamando a una función que construye los datos. * El argumento encoding significa que acepte acentos en los datos.

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/construir%20datos%20y%20funciones%20caso%209.r", encoding = "UTF-8")

kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto dedatos")
Los primeros diez registros de nombres en el conjunto dedatos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
JUAN M NO NO NO SI NO SI NO NO NO NO NO SI
JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI
MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO
GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
JUANA F NO NO NO NO SI NO NO SI NO NO NO NO
ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JESÚS M NO NO SI NO NO SI NO NO SI NO NO NO
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
Las útimos diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
91 ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI
92 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
93 MARÍA TERESA F NO SI NO NO SI NO NO SI NO NO NO NO
94 IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
95 CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO
96 LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
98 AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO
99 MARÍA DE LA LUZ F NO NO NO NO NO NO SI NO NO NO NO NO
100 GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO

2.2. Cargar datos de alumnos Se cargan os datos de alumnos inscritos en una Institución de educación superior en el semetre septiembre 2020 a enero 2021, con los atributos siguientes: * No de control (modificado y no real), * Número Conesucutivo de alumno * Semestre que cursa * Créditos aprobados * Carga académica que cursa * Promedio aritmético * Carrera

alumnos <- alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
## Parsed with column specification:
## cols(
##   `No. Control` = col_double(),
##   Alumno = col_double(),
##   Semestre = col_double(),
##   `Cr. Apr.` = col_double(),
##   Carga = col_double(),
##   Promedio = col_double(),
##   Carrera = col_character()
## )
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera
20190001 1 11 198 19 80.21 SISTEMAS
20190002 2 11 235 10 84.33 SISTEMAS
20190003 3 9 235 10 95.25 SISTEMAS
20190004 4 9 226 19 95.00 SISTEMAS
20190005 5 10 231 14 82.32 SISTEMAS
20190006 6 9 212 23 95.02 SISTEMAS
20190007 7 12 221 10 79.06 SISTEMAS
20190008 8 9 226 9 92.47 SISTEMAS
20190009 9 9 231 4 91.08 SISTEMAS
20190010 10 11 222 13 80.42 SISTEMAS
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera
20195920 5920 7 169 23 89.14 ADMINISTRACION
20195921 5921 5 109 26 87.83 ADMINISTRACION
20195922 5922 3 55 29 92.83 ADMINISTRACION
20195923 5923 2 23 23 88.60 ADMINISTRACION
20195924 5924 2 27 28 92.83 ADMINISTRACION
20195925 5925 7 94 13 80.95 ADMINISTRACION
20195926 5926 5 103 32 92.68 ADMINISTRACION
20195927 5927 4 79 34 86.18 ADMINISTRACION
20195928 5928 5 108 32 90.48 ADMINISTRACION
20195929 5929 7 169 32 92.33 ADMINISTRACION

3. Simular muestreos

3.1 Muestreo aleatorio simple * Hay que encuestar a diez personas de 100 para hacerles alguna entrevist, ¿a quienes? * Con el conjunto de datos seleccionar 10 personas aleatoriamente con al funcón sample()

N <- nrow(personas)
n <- 10
muestra <- sample(personas$nombres, n)
kable(muestra, caption = "La muestra de personas")
La muestra de personas
x
DANIEL
JUAN MANUEL
MIGUEL
GUSTAVO
FRANCISCA
RAÚL
JUAN
LUCÍA
MARÍA TERESA
JORGE
N <- nrow(alumnos)
n <- 100
muestra <- sample(N, n)
kable(alumnos[muestra, ], caption = "La muestra de alumnos")
La muestra de alumnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera
20192700 2700 9 202 19 82.26 INDUSTRIAL
20191164 1164 9 129 18 83.79 BIOQUIMICA
20191469 1469 7 150 36 80.81 BIOQUIMICA
20195645 5645 3 55 29 97.67 ADMINISTRACION
20193227 3227 7 163 30 86.30 INDUSTRIAL
20194973 4973 6 133 33 85.54 GESTION EMPRESARIAL
20195866 5866 1 NA 27 0.00 ADMINISTRACION
20191513 1513 6 67 34 78.60 BIOQUIMICA
20194076 4076 7 144 32 88.52 MECATRONICA
20192521 2521 9 222 23 86.40 ELECTRONICA
20195624 5624 3 55 29 96.67 ADMINISTRACION
20194985 4985 4 55 29 80.42 GESTION EMPRESARIAL
20195075 5075 5 116 32 87.71 GESTION EMPRESARIAL
20195041 5041 7 140 35 82.27 GESTION EMPRESARIAL
20190395 395 1 NA 27 0.00 SISTEMAS
20193795 3795 4 66 29 86.47 MECATRONICA
20195683 5683 1 NA 27 0.00 ADMINISTRACION
20191577 1577 9 165 16 78.86 CIVIL
20192306 2306 5 89 27 86.33 ELECTRICA
20193510 3510 3 41 24 76.80 MECANICA
20191415 1415 6 123 29 82.48 BIOQUIMICA
20190830 830 5 97 26 93.50 ARQUITECTURA
20190200 200 7 107 17 79.26 SISTEMAS
20195484 5484 11 257 5 87.44 ADMINISTRACION
20190025 25 11 230 15 84.02 SISTEMAS
20192596 2596 3 52 25 92.67 ELECTRONICA
20193863 3863 1 NA 25 0.00 MECATRONICA
20190074 74 10 230 15 83.94 SISTEMAS
20191933 1933 1 NA 27 0.00 CIVIL
20191691 1691 4 75 32 84.19 CIVIL
20192587 2587 5 90 20 83.50 ELECTRONICA
20190886 886 1 NA 26 0.00 ARQUITECTURA
20194827 4827 7 150 25 88.75 GESTION EMPRESARIAL
20194756 4756 9 230 15 91.77 GESTION EMPRESARIAL
20190663 663 7 151 23 85.22 ARQUITECTURA
20192503 2503 10 202 23 81.25 ELECTRONICA
20194892 4892 1 NA 27 0.00 GESTION EMPRESARIAL
20194549 4549 6 133 23 83.25 QUIMICA
20190308 308 4 83 29 91.00 SISTEMAS
20192139 2139 6 143 30 84.77 CIVIL
20191319 1319 7 124 34 83.15 BIOQUIMICA
20195755 5755 4 84 29 87.44 ADMINISTRACION
20195920 5920 7 169 23 89.14 ADMINISTRACION
20193632 3632 1 NA 26 0.00 MECANICA
20193546 3546 3 48 22 78.64 MECANICA
20191619 1619 9 225 10 84.85 CIVIL
20191632 1632 9 159 15 80.15 CIVIL
20194890 4890 7 170 35 87.44 GESTION EMPRESARIAL
20192090 2090 4 78 33 83.59 CIVIL
20191764 1764 1 NA 27 0.00 CIVIL
20190612 612 1 NA 26 0.00 ARQUITECTURA
20191097 1097 7 139 24 84.62 ARQUITECTURA
20190796 796 7 116 34 81.12 ARQUITECTURA
20190240 240 2 27 28 92.33 SISTEMAS
20191202 1202 1 NA 23 0.00 BIOQUIMICA
20194673 4673 12 219 16 89.93 GESTION EMPRESARIAL
20195370 5370 5 41 4 81.44 INFORMATICA
20191901 1901 5 117 31 87.08 CIVIL
20193696 3696 11 231 4 83.33 MECATRONICA
20193370 3370 11 225 10 81.86 MECANICA
20191197 1197 3 57 27 82.54 BIOQUIMICA
20193032 3032 3 55 29 89.00 INDUSTRIAL
20194867 4867 1 NA 27 0.00 GESTION EMPRESARIAL
20191967 1967 1 NA 27 0.00 CIVIL
20193638 3638 7 170 27 86.59 MECANICA
20190934 934 7 170 28 88.58 ARQUITECTURA
20194100 4100 9 225 5 87.96 QUIMICA
20195193 5193 6 138 33 86.21 GESTION EMPRESARIAL
20195450 5450 10 262 10 88.60 ADMINISTRACION
20191067 1067 1 NA 26 0.00 ARQUITECTURA
20193404 3404 10 172 18 81.13 MECANICA
20194217 4217 12 225 10 78.46 QUIMICA
20191449 1449 1 NA 23 0.00 BIOQUIMICA
20192720 2720 9 202 24 82.28 INDUSTRIAL
20195151 5151 1 NA 27 0.00 GESTION EMPRESARIAL
20193110 3110 1 NA 27 0.00 INDUSTRIAL
20191051 1051 6 127 24 88.19 ARQUITECTURA
20194783 4783 1 NA 27 0.00 GESTION EMPRESARIAL
20195643 5643 2 27 28 92.67 ADMINISTRACION
20194482 4482 2 25 30 82.00 QUIMICA
20194046 4046 1 NA 25 0.00 MECATRONICA
20192183 2183 2 27 30 83.50 CIVIL
20190659 659 1 NA 26 0.00 ARQUITECTURA
20195318 5318 1 NA 26 0.00 TIC
20192101 2101 2 23 25 80.80 CIVIL
20191758 1758 4 80 34 85.94 CIVIL
20192297 2297 5 94 33 84.77 ELECTRICA
20193793 3793 7 128 31 84.46 MECATRONICA
20190822 822 3 48 32 90.45 ARQUITECTURA
20190352 352 8 176 32 80.47 SISTEMAS
20193467 3467 3 42 32 82.30 MECANICA
20190443 443 7 160 34 90.34 SISTEMAS
20190241 241 5 112 25 91.63 SISTEMAS
20194569 4569 3 51 30 88.64 QUIMICA
20193456 3456 6 89 32 78.30 MECANICA
20195534 5534 8 177 34 86.89 ADMINISTRACION
20193666 3666 12 190 5 78.35 MECATRONICA
20192155 2155 2 22 26 93.40 CIVIL
20193527 3527 1 NA 26 0.00 MECANICA
20191607 1607 10 231 4 83.15 CIVIL

3.2. Muestreo aleatorio sistemático * Con el conjunto de datos personas, iniciar en un valor aletorio e identificar los siguientes de 10 en 10 hasta tener diez personas.

N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio

cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
La muestra sistematizada de personas
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
6 GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
16 MARÍA DEL CARMEN F NO NO NO NO NO SI NO NO NO NO NO NO
26 JAVIER F NO NO NO NO NO SI NO NO NO NO SI NO
36 FRANCISCO JAVIER F SI NO NO NO NO NO NO SI NO NO SI NO
46 TERESA F NO NO NO NO NO NO NO SI NO NO NO NO
56 YOLANDA F SI NO NO NO SI NO NO NO NO NO NO NO
66 VÍCTOR MANUEL M NO SI SI SI NO NO NO NO NO NO NO NO
76 MARÍA ISABEL F NO SI NO NO NO NO NO NO NO NO NO SI
86 JOSÉ GUADALUPE M NO NO NO NO NO SI NO NO NO NO NO SI
96 LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)

cuales <- seq(from = inicio, to =N, by= saltos)

kable(alumnos[cuales, ], caption = "La muestra de alumnos")
La muestra de alumnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera
20190040 40 9 217 18 92.00 SISTEMAS
20190099 99 1 NA 27 0.00 SISTEMAS
20190158 158 1 NA 27 0.00 SISTEMAS
20190217 217 1 NA 27 0.00 SISTEMAS
20190276 276 3 8 22 80.00 SISTEMAS
20190335 335 3 50 28 92.00 SISTEMAS
20190394 394 3 50 28 88.55 SISTEMAS
20190453 453 9 219 16 89.98 ARQUITECTURA
20190512 512 9 223 4 90.24 ARQUITECTURA
20190571 571 1 NA 26 0.00 ARQUITECTURA
20190630 630 1 NA 26 0.00 ARQUITECTURA
20190689 689 1 NA 26 0.00 ARQUITECTURA
20190748 748 6 117 33 86.38 ARQUITECTURA
20190807 807 3 48 32 89.82 ARQUITECTURA
20190866 866 6 142 28 88.53 ARQUITECTURA
20190925 925 4 80 30 93.39 ARQUITECTURA
20190984 984 6 120 28 85.59 ARQUITECTURA
20191043 1043 2 26 26 88.33 ARQUITECTURA
20191102 1102 3 52 28 88.33 ARQUITECTURA
20191161 1161 9 247 11 90.62 BIOQUIMICA
20191220 1220 5 81 34 85.44 BIOQUIMICA
20191279 1279 3 52 30 97.92 BIOQUIMICA
20191338 1338 4 77 22 80.47 BIOQUIMICA
20191397 1397 4 77 28 85.71 BIOQUIMICA
20191456 1456 6 118 34 84.35 BIOQUIMICA
20191515 1515 5 99 26 86.86 BIOQUIMICA
20191574 1574 12 230 5 79.42 CIVIL
20191633 1633 11 206 29 79.65 CIVIL
20191692 1692 8 193 27 80.38 CIVIL
20191751 1751 7 175 24 87.25 CIVIL
20191810 1810 5 109 30 82.48 CIVIL
20191869 1869 3 57 24 90.83 CIVIL
20191928 1928 5 100 19 80.00 CIVIL
20191987 1987 5 101 28 83.71 CIVIL
20192046 2046 8 150 33 81.77 CIVIL
20192105 2105 8 178 30 79.41 CIVIL
20192164 2164 1 NA 27 0.00 CIVIL
20192223 2223 9 220 15 83.30 ELECTRICA
20192282 2282 5 94 26 84.09 ELECTRICA
20192341 2341 3 46 28 91.55 ELECTRICA
20192400 2400 1 NA 24 0.00 ELECTRICA
20192459 2459 1 NA 24 0.00 ELECTRICA
20192518 2518 11 192 23 83.88 ELECTRONICA
20192577 2577 3 52 25 87.67 ELECTRONICA
20192636 2636 5 105 28 92.65 ELECTRONICA
20192695 2695 9 226 4 85.18 INDUSTRIAL
20192754 2754 5 93 34 83.29 INDUSTRIAL
20192813 2813 5 98 32 83.41 INDUSTRIAL
20192872 2872 7 156 36 84.71 INDUSTRIAL
20192931 2931 2 27 24 82.83 INDUSTRIAL
20192990 2990 9 235 10 84.96 INDUSTRIAL
20193049 3049 2 27 24 81.50 INDUSTRIAL
20193108 3108 8 123 34 82.50 INDUSTRIAL
20193167 3167 2 27 28 88.33 INDUSTRIAL
20193226 3226 1 NA 27 0.00 INDUSTRIAL
20193285 3285 2 27 24 81.00 INDUSTRIAL
20193344 3344 5 55 27 86.69 INDUSTRIAL
20193403 3403 9 175 28 83.45 MECANICA
20193462 3462 7 83 30 78.05 MECANICA
20193521 3521 7 137 34 86.20 MECANICA
20193580 3580 8 175 21 85.34 MECANICA
20193639 3639 3 30 22 83.00 MECANICA
20193698 3698 9 219 16 89.63 MECATRONICA
20193757 3757 1 NA 25 0.00 MECATRONICA
20193816 3816 5 108 30 86.71 MECATRONICA
20193875 3875 4 67 23 79.07 MECATRONICA
20193934 3934 3 53 27 86.50 MECATRONICA
20193993 3993 8 151 27 79.53 MECATRONICA
20194052 4052 5 110 24 85.17 MECATRONICA
20194111 4111 9 224 6 91.26 QUIMICA
20194170 4170 10 211 24 80.44 QUIMICA
20194229 4229 3 36 30 89.25 QUIMICA
20194288 4288 13 235 10 78.98 QUIMICA
20194347 4347 7 138 24 85.07 QUIMICA
20194406 4406 4 86 28 81.44 QUIMICA
20194465 4465 9 214 21 89.05 QUIMICA
20194524 4524 10 127 13 78.89 QUIMICA
20194583 4583 7 150 22 86.16 QUIMICA
20194642 4642 2 25 31 89.17 QUIMICA
20194701 4701 9 230 5 94.75 GESTION EMPRESARIAL
20194760 4760 9 215 20 87.38 GESTION EMPRESARIAL
20194819 4819 3 54 28 87.08 GESTION EMPRESARIAL
20194878 4878 3 54 28 87.42 GESTION EMPRESARIAL
20194937 4937 7 167 33 88.00 GESTION EMPRESARIAL
20194996 4996 3 54 28 95.33 GESTION EMPRESARIAL
20195055 5055 1 NA 27 0.00 GESTION EMPRESARIAL
20195114 5114 7 185 25 95.74 GESTION EMPRESARIAL
20195173 5173 2 37 30 93.25 GESTION EMPRESARIAL
20195232 5232 3 54 28 89.08 GESTION EMPRESARIAL
20195291 5291 5 101 28 81.27 TIC
20195350 5350 9 215 16 84.57 INFORMATICA
20195409 5409 3 55 27 87.92 INFORMATICA
20195468 5468 11 240 22 84.88 ADMINISTRACION
20195527 5527 1 NA 27 0.00 ADMINISTRACION
20195586 5586 1 NA 27 0.00 ADMINISTRACION
20195645 5645 3 55 29 97.67 ADMINISTRACION
20195704 5704 5 79 29 86.06 ADMINISTRACION
20195763 5763 5 113 27 92.83 ADMINISTRACION
20195822 5822 5 113 27 95.63 ADMINISTRACION
20195881 5881 7 135 34 83.90 ADMINISTRACION

3.3. Muestreo aleatorio estratificado * Con el conjunto de datos de personas se trata de encontrar 10 , pero que sea representativa de acuerdo y conforme al género femenino y masculino. * ¿Cuál es la frecuencia relativa del género femenino? * ¿Cuál es la frecuencia relativa del género masculino? * Ambas frecuencias multiplicar por el tamaño de la muestra para garantizar imparcialidad en la muestra.

N <- nrow(personas)
n <- 10
femeninos  <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')

frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N

frfem 
## [1] 0.42
frmas 
## [1] 0.58
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
La muestra de personas Femenino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
26 GABRIELA F NO NO NO NO NO NO NO NO NO NO NO NO 26
36 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO 36
39 CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO 39
10 FRANCISCO JAVIER F SI NO NO NO NO NO NO SI NO NO SI NO 10
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
La muestra de personas Masculino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
58 GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO 58
20 RAFAEL M NO NO NO NO NO NO NO SI NO NO NO NO 20
3 JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI 3
31 ALFREDO M NO NO NO SI NO NO NO NO NO SI NO NO 31
47 RUBEN M NO SI NO NO NO NO NO NO NO NO SI NO 47
N <- nrow(alumnos)
n <- 100

tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))

tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)

kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Tabla de frecuencia de alumnos
Category f rf rf… cf cf… muestra
INDUSTRIAL 707 0.1192444 11.924439 707 11.92444 12
ARQUITECTURA 675 0.1138472 11.384719 1382 23.30916 11
CIVIL 648 0.1092933 10.929330 2030 34.23849 11
GESTION EMPRESARIAL 585 0.0986676 9.866757 2615 44.10525 10
QUIMICA 568 0.0958003 9.580030 3183 53.68528 10
ADMINISTRACION 497 0.0838253 8.382527 3680 62.06780 8
SISTEMAS 452 0.0762355 7.623545 4132 69.69135 8
BIOQUIMICA 441 0.0743802 7.438016 4573 77.12936 7
MECATRONICA 432 0.0728622 7.286220 5005 84.41558 7
MECANICA 301 0.0507674 5.076741 5306 89.49233 5
ELECTRICA 280 0.0472255 4.722550 5586 94.21488 5
ELECTRONICA 161 0.0271547 2.715466 5747 96.93034 3
INFORMATICA 101 0.0170349 1.703491 5848 98.63383 2
TIC 81 0.0136617 1.366166 5929 100.00000 1
N <- nrow(alumnos)
n <- 100
sistemas  <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')


frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N

frsistemas
## [1] 0.07623545
frcivil 
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas")
La muestra de alumnos de Sistemas
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera orig.id
20190046 46 9 221 14 90.71 SISTEMAS 46
20190130 130 4 87 33 87.89 SISTEMAS 130
20190335 335 3 50 28 92.00 SISTEMAS 335
20190142 142 3 36 23 89.13 SISTEMAS 142
20190199 199 1 NA 27 0.00 SISTEMAS 199
20190030 30 11 226 9 81.78 SISTEMAS 30
20190052 52 10 138 31 79.33 SISTEMAS 52
20190448 448 1 NA 27 0.00 SISTEMAS 448
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
La muestra de alumnos de Civil
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera orig.id
20191982 1982 6 120 31 81.36 CIVIL 414
20191847 1847 5 122 30 86.00 CIVIL 279
20192207 2207 6 38 35 77.38 CIVIL 639
20192128 2128 6 118 34 78.44 CIVIL 560
20192184 2184 1 NA 27 0.00 CIVIL 616
20191794 1794 6 137 34 87.66 CIVIL 226
20191740 1740 5 113 30 88.63 CIVIL 172
20192009 2009 4 82 31 82.71 CIVIL 441
20191578 1578 10 205 25 81.95 CIVIL 10
20191905 1905 7 154 32 82.64 CIVIL 337
20191984 1984 6 133 30 86.79 CIVIL 416

3.4. Muestreo por conglomerados * En un proceso de simulación, al conjunto de datos alumnos agregar tres columnas: la localidad, latidud y longitud * Primero cargar datos de localidades de Durango

N <- nrow(alumnos)
n <- 100

locdurangomx <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/locdurangomx.csv", encoding = "UTF-8")

Segundo por medio de función sample() generar cinco registros aleatorios de localidades y agregar un sexto registro de Victoria de Durango.

set.seed(1000)
localidades6 <- locdurangomx[sample(nrow(locdurangomx), 5), ]

localidades6 <- rbind(localidades6, locdurangomx[1,])
registros <- locdurangomx[sample(localidades6$X, N, replace = TRUE, prob = c(.10, 0.12, 0.05, 0.07, 0.06, 0.60)),c("Nom_Loc", "Lat_Decimal", "Lon_Decimal")]

alumnos$localidad <- registros$Nom_Loc
alumnos$latitud <- registros$Lat_Decimal
alumnos$longitud <- registros$Lon_Decimal

kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
20190001 1 11 198 19 80.21 SISTEMAS Las Aves 23.94883 -104.5715
20190002 2 11 235 10 84.33 SISTEMAS Victoria de Durango 24.02399 -104.6702
20190003 3 9 235 10 95.25 SISTEMAS Victoria de Durango 24.02399 -104.6702
20190004 4 9 226 19 95.00 SISTEMAS Victoria de Durango 24.02399 -104.6702
20190005 5 10 231 14 82.32 SISTEMAS Victoria de Durango 24.02399 -104.6702
20190006 6 9 212 23 95.02 SISTEMAS Las Aves 23.94883 -104.5715
20190007 7 12 221 10 79.06 SISTEMAS Victoria de Durango 24.02399 -104.6702
20190008 8 9 226 9 92.47 SISTEMAS Los Fresnos 24.08339 -104.6095
20190009 9 9 231 4 91.08 SISTEMAS Las Aves 23.94883 -104.5715
20190010 10 11 222 13 80.42 SISTEMAS Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
20195920 5920 7 169 23 89.14 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
20195921 5921 5 109 26 87.83 ADMINISTRACION Los Fresnos 24.08339 -104.6095
20195922 5922 3 55 29 92.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
20195923 5923 2 23 23 88.60 ADMINISTRACION Michel [Granja] 24.00545 -104.7152
20195924 5924 2 27 28 92.83 ADMINISTRACION Las Brisas 23.97352 -104.5800
20195925 5925 7 94 13 80.95 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
20195926 5926 5 103 32 92.68 ADMINISTRACION Las Aves 23.94883 -104.5715
20195927 5927 4 79 34 86.18 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
20195928 5928 5 108 32 90.48 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
20195929 5929 7 169 32 92.33 ADMINISTRACION Microondas el Tecolote 24.05248 -104.8519
N <- nrow(alumnos)
n <- 100

tabla_frec <- data.frame(fdt_cat(alumnos$localidad))

tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)

kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Tabla de frecuencia de alumnos por localidad
Category f rf rf… cf cf… muestra
Victoria de Durango 3564 0.6011132 60.111317 3564 60.11132 60
Las Brisas 691 0.1165458 11.654579 4255 71.76590 12
Las Aves 626 0.1055827 10.558273 4881 82.32417 11
Los Fresnos 431 0.0726935 7.269354 5312 89.59352 7
Microondas el Tecolote 329 0.0554900 5.548997 5641 95.14252 6
Michel [Granja] 288 0.0485748 4.857480 5929 100.00000 5
N <- nrow(alumnos)
n <- 100

loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])



frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N

muestraloc1 <- sample(loc1, round(n * frloc1, 0))
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
La muestra de alumnos de Localidad Victoria de Durango
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
20195752 5752 3 55 29 95.67 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3462
20191354 1354 7 167 34 86.40 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 809
20195197 5197 8 195 25 87.88 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 3142
20194694 4694 9 230 15 92.17 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2835
20191656 1656 12 179 33 77.27 CIVIL Victoria de Durango 24.02399 -104.6702 995
20193520 3520 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2155
20191220 1220 5 81 34 85.44 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 728
20191366 1366 2 23 29 90.17 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 818
20190579 579 4 80 30 89.11 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 331
20192440 2440 1 NA 24 0.00 ELECTRICA Victoria de Durango 24.02399 -104.6702 1484
20195184 5184 3 60 29 84.85 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 3132
20191337 1337 8 186 24 84.36 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 798
20190945 945 6 134 24 87.86 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 563
20194561 4561 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2751
20190949 949 2 26 26 87.67 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 565
20190853 853 2 24 22 87.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 511
20194009 4009 2 25 28 80.67 MECATRONICA Victoria de Durango 24.02399 -104.6702 2423
20190981 981 5 110 32 89.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 587
20193423 3423 7 102 30 80.91 MECANICA Victoria de Durango 24.02399 -104.6702 2093
20195597 5597 8 207 27 93.09 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3369
20192461 2461 7 150 28 82.79 ELECTRICA Victoria de Durango 24.02399 -104.6702 1496
20191351 1351 3 52 30 85.75 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 807
20190343 343 8 165 28 81.31 SISTEMAS Victoria de Durango 24.02399 -104.6702 201
20194890 4890 7 170 35 87.44 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2947
20191348 1348 7 164 32 91.03 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 806
20190739 739 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 433
20191212 1212 7 165 36 86.37 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 723
20193020 3020 3 55 29 92.15 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1848
20191394 1394 2 23 29 86.83 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 836
20194023 4023 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702 2434
20192358 2358 7 98 9 81.04 ELECTRICA Victoria de Durango 24.02399 -104.6702 1435
20194165 4165 4 53 20 77.91 QUIMICA Victoria de Durango 24.02399 -104.6702 2522
20194937 4937 7 167 33 88.00 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2978
20192500 2500 9 197 20 84.05 ELECTRONICA Victoria de Durango 24.02399 -104.6702 1518
20190866 866 6 142 28 88.53 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 518
20190307 307 2 27 28 77.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 180
20195480 5480 9 228 24 86.23 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3304
20195413 5413 1 NA 27 0.00 INFORMATICA Victoria de Durango 24.02399 -104.6702 3267
20195861 5861 7 169 32 93.89 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3521
20190661 661 3 52 28 83.42 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 384
20191654 1654 10 171 32 78.42 CIVIL Victoria de Durango 24.02399 -104.6702 994
20194474 4474 8 205 20 83.76 QUIMICA Victoria de Durango 24.02399 -104.6702 2699
20194055 4055 3 43 14 81.10 MECATRONICA Victoria de Durango 24.02399 -104.6702 2453
20190746 746 4 76 28 89.29 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 436
20193336 3336 7 179 26 89.12 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 2038
20195409 5409 3 55 27 87.92 INFORMATICA Victoria de Durango 24.02399 -104.6702 3266
20195033 5033 3 50 28 94.45 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 3034
20190549 549 9 218 17 88.69 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 313
20192620 2620 3 47 23 86.91 ELECTRONICA Victoria de Durango 24.02399 -104.6702 1591
20190186 186 3 41 28 83.89 SISTEMAS Victoria de Durango 24.02399 -104.6702 110
20191297 1297 3 52 30 87.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 775
20193034 3034 5 85 31 88.21 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1858
20194007 4007 7 115 27 82.96 MECATRONICA Victoria de Durango 24.02399 -104.6702 2421
20195690 5690 4 79 29 88.53 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3421
20194231 4231 7 172 32 88.94 QUIMICA Victoria de Durango 24.02399 -104.6702 2561
20193544 3544 3 48 27 82.82 MECANICA Victoria de Durango 24.02399 -104.6702 2165
20192218 2218 11 235 10 84.19 ELECTRICA Victoria de Durango 24.02399 -104.6702 1345
20195545 5545 7 145 29 85.77 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3341
20194135 4135 7 172 26 85.39 QUIMICA Victoria de Durango 24.02399 -104.6702 2500
20193613 3613 3 52 24 85.50 MECANICA Victoria de Durango 24.02399 -104.6702 2207
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
La muestra de alumnos de Localidad Las Brisas
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
20192268 2268 10 216 14 83.80 ELECTRICA Las Brisas 23.97352 -104.58 262
20195323 5323 1 NA 26 0.00 TIC Las Brisas 23.97352 -104.58 631
20192994 2994 7 172 33 86.44 INDUSTRIAL Las Brisas 23.97352 -104.58 344
20194348 4348 5 114 30 89.92 QUIMICA Las Brisas 23.97352 -104.58 515
20193182 3182 2 27 24 83.00 INDUSTRIAL Las Brisas 23.97352 -104.58 375
20192346 2346 5 99 28 84.35 ELECTRICA Las Brisas 23.97352 -104.58 271
20192814 2814 7 163 35 84.35 INDUSTRIAL Las Brisas 23.97352 -104.58 326
20195766 5766 1 NA 27 0.00 ADMINISTRACION Las Brisas 23.97352 -104.58 678
20192753 2753 6 158 26 88.00 INDUSTRIAL Las Brisas 23.97352 -104.58 321
20194882 4882 3 32 31 84.43 GESTION EMPRESARIAL Las Brisas 23.97352 -104.58 577
20193378 3378 10 225 10 82.12 MECANICA Las Brisas 23.97352 -104.58 391
20191305 1305 1 NA 23 0.00 BIOQUIMICA Las Brisas 23.97352 -104.58 161
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
La muestra de alumnos de Localidad Las Aves
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
20193085 3085 5 NA 26 0.00 INDUSTRIAL Las Aves 23.94883 -104.5715 320
20190244 244 5 112 25 87.54 SISTEMAS Las Aves 23.94883 -104.5715 23
20191061 1061 8 168 32 82.86 ARQUITECTURA Las Aves 23.94883 -104.5715 121
20190039 39 9 222 13 92.21 SISTEMAS Las Aves 23.94883 -104.5715 6
20194015 4015 4 62 26 85.00 MECATRONICA Las Aves 23.94883 -104.5715 439
20191448 1448 7 174 27 87.08 BIOQUIMICA Las Aves 23.94883 -104.5715 165
20194301 4301 6 129 26 84.96 QUIMICA Las Aves 23.94883 -104.5715 462
20190390 390 5 107 30 80.26 SISTEMAS Las Aves 23.94883 -104.5715 41
20193641 3641 5 57 23 78.85 MECANICA Las Aves 23.94883 -104.5715 387
20193522 3522 1 NA 26 0.00 MECANICA Las Aves 23.94883 -104.5715 366
20190306 306 4 87 33 93.26 SISTEMAS Las Aves 23.94883 -104.5715 34
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
La muestra de alumnos de Localidad Los Fresnos
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
20194732 4732 12 225 10 86.83 GESTION EMPRESARIAL Los Fresnos 24.08339 -104.6095 310
20194974 4974 8 205 30 88.56 GESTION EMPRESARIAL Los Fresnos 24.08339 -104.6095 332
20195248 5248 1 NA 27 0.00 GESTION EMPRESARIAL Los Fresnos 24.08339 -104.6095 356
20194853 4853 2 32 27 94.57 GESTION EMPRESARIAL Los Fresnos 24.08339 -104.6095 325
20192243 2243 10 226 9 82.25 ELECTRICA Los Fresnos 24.08339 -104.6095 154
20195503 5503 10 262 10 93.87 ADMINISTRACION Los Fresnos 24.08339 -104.6095 388
20191152 1152 11 108 17 78.00 BIOQUIMICA Los Fresnos 24.08339 -104.6095 72
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
La muestra de alumnos de Localidad Microondas el Tecolote
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
20192935 2935 5 104 34 86.39 INDUSTRIAL Microondas el Tecolote 24.05248 -104.8519 168
20192340 2340 1 NA 24 0.00 ELECTRICA Microondas el Tecolote 24.05248 -104.8519 133
20191209 1209 5 104 30 82.91 BIOQUIMICA Microondas el Tecolote 24.05248 -104.8519 62
20190236 236 1 NA 27 0.00 SISTEMAS Microondas el Tecolote 24.05248 -104.8519 15
20195268 5268 5 101 28 82.55 TIC Microondas el Tecolote 24.05248 -104.8519 294
20192138 2138 5 99 33 84.43 CIVIL Microondas el Tecolote 24.05248 -104.8519 116
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
La muestra de alumnos de Localidad Michel [Granja]
No. Control Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
20193554 3554 3 52 31 86.33 MECANICA Michel [Granja] 24.00545 -104.7152 175
20194555 4555 6 133 23 83.14 QUIMICA Michel [Granja] 24.00545 -104.7152 223
20192499 2499 11 205 15 79.93 ELECTRONICA Michel [Granja] 24.00545 -104.7152 119
20192495 2495 3 51 28 92.50 ELECTRICA Michel [Granja] 24.00545 -104.7152 118
20192977 2977 8 201 28 83.67 INDUSTRIAL Michel [Granja] 24.00545 -104.7152 143
Visualizar con mapas
  • Cargar la librerías para mapas
library(leaflet)
## Warning: package 'leaflet' was built under R version 4.0.3
  • Usando los valores de latitud y longitud
map<-leaflet() %>%
  addTiles() %>%
  addMarkers(lat=localidades6$Lat_Decimal[1],lng=localidades6$Lon_Decimal[1] ,popup=localidades6$Nom_Loc[1]) %>%
   addMarkers(lat=localidades6$Lat_Decimal[2],lng=localidades6$Lon_Decimal[2] ,popup=localidades6$Nom_Loc[2]) %>%
   addMarkers(lat=localidades6$Lat_Decimal[3],lng=localidades6$Lon_Decimal[3] ,popup=localidades6$Nom_Loc[3]) %>%
   addMarkers(lat=localidades6$Lat_Decimal[4],lng=localidades6$Lon_Decimal[4] ,popup=localidades6$Nom_Loc[4]) %>%
   addMarkers  (lat=localidades6$Lat_Decimal[5],lng=localidades6$Lon_Decimal[5] ,popup=localidades6$Nom_Loc[5]) %>%
   addMarkers  (lat=localidades6$Lat_Decimal[6],lng=localidades6$Lon_Decimal[6] ,popup=localidades6$Nom_Loc[6])

map

INTERPRETACION DEL CASO

En el Caso 22 se hablará sobre el muestreo y los tipos de muestreo, en los cuales explicare a detalle en esta explicación tomando de ejemplo un ejercicio como en todos los anteriores casos.

Ejercicio 1: En este ejercicio se hablará sobre un conjunto de 100 personas con sus atributos de género y mas aparte la actividad deportiva o cultural que ellos practican, en ellos se toman los primeros 10 registros y los últimos 10 registros, esto simulando el muestreo de los datos, también sobre los datos de los alumnos que se inscribieron en el septiembre 2020 a enero de 2021 siguiendo los atributos de No. Control (por seguridad no son los verdaderos números de control ni ningún dato), el numero consecutivo de alumno, Semestre que cursa, Créditos aprobados, Carga académica que cursa, Promedio aritmético y por ultimo la Carrera, que al igual que en el anterior se toman los primeros 10 datos y los últimos. Ahora toca simular los muestreos y prácticamente el \[muestreo aleatorio simple\], es de las 100 personas que están en el conjunto únicamente escogeremos a 10 de ellas y por ende van a ser aleatoriamente que serán ah las que entrevistaremos. \[El muestreo aleatorio sistemático\], es cuando de los 100 alumnos escogeremos uno al azar y contaremos 10 y escogeremos el que este y así sucesivamente ir de 10 en 10 para finalmente a completar las 10 personas y como se puede observar en la tabla las personas escogidas ah la entrevista fue la 6,16,26,36,46,56,66,76,86,96, justamente se inicio en el 6 y se fue tomando de 10 en 10. \[El muestreo aleatorio estratificado\], en este muestreo esta un poco mas complicado ya que de el conjunto de personas las 10 que se tomaran tienen que ser representativas en cuanto al genero sea hombre o mujer para eso se tiene que sacar las frecuencias relativas de ambos géneros, en este problema dichas frecuencias son 0.42 y 0.58 lo cual este se multiplica por los 10 que son las personas y en Femenino tenemos que son 4 personas y en masculino 5 esto varia dependiendo de las personas que entrevistemos en el caso de este ejercicio son 10 pero puede variar. \[El muestreo por Conglomerados\], este es el ultimo tipo de muestreo y trata sobre un proceso de simulación esta aun mas batalloso ya que se tiene que agregar una tabla con tres columnas que son la localidad, latitud y longitud, como son personas de durango se busca la localidad de dicho estado y finalmente para darle un toque mas padre en un mapa se ubican, siendo este muestreo el más difícil que el de los demás.