1 Objetivo

Determinar y simular muestreos

2 Descripción

Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.

3 Sustento teórico

El propósito de la estadística inferencial consiste en determinar y conocer el comportamiento sobre una población a partir de una muestra.

Una muestra es una porción, una proporción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible y sencillo que el estudio de toda la población. [@lind_estadistica_2015].

Por otra parte la importancia del muestreo como lo menciona [@anderson_estadistica_2008] es cuestión de minimizar costo de trabajo, recopilar información de una muestra es sustancialmente menor, que hacerlo de una población completa; especialmente cuando se deben realizar entrevistas personales para recopilar la información.

Finalmente, los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadísticas válidas [@lind_estadistica_2015].

3.1 Muestreo aleatorio simple

Una muestra aleatoria simple de tamaño \(n\) de una población finita de tamaño \(N\) es una muestra seleccionada de manera que cada posible muestra de tamaño \(n\) tenga la misma probabilidad de ser seleccionada [@anderson_estadistica_2008].

De un conjunto de \(N\) elementos de una población, un muestreo aleatorio simple sería una especie de rifa o tómbola para elegir de de entre los \(N\) total de población una cantidad de \(n\) número de la muestra.

3.2 Muestreo aleatorio sistemático

Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población [@lind_estadistica_2015].

Suele emplearse como alternativa al muestreo aleatorio simple, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente [@anderson_estadistica_2008].

El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población [@anderson_estadistica_2008]

3.3 Muestreo aleatorio estratificado

Cuando una población se divide en grupos a partir de ciertas características, el muestreo aleatorio estratificado garantiza que cada grupo o estrato se encuentre representado en la muestra [@lind_estadistica_2015].

[@anderson_estadistica_2008] describe el muestreo aleatorio estratificado en donde los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad, tipo de industria, entre otros, está a discreción de la persona que diseña la muestra.

Por otra parte, para asegurar que la muestra sea una representación imparcial de las \(N\) observaciones, se debe determinar la frecuencia relativa y a partir de ahí generar las cantidad de muestra de cada estrato. [@lind_estadistica_2015].

3.4 Muestreo por conglomerados

La población se divide en conglomerados a partir de los límites naturales geográficos u otra clase. A continuación, estos se seleccionan al azar y se toma una muestra de forma aleatoria con elementos de cada grupo [@lind_estadistica_2015].

4 Desarrollo

4.1 Cargar librerías

library(dplyr)
library(mosaic)
library(readr)
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos
library(fdth)     # Para tablas de frecuencias
library(leaflet)  # Para hacer mapas

4.2 Cargar datos

4.2.1 Cargar datos de nombres de personas

  • Se carga un conjunto de 100 nombres de personas con sus atributo de género y la actividad deportiva o cultura que practican,
  • Cargando un datos llamando a una función que construye los datos.
  • El argumento encoding significa que acepte acentos en los datos.
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/f_construir_datos_y_funciones.r", encoding = "UTF-8")

kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto de datos")
Los primeros diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
JUAN M NO NO NO SI NO SI NO NO NO NO NO SI
JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI
MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO
GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
JUANA F NO NO NO NO SI NO NO SI NO NO NO NO
ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JESÚS M NO NO SI NO NO SI NO NO SI NO NO NO
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
Las útimos diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
91 ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI
92 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
93 MARÍA TERESA F NO SI NO NO SI NO NO SI NO NO NO NO
94 IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
95 CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO
96 LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
98 AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO
99 MARÍA DE LA LUZ F NO NO NO NO NO NO SI NO NO NO NO NO
100 GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO

4.2.2 Cargar datos de alumnos

  • Se cargan os datos de alumnos inscritos en una Institución de educación superior en un semestre con los atributos o variables siguientes:

    • No de control (modificado y no real),
    • Número Consecutivo de alumno
    • Semestre que cursa
    • Créditos aprobados
    • Carga académica que cursa
    • Promedio aritmético
    • Carrera
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/datos_alumnos_lat_long.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
1 11 198 19 80.21 SISTEMAS Victoria de Durango 24.02399 -104.6702
2 11 235 10 84.33 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
3 9 235 10 95.25 SISTEMAS Victoria de Durango 24.02399 -104.6702
4 9 226 19 95.00 SISTEMAS Victoria de Durango 24.02399 -104.6702
5 10 231 14 82.32 SISTEMAS Victoria de Durango 24.02399 -104.6702
6 9 212 23 95.02 SISTEMAS Victoria de Durango 24.02399 -104.6702
7 12 221 10 79.06 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
8 9 226 9 92.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
9 9 231 4 91.08 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
10 11 222 13 80.42 SISTEMAS Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
5920 7 169 23 89.14 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5921 5 109 26 87.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5922 3 55 29 92.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5923 2 23 23 88.60 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328
5924 2 27 28 92.83 ADMINISTRACION La Esperanza 23.92139 -105.2973
5925 7 94 13 80.95 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5926 5 103 32 92.68 ADMINISTRACION La Esperanza 23.92139 -105.2973
5927 4 79 34 86.18 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5928 5 108 32 90.48 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
5929 7 169 32 92.33 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482

4.2.3 Sembrar una semilla

set.seed(2023)

4.2.4 Simular muestreos

4.2.4.1 Muestreo aleatorio simple

  • Hay que encuestar a diez personas de 100 para hacerles alguna entrevista, ¿a quienes?
  • Con el conjunto de datos seleccionar 10 personas aleatoriamente con la función sample(). Con el argumento replace=FALSE significa que no se repita el elemento seleccionado en la muestra.
N <- nrow(personas)
n <- 10
muestra <- sample(x = personas$nombres, size = n, replace = FALSE)
kable(muestra, caption = "La muestra de personas")
La muestra de personas
x
MARÍA LUISA
ALICIA
ÓSCAR
JAVIER
FRANCISCA
SALVADOR
RAÚL
SERGIO
LUIS ÁNGEL
FRANCISCO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?
N <- nrow(alumnos)
n <- 100
registros <- sample(x = 1:N, size = n, replace = FALSE) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
959 4 80 30 84.17 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519
4578 5 90 34 84.11 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
5507 9 262 10 93.96 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
207 6 137 28 87.30 SISTEMAS Victoria de Durango 24.02399 -104.6702
4141 4 70 28 79.73 QUIMICA Victoria de Durango 24.02399 -104.6702
5892 5 113 27 93.38 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
3808 4 76 24 89.29 MECATRONICA Victoria de Durango 24.02399 -104.6702
5765 3 55 29 92.58 ADMINISTRACION Los Caballos de Don Cruz 23.95737 -104.5519
384 3 50 33 86.91 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
1527 8 189 24 82.90 BIOQUIMICA La Esperanza 23.92139 -105.2973
494 10 153 29 82.15 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519
2530 9 217 13 84.89 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
5502 9 245 11 89.42 ADMINISTRACION Las Curras 24.01172 -104.4686
3238 1 NA 27 0.00 INDUSTRIAL La Esperanza 23.92139 -105.2973
4949 5 111 30 88.75 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4265 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702
4338 2 15 26 87.75 QUIMICA Victoria de Durango 24.02399 -104.6702
1022 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
2855 5 112 30 88.72 INDUSTRIAL Las Curras 24.01172 -104.4686
607 5 110 32 90.58 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
885 3 24 18 79.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
3372 10 185 29 79.24 MECANICA Victoria de Durango 24.02399 -104.6702
5119 3 48 29 85.36 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482
3617 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
2118 4 38 26 81.63 CIVIL La Criba (Don Toño) 24.18015 -104.5482
4804 8 210 25 93.86 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
966 5 32 18 82.50 ARQUITECTURA Las Curras 24.01172 -104.4686
2246 9 225 10 89.98 ELECTRICA Victoria de Durango 24.02399 -104.6702
4562 9 183 32 84.55 QUIMICA Victoria de Durango 24.02399 -104.6702
2850 8 184 21 81.83 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3939 2 16 28 82.00 MECATRONICA Victoria de Durango 24.02399 -104.6702
1576 9 119 11 77.40 CIVIL La Criba (Don Toño) 24.18015 -104.5482
4760 9 215 20 87.38 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
1095 5 54 12 84.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
672 6 133 27 92.39 ARQUITECTURA Las Curras 24.01172 -104.4686
1582 12 210 20 78.20 CIVIL La Criba (Don Toño) 24.18015 -104.5482
4513 3 56 30 89.25 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
5485 9 262 10 92.09 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
4206 1 NA 25 0.00 QUIMICA Las Curras 24.01172 -104.4686
4268 5 114 30 85.67 QUIMICA Victoria de Durango 24.02399 -104.6702
740 6 79 28 84.61 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328
5265 3 56 23 87.67 TIC La Criba (Don Toño) 24.18015 -104.5482
5280 3 46 23 85.20 TIC Victoria de Durango 24.02399 -104.6702
4522 7 172 32 86.72 QUIMICA Los Caballos de Don Cruz 23.95737 -104.5519
241 5 112 25 91.63 SISTEMAS La Esperanza 23.92139 -105.2973
5596 2 27 32 91.50 ADMINISTRACION La Esperanza 23.92139 -105.2973
4943 8 190 35 86.58 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5525 7 169 27 91.39 ADMINISTRACION Las Curras 24.01172 -104.4686
2674 10 217 18 82.33 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519
2892 5 51 29 79.50 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2444 5 90 23 82.29 ELECTRICA Victoria de Durango 24.02399 -104.6702
2844 6 139 28 88.19 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
5803 1 NA 23 0.00 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
2889 5 112 30 90.72 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5753 3 60 29 90.92 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
411 7 165 34 82.78 SISTEMAS Victoria de Durango 24.02399 -104.6702
416 3 55 28 95.17 SISTEMAS Las Curras 24.01172 -104.4686
1600 9 225 20 85.02 CIVIL La Criba (Don Toño) 24.18015 -104.5482
3267 3 51 29 94.75 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
830 5 97 26 93.50 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
5652 8 167 34 90.86 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
1489 3 52 32 91.25 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
438 5 83 30 85.06 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
3506 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
4490 4 76 32 80.13 QUIMICA La Esperanza 23.92139 -105.2973
181 2 22 28 88.80 SISTEMAS Las Curras 24.01172 -104.4686
2040 7 173 30 84.36 CIVIL Victoria de Durango 24.02399 -104.6702
1275 4 74 28 82.47 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
3499 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
375 3 55 28 89.92 SISTEMAS Los Caballos de Don Cruz 23.95737 -104.5519
3142 6 142 25 86.22 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
458 9 168 25 81.83 ARQUITECTURA La Esperanza 23.92139 -105.2973
160 7 142 26 82.65 SISTEMAS Las Curras 24.01172 -104.4686
5798 6 140 28 91.03 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
4177 3 56 30 92.17 QUIMICA Victoria de Durango 24.02399 -104.6702
864 5 110 32 87.54 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
1892 3 42 23 90.67 CIVIL Victoria de Durango 24.02399 -104.6702
1789 6 143 30 84.63 CIVIL Victoria de Durango 24.02399 -104.6702
5889 5 113 31 94.54 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
1593 10 205 25 81.16 CIVIL Victoria de Durango 24.02399 -104.6702
4664 5 88 29 85.05 QUIMICA Victoria de Durango 24.02399 -104.6702
4727 10 230 5 82.19 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
432 1 NA 27 0.00 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
3337 2 22 29 83.20 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
347 5 116 30 91.24 SISTEMAS Victoria de Durango 24.02399 -104.6702
5897 6 140 29 92.37 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
4290 10 215 5 83.34 QUIMICA Victoria de Durango 24.02399 -104.6702
4563 9 204 26 81.71 QUIMICA Victoria de Durango 24.02399 -104.6702
3480 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
3035 2 12 19 82.67 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5335 13 230 5 79.74 INFORMATICA Victoria de Durango 24.02399 -104.6702
4464 7 123 28 84.42 QUIMICA Las Curras 24.01172 -104.4686
1975 4 57 28 80.50 CIVIL Victoria de Durango 24.02399 -104.6702
12 10 179 23 82.69 SISTEMAS La Esperanza 23.92139 -105.2973
4305 2 11 25 91.67 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4917 3 49 33 89.36 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
2956 6 145 33 85.18 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519
3430 5 50 24 79.50 MECANICA Victoria de Durango 24.02399 -104.6702
440 3 13 29 84.00 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
5455 7 187 29 90.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702

4.2.4.2 3.2. Muestreo aleatorio sistemático

  • Con el conjunto de datos personas, iniciar en un valor aleatorio e identificar los siguientes de 10 en 10 hasta tener diez personas.
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
La muestra sistematizada de personas
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
7 MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
17 JUAN CARLOS M SI NO NO NO NO NO SI NO SI NO NO NO
27 RAFAEL M NO NO NO NO NO NO NO SI NO NO NO NO
37 ENRIQUE F NO NO NO NO NO NO NO NO SI NO SI NO
47 ALICIA F NO SI NO NO NO SI NO NO NO SI NO NO
57 PATRICIA F NO NO NO NO NO NO NO NO NO NO NO NO
67 SILVIA F NO NO NO NO NO NO NO NO NO SI NO NO
77 PABLO M NO NO SI NO NO NO SI SI NO NO NO NO
87 JULIO CESAR M SI NO NO NO NO NO NO SI NO NO NO NO
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?, bajo el muestreo sistematizado
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
57 9 226 4 89.10 SISTEMAS Victoria de Durango 24.02399 -104.6702
116 7 165 34 93.67 SISTEMAS Victoria de Durango 24.02399 -104.6702
175 3 50 33 90.91 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
234 7 105 22 84.00 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
293 4 83 33 86.28 SISTEMAS Victoria de Durango 24.02399 -104.6702
352 8 176 32 80.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
411 7 165 34 82.78 SISTEMAS Victoria de Durango 24.02399 -104.6702
470 9 198 29 83.33 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
529 10 172 12 79.97 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
588 4 80 30 90.28 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
647 6 124 26 83.85 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328
706 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
765 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
824 6 132 30 82.96 ARQUITECTURA La Esperanza 23.92139 -105.2973
883 6 91 30 85.53 ARQUITECTURA Las Curras 24.01172 -104.4686
942 5 88 30 83.32 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1001 3 52 24 90.50 ARQUITECTURA La Esperanza 23.92139 -105.2973
1060 1 NA 26 0.00 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
1119 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1178 9 140 23 82.81 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1237 5 79 31 81.78 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1296 8 95 28 76.81 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1355 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1414 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1473 2 18 29 82.60 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1532 3 47 25 87.09 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1591 10 225 15 80.28 CIVIL La Criba (Don Toño) 24.18015 -104.5482
1650 9 235 10 91.00 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328
1709 5 67 8 82.71 CIVIL Victoria de Durango 24.02399 -104.6702
1768 6 139 30 85.21 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519
1827 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702
1886 4 51 31 78.83 CIVIL La Criba (Don Toño) 24.18015 -104.5482
1945 3 55 30 87.33 CIVIL La Esperanza 23.92139 -105.2973
2004 4 78 18 81.06 CIVIL Victoria de Durango 24.02399 -104.6702
2063 5 121 31 87.12 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519
2122 2 27 26 80.17 CIVIL Victoria de Durango 24.02399 -104.6702
2181 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702
2240 9 221 14 92.94 ELECTRICA Victoria de Durango 24.02399 -104.6702
2299 7 160 31 88.08 ELECTRICA La Esperanza 23.92139 -105.2973
2358 7 98 9 81.04 ELECTRICA Los Arroyos (Las Colonias) 23.69142 -105.0328
2417 3 56 26 92.00 ELECTRICA La Criba (Don Toño) 24.18015 -104.5482
2476 3 51 28 85.92 ELECTRICA Victoria de Durango 24.02399 -104.6702
2535 6 104 24 82.96 ELECTRONICA Victoria de Durango 24.02399 -104.6702
2594 1 NA 25 0.00 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
2653 5 105 28 95.17 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
2712 11 235 10 80.68 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519
2771 4 75 32 80.59 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
2830 8 174 36 81.22 INDUSTRIAL Las Curras 24.01172 -104.4686
2889 5 112 30 90.72 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
2948 6 120 26 79.30 INDUSTRIAL Las Curras 24.01172 -104.4686
3007 6 142 25 83.56 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
3066 7 149 25 87.74 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3125 3 55 27 84.08 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
3184 6 139 28 84.48 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3243 3 51 29 86.83 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
3302 5 95 27 81.18 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
3361 5 87 31 84.70 INDUSTRIAL La Esperanza 23.92139 -105.2973
3420 7 132 27 83.52 MECANICA Victoria de Durango 24.02399 -104.6702
3479 7 142 35 80.45 MECANICA Victoria de Durango 24.02399 -104.6702
3538 5 108 29 84.88 MECANICA Victoria de Durango 24.02399 -104.6702
3597 5 103 34 81.17 MECANICA La Criba (Don Toño) 24.18015 -104.5482
3656 6 113 29 79.72 MECANICA Los Arroyos (Las Colonias) 23.69142 -105.0328
3715 10 178 8 79.81 MECATRONICA Victoria de Durango 24.02399 -104.6702
3774 7 159 30 87.76 MECATRONICA Victoria de Durango 24.02399 -104.6702
3833 7 151 31 82.44 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
3892 6 76 20 81.18 MECATRONICA Victoria de Durango 24.02399 -104.6702
3951 6 47 4 82.09 MECATRONICA Victoria de Durango 24.02399 -104.6702
4010 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702
4069 5 105 24 86.74 MECATRONICA Victoria de Durango 24.02399 -104.6702
4128 11 161 32 81.21 QUIMICA Victoria de Durango 24.02399 -104.6702
4187 5 109 25 87.22 QUIMICA Victoria de Durango 24.02399 -104.6702
4246 9 230 5 85.70 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
4305 2 11 25 91.67 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4364 4 86 28 88.50 QUIMICA Victoria de Durango 24.02399 -104.6702
4423 9 215 20 83.36 QUIMICA Victoria de Durango 24.02399 -104.6702
4482 2 25 30 82.00 QUIMICA Victoria de Durango 24.02399 -104.6702
4541 5 88 29 84.84 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4600 9 204 20 82.31 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
4659 7 162 30 88.71 QUIMICA Los Caballos de Don Cruz 23.95737 -104.5519
4718 10 225 10 85.17 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4777 5 107 33 87.87 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482
4836 1 NA 27 0.00 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4895 3 53 29 87.92 GESTION EMPRESARIAL Los Caballos de Don Cruz 23.95737 -104.5519
4954 2 22 26 91.20 GESTION EMPRESARIAL La Esperanza 23.92139 -105.2973
5013 2 27 27 84.50 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5072 3 54 28 93.08 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5131 3 54 28 90.75 GESTION EMPRESARIAL Las Curras 24.01172 -104.4686
5190 3 45 33 85.10 GESTION EMPRESARIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5249 2 22 27 92.40 GESTION EMPRESARIAL Los Caballos de Don Cruz 23.95737 -104.5519
5308 1 NA 26 0.00 TIC Victoria de Durango 24.02399 -104.6702
5367 7 85 18 82.58 INFORMATICA Victoria de Durango 24.02399 -104.6702
5426 7 156 33 90.29 INFORMATICA Victoria de Durango 24.02399 -104.6702
5485 9 262 10 92.09 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
5544 5 89 28 85.63 ADMINISTRACION La Esperanza 23.92139 -105.2973
5603 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5662 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5721 8 180 34 85.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5780 4 84 33 89.94 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5839 6 140 28 91.93 ADMINISTRACION Los Caballos de Don Cruz 23.95737 -104.5519
5898 2 23 28 87.80 ADMINISTRACION La Esperanza 23.92139 -105.2973

4.2.4.3 Muestreo aleatorio estratificado

  • Con el conjunto de datos de personas se trata de encontrar 10 , pero que sea representativa de acuerdo y conforme al género femenino y masculino.
  • ¿Cuál es la frecuencia relativa del género femenino?
  • ¿Cuál es la frecuencia relativa del género masculino?
  • Ambas frecuencias multiplicar por el tamaño de la muestra para garantizar imparcialidad en la muestra.
N <- nrow(personas)
n <- 10
femeninos  <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem 
## [1] 0.43
frmas 
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
La muestra de personas Femenino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
24 ROSA MARÍA F NO NO NO NO NO SI NO SI NO NO NO NO 24
42 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO 42
18 MARÍA FERNANDA F NO SI SI NO NO NO SI SI NO SI NO NO 18
4 JUANA F NO NO NO NO SI NO NO SI NO NO NO NO 4
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
La muestra de personas Masculino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
40 GABRIEL M SI NO SI NO NO SI NO NO NO NO NO NO 40
36 JUAN MANUEL M NO NO NO NO NO NO NO SI NO SI SI NO 36
7 MIGUEL ÁNGEL M NO NO NO NO NO NO NO NO SI NO NO NO 7
17 RICARDO M NO NO NO NO SI NO NO NO NO SI NO NO 17
5 ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO 5
  • Simular muestreo estratificado por carreras de alumnos determinando las frecuencias relativas por medio de la función fdt_cat()
N <- nrow(alumnos)
n <- 100
alumnos
## # A tibble: 5,929 × 9
##    Alumno Semestre `Cr. Apr.` Carga Promedio Carrera  localidad latitud longitud
##     <dbl>    <dbl>      <dbl> <dbl>    <dbl> <chr>    <chr>       <dbl>    <dbl>
##  1      1       11        198    19     80.2 SISTEMAS Victoria…    24.0    -105.
##  2      2       11        235    10     84.3 SISTEMAS Los Arro…    23.7    -105.
##  3      3        9        235    10     95.2 SISTEMAS Victoria…    24.0    -105.
##  4      4        9        226    19     95   SISTEMAS Victoria…    24.0    -105.
##  5      5       10        231    14     82.3 SISTEMAS Victoria…    24.0    -105.
##  6      6        9        212    23     95.0 SISTEMAS Victoria…    24.0    -105.
##  7      7       12        221    10     79.1 SISTEMAS La Criba…    24.2    -105.
##  8      8        9        226     9     92.5 SISTEMAS Victoria…    24.0    -105.
##  9      9        9        231     4     91.1 SISTEMAS Los Arro…    23.7    -105.
## 10     10       11        222    13     80.4 SISTEMAS Victoria…    24.0    -105.
## # ℹ 5,919 more rows
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Tabla de frecuencia de alumnos
Category f rf rf… cf cf… muestra
INDUSTRIAL 707 0.1192444 11.924439 707 11.92444 12
ARQUITECTURA 675 0.1138472 11.384719 1382 23.30916 11
CIVIL 648 0.1092933 10.929330 2030 34.23849 11
GESTION EMPRESARIAL 585 0.0986676 9.866757 2615 44.10525 10
QUIMICA 568 0.0958003 9.580030 3183 53.68528 10
ADMINISTRACION 497 0.0838253 8.382527 3680 62.06780 8
SISTEMAS 452 0.0762355 7.623545 4132 69.69135 8
BIOQUIMICA 441 0.0743802 7.438016 4573 77.12936 7
MECATRONICA 432 0.0728622 7.286220 5005 84.41558 7
MECANICA 301 0.0507674 5.076741 5306 89.49233 5
ELECTRICA 280 0.0472255 4.722550 5586 94.21488 5
ELECTRONICA 161 0.0271547 2.715466 5747 96.93034 3
INFORMATICA 101 0.0170349 1.703491 5848 98.63383 2
TIC 81 0.0136617 1.366166 5929 100.00000 1
  • ¿Cuáles alumnos?
  • Sólo simular carreras de SISTEMAS Y CIVIL
N <- nrow(alumnos)
n <- 100
sistemas  <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil 
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas.")
La muestra de alumnos de Sistemas.
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
12 10 179 23 82.69 SISTEMAS La Esperanza 23.92139 -105.2973 12
356 3 55 28 91.67 SISTEMAS La Esperanza 23.92139 -105.2973 356
336 3 45 33 82.80 SISTEMAS Victoria de Durango 24.02399 -104.6702 336
438 5 83 30 85.06 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328 438
31 11 226 9 86.88 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328 31
249 5 112 25 92.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 249
138 8 199 27 87.93 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482 138
280 1 NA 27 0.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 280
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
La muestra de alumnos de Civil
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2150 6 143 30 86.57 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 582
2202 1 NA 27 0.00 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519 634
2189 2 23 25 78.80 CIVIL La Esperanza 23.92139 -105.2973 621
2206 7 165 35 87.00 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519 638
1852 5 98 35 82.10 CIVIL Victoria de Durango 24.02399 -104.6702 284
1890 6 94 28 80.70 CIVIL Victoria de Durango 24.02399 -104.6702 322
2053 5 108 29 86.61 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 485
1703 4 71 28 86.47 CIVIL Las Curras 24.01172 -104.4686 135
1606 12 196 9 78.76 CIVIL Victoria de Durango 24.02399 -104.6702 38
1893 8 188 28 86.08 CIVIL Victoria de Durango 24.02399 -104.6702 325
1710 2 27 30 88.50 CIVIL La Criba (Don Toño) 24.18015 -104.5482 142

4.2.4.4 Muestreo por conglomerados

Mostrar los primeros diez y últimos diez alumnos verificando las tres columnas de localidad, latitud y longitud.

kable(head(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno localidad latitud longitud
1 Victoria de Durango 24.02399 -104.6702
2 Los Arroyos (Las Colonias) 23.69142 -105.0328
3 Victoria de Durango 24.02399 -104.6702
4 Victoria de Durango 24.02399 -104.6702
5 Victoria de Durango 24.02399 -104.6702
6 Victoria de Durango 24.02399 -104.6702
7 La Criba (Don Toño) 24.18015 -104.5482
8 Victoria de Durango 24.02399 -104.6702
9 Los Arroyos (Las Colonias) 23.69142 -105.0328
10 Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno localidad latitud longitud
5920 Victoria de Durango 24.02399 -104.6702
5921 Victoria de Durango 24.02399 -104.6702
5922 Victoria de Durango 24.02399 -104.6702
5923 Los Arroyos (Las Colonias) 23.69142 -105.0328
5924 La Esperanza 23.92139 -105.2973
5925 Victoria de Durango 24.02399 -104.6702
5926 La Esperanza 23.92139 -105.2973
5927 Victoria de Durango 24.02399 -104.6702
5928 La Criba (Don Toño) 24.18015 -104.5482
5929 La Criba (Don Toño) 24.18015 -104.5482

Determinar la frecuencias por localidad

N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Tabla de frecuencia de alumnos por localidad
Category f rf rf… cf cf… muestra
Victoria de Durango 3527 0.5948727 59.487266 3527 59.48727 59
La Criba (Don Toño) 750 0.1264969 12.649688 4277 72.13695 13
Los Arroyos (Las Colonias) 575 0.0969809 9.698094 4852 81.83505 10
La Esperanza 419 0.0706696 7.066959 5271 88.90201 7
Los Caballos de Don Cruz 355 0.0598752 5.987519 5626 94.88953 6
Las Curras 303 0.0511047 5.110474 5929 100.00000 5

Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.

¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad

Simular por las seis localidades

localidades <- tabla_frec$Category
localidades
## [1] "Victoria de Durango"        "La Criba (Don Toño)"       
## [3] "Los Arroyos (Las Colonias)" "La Esperanza"              
## [5] "Los Caballos de Don Cruz"   "Las Curras"
N <- nrow(alumnos)
n <- 100
# Determinar cada conglomerado
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])
# Determinar frecuencias de cada conglomerado similiar a la tabla tabla_frec
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N
# Crear muestras
muestraloc1 <- sample(x = loc1, size = round(n * frloc1, 0), replace = FALSE)
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
La muestra de alumnos de Localidad Victoria de Durango
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
5476 11 166 29 80.11 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3235
1916 6 138 35 85.66 CIVIL Victoria de Durango 24.02399 -104.6702 1129
5100 8 185 30 84.59 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2996
3366 9 142 17 77.32 MECANICA Victoria de Durango 24.02399 -104.6702 1981
1344 2 23 29 84.67 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 793
3508 6 117 30 81.42 MECANICA Victoria de Durango 24.02399 -104.6702 2064
3236 2 21 24 87.60 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1908
2121 4 80 34 85.47 CIVIL Victoria de Durango 24.02399 -104.6702 1246
3410 9 177 28 79.97 MECANICA Victoria de Durango 24.02399 -104.6702 2005
568 5 106 36 89.87 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 322
3495 3 49 31 82.00 MECANICA Victoria de Durango 24.02399 -104.6702 2053
2539 5 85 25 87.89 ELECTRONICA Victoria de Durango 24.02399 -104.6702 1496
1550 4 82 28 86.44 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 911
1633 11 206 29 79.65 CIVIL Victoria de Durango 24.02399 -104.6702 963
2230 10 208 18 82.68 ELECTRICA Victoria de Durango 24.02399 -104.6702 1308
5318 1 NA 26 0.00 TIC Victoria de Durango 24.02399 -104.6702 3131
3074 2 32 28 91.71 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1806
5622 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3320
1098 2 26 26 89.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 650
4711 10 173 25 83.05 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2778
4122 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2435
280 1 NA 27 0.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 161
5477 9 238 19 91.34 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3236
4678 9 220 15 90.98 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2757
1978 5 109 34 86.52 CIVIL Victoria de Durango 24.02399 -104.6702 1163
2193 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702 1288
5879 3 55 29 93.50 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3497
2705 14 216 19 80.39 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1591
4258 5 114 30 90.46 QUIMICA Victoria de Durango 24.02399 -104.6702 2527
414 6 137 28 84.87 SISTEMAS Victoria de Durango 24.02399 -104.6702 247
1013 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 594
3607 8 186 28 83.66 MECANICA Victoria de Durango 24.02399 -104.6702 2130
4155 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2459
961 4 46 18 83.55 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 562
945 6 134 24 87.86 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 554
3114 2 27 24 92.50 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1833
3592 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2123
5396 7 146 29 85.34 INFORMATICA Victoria de Durango 24.02399 -104.6702 3182
566 5 90 36 84.90 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 320
5665 3 55 29 94.17 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3350
2085 3 48 29 83.70 CIVIL Victoria de Durango 24.02399 -104.6702 1219
3185 6 134 32 81.97 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1877
4583 7 150 22 86.16 QUIMICA Victoria de Durango 24.02399 -104.6702 2703
5061 5 87 36 88.11 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2972
1153 9 206 29 81.84 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 686
1372 4 71 34 81.50 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 813
3717 9 178 21 83.55 MECATRONICA Victoria de Durango 24.02399 -104.6702 2205
3862 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702 2283
5716 6 125 33 88.07 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3385
2900 7 175 35 86.75 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1697
100 4 36 29 85.13 SISTEMAS Victoria de Durango 24.02399 -104.6702 61
4913 5 112 36 94.13 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2897
1354 7 167 34 86.40 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 800
2175 7 111 30 86.83 CIVIL Victoria de Durango 24.02399 -104.6702 1277
1610 9 166 26 81.14 CIVIL Victoria de Durango 24.02399 -104.6702 948
3742 3 58 28 84.38 MECATRONICA Victoria de Durango 24.02399 -104.6702 2217
1432 4 72 30 82.63 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 851
1342 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 792
1872 3 42 34 80.89 CIVIL Victoria de Durango 24.02399 -104.6702 1105
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
La muestra de alumnos de Localidad La Criba (Don Toño)
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
3130 5 77 22 84.67 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 421
536 11 174 17 82.68 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 72
844 4 80 30 89.72 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 119
807 3 48 32 89.82 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 113
3240 5 112 30 90.00 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 433
1256 6 92 33 81.19 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 189
3176 7 156 29 84.74 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 427
1359 4 69 30 82.81 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 205
3756 3 53 27 89.25 MECATRONICA La Criba (Don Toño) 24.18015 -104.5482 499
1216 5 89 27 86.45 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 180
2602 3 43 28 85.70 ELECTRONICA La Criba (Don Toño) 24.18015 -104.5482 358
881 4 80 30 90.72 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 125
2936 5 112 30 90.08 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 400
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
La muestra de alumnos de Localidad Los Arroyos (Las Colonias)
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2355 1 NA 24 0.00 ELECTRICA Los Arroyos (Las Colonias) 23.69142 -105.0328 228
9 9 231 4 91.08 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328 2
1615 12 197 19 80.24 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 149
3802 5 79 24 87.78 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328 370
3980 5 109 24 89.83 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328 390
1358 5 105 35 85.70 BIOQUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 116
5533 1 NA 27 0.00 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328 543
4507 5 114 30 88.75 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 446
3043 7 121 34 80.68 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328 304
2866 6 102 36 81.87 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328 288
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
La muestra de alumnos de Localidad La Esperanza
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
4083 7 155 36 86.33 MECATRONICA La Esperanza 23.92139 -105.2973 288
351 3 54 29 85.92 SISTEMAS La Esperanza 23.92139 -105.2973 33
3470 5 78 30 80.67 MECANICA La Esperanza 23.92139 -105.2973 244
367 5 116 30 89.88 SISTEMAS La Esperanza 23.92139 -105.2973 36
1897 4 75 34 82.81 CIVIL La Esperanza 23.92139 -105.2973 138
1421 3 52 30 86.92 BIOQUIMICA La Esperanza 23.92139 -105.2973 104
112 5 112 25 86.83 SISTEMAS La Esperanza 23.92139 -105.2973 14
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
La muestra de alumnos de Localidad Los Caballos de Don Cruz
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2920 1 NA 27 0.00 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519 179
4812 8 185 30 88.87 GESTION EMPRESARIAL Los Caballos de Don Cruz 23.95737 -104.5519 294
721 6 125 30 87.92 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 46
2429 1 NA 24 0.00 ELECTRICA Los Caballos de Don Cruz 23.95737 -104.5519 147
665 1 NA 26 0.00 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 44
615 4 60 12 82.62 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 39
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
La muestra de alumnos de Localidad Las Curras
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2788 8 182 33 80.43 INDUSTRIAL Las Curras 24.01172 -104.4686 128
5614 5 104 23 87.59 ADMINISTRACION Las Curras 24.01172 -104.4686 292
3933 7 128 33 83.67 MECATRONICA Las Curras 24.01172 -104.4686 194
3475 1 NA 26 0.00 MECANICA Las Curras 24.01172 -104.4686 171
1958 1 NA 27 0.00 CIVIL Las Curras 24.01172 -104.4686 91
4.2.4.4.1 Visualizar con mapas
  • Cargar la librerías para mapas previamente
  • Usando los valores de latitud y longitud
map<-leaflet() %>%
  addTiles() %>%
  addMarkers(lat = unique(muestraloc1$latitud ), lng = unique(muestraloc1$longitud), popup = paste(unique(muestraloc1$localidad), "Muestra de:", nrow(muestraloc1), "alumnos"))  %>%
  addMarkers(lat = unique(muestraloc2$latitud ), lng = unique(muestraloc2$longitud), popup = paste(unique(muestraloc2$localidad), "Muestra de:", nrow(muestraloc2), "alumnos")) %>%
addMarkers(lat = unique(muestraloc3$latitud ), lng = unique(muestraloc3$longitud), popup = paste(unique(muestraloc3$localidad), "Muestra de:", nrow(muestraloc3), "alumnos")) %>% 
    addMarkers(lat = unique(muestraloc4$latitud ), lng = unique(muestraloc4$longitud), popup = paste(unique(muestraloc4$localidad), "Muestra de:", nrow(muestraloc4), "alumnos")) %>%
addMarkers(lat = unique(muestraloc5$latitud ), lng = unique(muestraloc5$longitud), popup = paste(unique(muestraloc5$localidad), "Muestra de:", nrow(muestraloc5), "alumnos")) %>%
  addMarkers(lat = unique(muestraloc6$latitud ), lng = unique(muestraloc6$longitud), popup = paste(unique(muestraloc6$localidad), "Muestra de:", nrow(muestraloc6), "alumnos"))
  
  
  
  
  
# Mostrar el mapa 
map

4.2.5 Interpretación de tipos de muestreo

El muestreo aleatorio simple es útil cuando se desea obtener una muestra representativa sin sesgos, el muestreo aleatorio sistemático es eficiente para poblaciones grandes, el muestreo aleatorio estratificado permite obtener estimaciones precisas para diferentes grupos y el muestreo por conglomerados es adecuado cuando es difícil seleccionar elementos individuales y se pueden agrupar en conglomerados.

5 Referencias Bibliográficas