1 Objetivo

Determinar y simular muestreos

2 Descripción

Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.

3 Sustento teórico

El propósito de la estadística inferencial consiste en determinar y conocer el comportamiento sobre una población a partir de una muestra.

Una muestra es una porción, una proporción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible y sencillo que el estudio de toda la población.

Por otra parte la importancia del muestreo como lo menciona es cuestión de minimizar costo de trabajo, recopilar información de una muestra es sustancialmente menor, que hacerlo de una población completa; especialmente cuando se deben realizar entrevistas personales para recopilar la información.

Finamente, los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadísticas válidas.

3.1 Muestreo aleatorio simple

Una muestra aleatoria simple de tamaño \(n\) de una población finita de tamaño \(N\) es una muestra seleccionada de manera que cada posible muestra de tamaño \(n\) tenga la misma probabilidad de ser seleccionadas.

De un conjunto de \(N\) elementos de una población, un muestreo aleatorio simple sería una especie de rifa o tómbola para elegir de de entre los \(N\) total de población una cantidad de \(n\) número de la muestra.

3.2 Muestreo aleatorio sistemático

Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población.

Suele emplearse como alternativa al muestreo aleatorio simple, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente.

El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población.

3.3 Muestreo aleatorio estratificado

Cuando una población se divide en grupos a partir de ciertas características, el muestreo aleatorio estratificado garantiza que cada grupo o estrato se encuentre representado en la muestra.

(Anderson Estadistica 2008) describe el muestreo aleatorio estratificado en donde los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad, tipo de industria, entre otros, está a discreción de la persona que diseña la muestra.

Por otra parte, para asegurar que la muestra sea una representación imparcial de las \(N\) observaciones, se debe determinar la frecuencia relativa y a partir de ahí generar las cantidad de muestra de cada estrato.

3.4 Muestreo por conglomerados

La población se divide en conglomerados a partir de los límites naturales geográficos u otra clase. A continuación, estos se seleccionan al azar y se toma una muestra de forma aleatoria con elementos de cada grupo.

4 Desarrollo

4.1 Cargar librerías

library(dplyr)
library(mosaic)
library(readr)
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos
library(fdth)     # Para tablas de frecuencias
library(leaflet)  # Para hacer mapas

4.2 Cargar datos

4.2.1 Cargar datos de nombres de personas

  • Se carga un conjunto de 100 nombres de personas con sus atributo de género y la actividad deportiva o cultura que practican,
  • Cargando un datos llamando a una función que construye los datos.
  • El argumento encoding significa que acepte acentos en los datos.
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/construir_datos_y_funciones.r", encoding = "UTF-8")
kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto dedatos")
Los primeros diez registros de nombres en el conjunto dedatos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
JUAN M NO NO NO SI NO SI NO NO NO NO NO SI
JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI
MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO
GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
JUANA F NO NO NO NO SI NO NO SI NO NO NO NO
ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JESÚS M NO NO SI NO NO SI NO NO SI NO NO NO
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
Las útimos diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
91 ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI
92 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
93 MARÍA TERESA F NO SI NO NO SI NO NO SI NO NO NO NO
94 IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
95 CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO
96 LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
98 AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO
99 MARÍA DE LA LUZ F NO NO NO NO NO NO SI NO NO NO NO NO
100 GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO

4.2.2 Cargar datos de alumnos

  • Se cargan os datos de alumnos inscritos en una Institución de educación superior en en un semestre con los atributos siguientes:

    • No de control (modificado y no real),
    • Número Consecutivo de alumno
    • Semestre que cursa
    • Créditos aprobados
    • Carga académica que cursa
    • Promedio aritmético
    • Carrera
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/datos/datos_alumnos.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
1 11 198 19 80.21 SISTEMAS Victoria de Durango 24.02399 -104.6702
2 11 235 10 84.33 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
3 9 235 10 95.25 SISTEMAS Victoria de Durango 24.02399 -104.6702
4 9 226 19 95.00 SISTEMAS Victoria de Durango 24.02399 -104.6702
5 10 231 14 82.32 SISTEMAS Victoria de Durango 24.02399 -104.6702
6 9 212 23 95.02 SISTEMAS Victoria de Durango 24.02399 -104.6702
7 12 221 10 79.06 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
8 9 226 9 92.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
9 9 231 4 91.08 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
10 11 222 13 80.42 SISTEMAS Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
5920 7 169 23 89.14 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5921 5 109 26 87.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5922 3 55 29 92.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5923 2 23 23 88.60 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328
5924 2 27 28 92.83 ADMINISTRACION La Esperanza 23.92139 -105.2973
5925 7 94 13 80.95 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5926 5 103 32 92.68 ADMINISTRACION La Esperanza 23.92139 -105.2973
5927 4 79 34 86.18 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5928 5 108 32 90.48 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
5929 7 169 32 92.33 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482

4.2.3 Sembrar una semilla

set.seed(2022)

4.2.4 Simular muestreos

4.2.4.1 Muestreo aleatorio simple

  • Hay que encuestar a diez personas de 100 para hacerles alguna entrevista, ¿a quienes?
  • Con el conjunto de datos seleccionar 10 personas aleatoriamente con la función sample(). Con el argumento replace=FALSE significa que no se repita el elemento seleccionado en la muestra.
N <- nrow(personas)
n <- 10
muestra <- sample(x = personas$nombres, size = n, replace = FALSE)
kable(muestra, caption = "La muestra de personas")
La muestra de personas
x
GUSTAVO
LUIS
RUBEN
SANTIAGO
RAMÓN
MARÍA DE GUADALUPE
GUADALUPE
ÁNGEL
AGUSTÍN
MANUEL
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?
N <- nrow(alumnos)
n <- 100
registros <- sample(x = 1:N, size = n, replace = FALSE) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
1272 4 82 28 89.11 BIOQUIMICA Los Caballos de Don Cruz 23.95737 -104.5519
1522 5 84 34 80.16 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
951 4 52 18 80.17 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
4609 1 NA 25 0.00 QUIMICA La Esperanza 23.92139 -105.2973
3379 11 163 18 79.08 MECANICA La Criba (Don Toño) 24.18015 -104.5482
800 8 173 25 82.58 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
2497 11 225 10 81.98 ELECTRONICA Victoria de Durango 24.02399 -104.6702
3938 7 170 25 82.11 MECATRONICA Las Curras 24.01172 -104.4686
2426 5 65 21 77.75 ELECTRICA Victoria de Durango 24.02399 -104.6702
1548 6 140 30 84.27 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
828 1 NA 26 0.00 ARQUITECTURA Las Curras 24.01172 -104.4686
428 6 132 33 85.69 SISTEMAS Victoria de Durango 24.02399 -104.6702
1990 2 27 30 87.83 CIVIL Victoria de Durango 24.02399 -104.6702
3007 6 142 25 83.56 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
4455 5 66 25 86.57 QUIMICA Victoria de Durango 24.02399 -104.6702
3269 6 94 32 82.95 INDUSTRIAL La Esperanza 23.92139 -105.2973
3595 5 48 20 80.73 MECANICA La Criba (Don Toño) 24.18015 -104.5482
988 7 158 36 84.97 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328
1131 12 244 15 78.49 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
4372 3 41 30 83.67 QUIMICA Victoria de Durango 24.02399 -104.6702
1598 12 219 11 78.43 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328
1608 9 235 10 79.27 CIVIL Victoria de Durango 24.02399 -104.6702
797 2 12 22 91.67 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
194 8 184 32 88.55 SISTEMAS Victoria de Durango 24.02399 -104.6702
4589 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702
2304 1 NA 24 0.00 ELECTRICA Los Caballos de Don Cruz 23.95737 -104.5519
234 7 105 22 84.00 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
5031 8 210 25 92.36 GESTION EMPRESARIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
3425 8 205 20 88.60 MECANICA La Esperanza 23.92139 -105.2973
3359 3 27 13 81.71 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2003 8 178 28 82.76 CIVIL La Esperanza 23.92139 -105.2973
1080 2 4 22 90.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
3073 6 125 22 87.36 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2430 3 42 28 82.40 ELECTRICA Victoria de Durango 24.02399 -104.6702
3091 4 69 24 80.75 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
4597 10 200 24 83.39 QUIMICA Victoria de Durango 24.02399 -104.6702
3900 7 194 21 95.12 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
5426 7 156 33 90.29 INFORMATICA Victoria de Durango 24.02399 -104.6702
2473 1 NA 24 0.00 ELECTRICA Victoria de Durango 24.02399 -104.6702
5481 9 247 10 90.69 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5368 1 NA 27 0.00 INFORMATICA Victoria de Durango 24.02399 -104.6702
1994 2 27 27 87.00 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328
3704 9 225 10 85.19 MECATRONICA Victoria de Durango 24.02399 -104.6702
4513 3 56 30 89.25 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
4088 4 76 20 90.06 MECATRONICA Las Curras 24.01172 -104.4686
3802 5 79 24 87.78 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
1242 6 124 30 83.52 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1936 5 103 33 85.86 CIVIL Victoria de Durango 24.02399 -104.6702
2647 1 NA 25 0.00 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
351 3 54 29 85.92 SISTEMAS La Esperanza 23.92139 -105.2973
1516 4 79 26 88.22 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
4997 5 123 34 94.27 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
1578 10 205 25 81.95 CIVIL Las Curras 24.01172 -104.4686
3827 3 53 27 84.92 MECATRONICA Victoria de Durango 24.02399 -104.6702
5826 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
2392 5 70 20 79.88 ELECTRICA Victoria de Durango 24.02399 -104.6702
536 11 174 17 82.68 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
5585 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
1484 3 52 30 93.50 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1871 6 97 28 78.81 CIVIL La Esperanza 23.92139 -105.2973
1221 7 170 31 90.08 BIOQUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
5230 3 53 29 86.83 GESTION EMPRESARIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5126 6 131 35 86.39 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4010 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702
4855 5 108 33 88.83 GESTION EMPRESARIAL Las Curras 24.01172 -104.4686
5399 7 160 29 87.26 INFORMATICA La Esperanza 23.92139 -105.2973
1128 11 164 32 78.83 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
5544 5 89 28 85.63 ADMINISTRACION La Esperanza 23.92139 -105.2973
1569 10 152 27 76.81 CIVIL Victoria de Durango 24.02399 -104.6702
607 5 110 32 90.58 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
3724 7 155 34 87.52 MECATRONICA La Criba (Don Toño) 24.18015 -104.5482
366 5 103 25 86.91 SISTEMAS Victoria de Durango 24.02399 -104.6702
4055 3 43 14 81.10 MECATRONICA La Esperanza 23.92139 -105.2973
4921 5 117 31 92.92 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482
2377 7 120 21 82.56 ELECTRICA Victoria de Durango 24.02399 -104.6702
5155 6 137 33 90.10 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
404 4 73 34 83.50 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
736 5 60 29 80.31 ARQUITECTURA La Esperanza 23.92139 -105.2973
239 6 129 31 83.89 SISTEMAS Victoria de Durango 24.02399 -104.6702
4076 7 144 32 88.52 MECATRONICA Victoria de Durango 24.02399 -104.6702
5058 6 142 29 85.13 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5173 2 37 30 93.25 GESTION EMPRESARIAL La Esperanza 23.92139 -105.2973
3514 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
177 1 NA 27 0.00 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
584 5 34 23 88.38 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
3409 10 163 28 79.50 MECANICA La Criba (Don Toño) 24.18015 -104.5482
4560 5 99 30 88.90 QUIMICA Victoria de Durango 24.02399 -104.6702
2546 1 NA 25 0.00 ELECTRONICA Victoria de Durango 24.02399 -104.6702
1397 4 77 28 85.71 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
4623 3 56 30 94.75 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
5025 6 53 18 80.08 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
2162 3 57 29 85.17 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328
1211 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
2869 8 207 33 85.57 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
1245 3 39 25 83.89 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1736 3 47 33 87.80 CIVIL Victoria de Durango 24.02399 -104.6702
5713 5 113 27 93.29 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328
1901 5 117 31 87.08 CIVIL La Criba (Don Toño) 24.18015 -104.5482
3195 7 72 32 87.82 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2761 2 21 30 81.80 INDUSTRIAL Victoria de Durango 24.02399 -104.6702

4.2.4.2 3.2. Muestreo aleatorio sistemático

  • Con el conjunto de datos personas, iniciar en un valor aleatorio e identificar los siguientes de 10 en 10 hasta tener diez personas.
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
La muestra sistematizada de personas
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
4 MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
14 MANUEL M NO NO NO NO NO NO SI NO NO NO NO NO
24 MIGUEL M NO NO NO SI NO NO NO NO NO NO NO NO
34 MARCO ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
44 FRANCISCA F NO NO SI NO NO NO SI NO NO NO NO NO
54 MARTHA F NO NO NO NO NO NO NO NO NO NO SI NO
64 GABRIELA F NO NO NO NO NO NO NO NO NO NO NO NO
74 ANA MARÍA F NO NO NO NO NO NO NO NO NO NO SI NO
84 JORGE JESÚS M NO SI NO NO NO NO SI NO NO NO NO NO
94 IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?, bajo el muestreo sistematizado
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
25 11 230 15 84.02 SISTEMAS Victoria de Durango 24.02399 -104.6702
84 7 165 34 82.50 SISTEMAS Victoria de Durango 24.02399 -104.6702
143 7 192 29 91.93 SISTEMAS Victoria de Durango 24.02399 -104.6702
202 3 50 28 80.73 SISTEMAS Victoria de Durango 24.02399 -104.6702
261 4 78 29 81.18 SISTEMAS Victoria de Durango 24.02399 -104.6702
320 7 165 34 88.31 SISTEMAS Victoria de Durango 24.02399 -104.6702
379 7 87 21 82.58 SISTEMAS Victoria de Durango 24.02399 -104.6702
438 5 83 30 85.06 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
497 10 227 10 88.70 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
556 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
615 4 60 12 82.62 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519
674 1 NA 26 0.00 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519
733 4 26 32 80.67 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
792 6 142 24 89.83 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
851 2 22 22 85.40 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
910 5 87 35 84.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
969 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1028 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1087 2 26 26 89.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1146 9 247 11 85.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1205 7 193 24 88.65 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1264 1 NA 23 0.00 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1323 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1382 3 52 30 89.08 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1441 3 52 30 79.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1500 1 NA 23 0.00 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1559 3 49 30 91.18 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1618 11 185 30 79.18 CIVIL Victoria de Durango 24.02399 -104.6702
1677 5 96 30 85.95 CIVIL Victoria de Durango 24.02399 -104.6702
1736 3 47 33 87.80 CIVIL Victoria de Durango 24.02399 -104.6702
1795 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702
1854 4 70 32 81.53 CIVIL La Esperanza 23.92139 -105.2973
1913 4 65 27 83.14 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328
1972 5 82 31 80.06 CIVIL Victoria de Durango 24.02399 -104.6702
2031 4 72 27 78.73 CIVIL Victoria de Durango 24.02399 -104.6702
2090 4 78 33 83.59 CIVIL Victoria de Durango 24.02399 -104.6702
2149 5 102 33 84.23 CIVIL Victoria de Durango 24.02399 -104.6702
2208 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702
2267 9 174 27 82.72 ELECTRICA Victoria de Durango 24.02399 -104.6702
2326 3 46 28 85.55 ELECTRICA Victoria de Durango 24.02399 -104.6702
2385 3 56 26 93.08 ELECTRICA Victoria de Durango 24.02399 -104.6702
2444 5 90 23 82.29 ELECTRICA Victoria de Durango 24.02399 -104.6702
2503 10 202 23 81.25 ELECTRONICA Victoria de Durango 24.02399 -104.6702
2562 1 NA 25 0.00 ELECTRONICA Victoria de Durango 24.02399 -104.6702
2621 1 NA 25 0.00 ELECTRONICA La Criba (Don Toño) 24.18015 -104.5482
2680 10 218 17 82.43 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2739 14 204 26 80.30 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2798 3 43 34 89.90 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2857 4 84 33 86.32 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2916 5 112 30 91.24 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2975 4 53 32 79.25 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3034 5 85 31 88.21 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3093 5 104 34 84.39 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
3152 7 167 29 87.95 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3211 8 206 29 83.30 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
3270 7 146 32 85.79 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3329 2 27 24 87.33 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
3388 11 225 10 79.27 MECANICA Las Curras 24.01172 -104.4686
3447 3 34 28 78.88 MECANICA Victoria de Durango 24.02399 -104.6702
3506 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
3565 3 34 32 75.63 MECANICA Victoria de Durango 24.02399 -104.6702
3624 1 NA 26 0.00 MECANICA Los Caballos de Don Cruz 23.95737 -104.5519
3683 9 176 15 81.68 MECATRONICA Los Caballos de Don Cruz 23.95737 -104.5519
3742 3 58 28 84.38 MECATRONICA Victoria de Durango 24.02399 -104.6702
3801 5 80 23 85.06 MECATRONICA Victoria de Durango 24.02399 -104.6702
3860 4 61 4 82.29 MECATRONICA Victoria de Durango 24.02399 -104.6702
3919 3 53 27 79.92 MECATRONICA Victoria de Durango 24.02399 -104.6702
3978 7 138 31 81.20 MECATRONICA Los Caballos de Don Cruz 23.95737 -104.5519
4037 7 164 20 86.77 MECATRONICA Victoria de Durango 24.02399 -104.6702
4096 7 145 21 80.52 MECATRONICA La Criba (Don Toño) 24.18015 -104.5482
4155 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702
4214 7 172 31 86.94 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4273 9 214 11 87.95 QUIMICA Victoria de Durango 24.02399 -104.6702
4332 4 86 28 79.61 QUIMICA Victoria de Durango 24.02399 -104.6702
4391 5 95 28 82.30 QUIMICA Victoria de Durango 24.02399 -104.6702
4450 7 142 26 82.17 QUIMICA Victoria de Durango 24.02399 -104.6702
4509 5 114 25 85.42 QUIMICA Los Caballos de Don Cruz 23.95737 -104.5519
4568 10 230 5 81.38 QUIMICA Las Curras 24.01172 -104.4686
4627 11 209 26 81.30 QUIMICA Las Curras 24.01172 -104.4686
4686 11 200 30 85.86 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4745 9 188 16 89.70 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4804 8 210 25 93.86 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4863 5 118 29 87.28 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4922 6 131 30 85.54 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4981 6 63 21 77.71 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5040 6 55 28 82.50 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5099 3 54 28 92.17 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5158 4 69 29 81.73 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5217 1 NA 27 0.00 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482
5276 5 106 28 87.09 TIC La Criba (Don Toño) 24.18015 -104.5482
5335 13 230 5 79.74 INFORMATICA Victoria de Durango 24.02399 -104.6702
5394 5 109 27 90.71 INFORMATICA Victoria de Durango 24.02399 -104.6702
5453 9 234 23 92.33 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
5512 6 52 32 84.73 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5571 5 108 32 92.09 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328
5630 3 55 29 93.17 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5689 8 219 27 85.93 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5748 4 84 29 89.72 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5807 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5866 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5925 7 94 13 80.95 ADMINISTRACION Victoria de Durango 24.02399 -104.6702

4.2.4.3 Muestreo aleatorio estratificado

  • Con el conjunto de datos de personas se trata de encontrar 10 , pero que sea representativa de acuerdo y conforme al género femenino y masculino.
  • ¿Cuál es la frecuencia relativa del género femenino?
  • ¿Cuál es la frecuencia relativa del género masculino?
  • Ambas frecuencias multiplicar por el tamaño de la muestra para garantizar imparcialidad en la muestra.
N <- nrow(personas)
n <- 10
femeninos  <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem 
## [1] 0.43
frmas 
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
La muestra de personas Femenino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
29 MARÍA DE GUADALUPE F NO NO NO NO SI NO NO SI NO SI NO NO 29
3 MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO 3
4 JUANA F NO NO NO NO SI NO NO SI NO NO NO NO 4
36 ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI 36
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
La muestra de personas Masculino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
47 LUIS ÁNGEL M NO NO NO NO NO NO SI NO SI NO NO NO 47
38 SALVADOR M SI NO NO NO NO NO SI NO NO NO SI NO 38
5 ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO 5
45 PABLO M NO NO SI NO NO NO SI SI NO NO NO NO 45
1 JUAN M NO NO NO SI NO SI NO NO NO NO NO SI 1
  • Simular muestreo estratificado por carreras de alumnos determinando las frecuencias relativas por medio de la función fdt_cat()
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Tabla de frecuencia de alumnos
Category f rf rf… cf cf… muestra
INDUSTRIAL 707 0.1192444 11.924439 707 11.92444 12
ARQUITECTURA 675 0.1138472 11.384719 1382 23.30916 11
CIVIL 648 0.1092933 10.929330 2030 34.23849 11
GESTION EMPRESARIAL 585 0.0986676 9.866757 2615 44.10525 10
QUIMICA 568 0.0958003 9.580030 3183 53.68528 10
ADMINISTRACION 497 0.0838253 8.382527 3680 62.06780 8
SISTEMAS 452 0.0762355 7.623545 4132 69.69135 8
BIOQUIMICA 441 0.0743802 7.438016 4573 77.12936 7
MECATRONICA 432 0.0728622 7.286220 5005 84.41558 7
MECANICA 301 0.0507674 5.076741 5306 89.49233 5
ELECTRICA 280 0.0472255 4.722550 5586 94.21488 5
ELECTRONICA 161 0.0271547 2.715466 5747 96.93034 3
INFORMATICA 101 0.0170349 1.703491 5848 98.63383 2
TIC 81 0.0136617 1.366166 5929 100.00000 1
  • ¿Cuáles alumnos?
  • Sólo simular carreras de SISTEMAS Y CIVIL
N <- nrow(alumnos)
n <- 100
sistemas  <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil 
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas.")
La muestra de alumnos de Sistemas.
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
46 9 221 14 90.71 SISTEMAS Victoria de Durango 24.02399 -104.6702 46
20 11 165 33 78.00 SISTEMAS Las Curras 24.01172 -104.4686 20
410 3 22 22 80.40 SISTEMAS Victoria de Durango 24.02399 -104.6702 410
77 1 NA 27 0.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 77
26 11 235 10 83.84 SISTEMAS Victoria de Durango 24.02399 -104.6702 26
443 7 160 34 90.34 SISTEMAS La Esperanza 23.92139 -105.2973 443
278 2 27 28 85.33 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482 278
34 11 177 29 83.92 SISTEMAS Victoria de Durango 24.02399 -104.6702 34
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
La muestra de alumnos de Civil
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
1994 2 27 27 87.00 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 426
1939 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702 371
2157 3 57 31 86.83 CIVIL Victoria de Durango 24.02399 -104.6702 589
1869 3 57 24 90.83 CIVIL Las Curras 24.01172 -104.4686 301
2193 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702 625
1810 5 109 30 82.48 CIVIL La Esperanza 23.92139 -105.2973 242
1980 8 189 32 84.21 CIVIL La Criba (Don Toño) 24.18015 -104.5482 412
1947 6 112 28 80.64 CIVIL Victoria de Durango 24.02399 -104.6702 379
1929 8 142 24 79.10 CIVIL La Esperanza 23.92139 -105.2973 361
2085 3 48 29 83.70 CIVIL Victoria de Durango 24.02399 -104.6702 517
2216 3 52 33 84.45 CIVIL Victoria de Durango 24.02399 -104.6702 648

4.2.4.4 Muestreo por conglomerados

Mostrar los primeros diez y últimos diez alumnos verificando las tres columnas de localidad, latitud y longitud.

kable(head(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno localidad latitud longitud
1 Victoria de Durango 24.02399 -104.6702
2 Los Arroyos (Las Colonias) 23.69142 -105.0328
3 Victoria de Durango 24.02399 -104.6702
4 Victoria de Durango 24.02399 -104.6702
5 Victoria de Durango 24.02399 -104.6702
6 Victoria de Durango 24.02399 -104.6702
7 La Criba (Don Toño) 24.18015 -104.5482
8 Victoria de Durango 24.02399 -104.6702
9 Los Arroyos (Las Colonias) 23.69142 -105.0328
10 Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno localidad latitud longitud
5920 Victoria de Durango 24.02399 -104.6702
5921 Victoria de Durango 24.02399 -104.6702
5922 Victoria de Durango 24.02399 -104.6702
5923 Los Arroyos (Las Colonias) 23.69142 -105.0328
5924 La Esperanza 23.92139 -105.2973
5925 Victoria de Durango 24.02399 -104.6702
5926 La Esperanza 23.92139 -105.2973
5927 Victoria de Durango 24.02399 -104.6702
5928 La Criba (Don Toño) 24.18015 -104.5482
5929 La Criba (Don Toño) 24.18015 -104.5482

Determinar la frecuencias por localidad

N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Tabla de frecuencia de alumnos por localidad
Category f rf rf… cf cf… muestra
Victoria de Durango 3527 0.5948727 59.487266 3527 59.48727 59
La Criba (Don Toño) 750 0.1264969 12.649688 4277 72.13695 13
Los Arroyos (Las Colonias) 575 0.0969809 9.698094 4852 81.83505 10
La Esperanza 419 0.0706696 7.066959 5271 88.90201 7
Los Caballos de Don Cruz 355 0.0598752 5.987519 5626 94.88953 6
Las Curras 303 0.0511047 5.110474 5929 100.00000 5

Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.

¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad

Simular por las seis localidades

localidades <- tabla_frec$Category
localidades
## [1] "Victoria de Durango"        "La Criba (Don Toño)"       
## [3] "Los Arroyos (Las Colonias)" "La Esperanza"              
## [5] "Los Caballos de Don Cruz"   "Las Curras"
N <- nrow(alumnos)
n <- 100
# Determinar cada conglomerado
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])
# Determinar frecuencias de cada conglomerado similiar a la tabla tabla_frec
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N
# Crear muestras
muestraloc1 <- sample(x = loc1, size = round(n * frloc1, 0), replace = FALSE)
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
La muestra de alumnos de Localidad Victoria de Durango
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
4286 7 167 32 88.51 QUIMICA Victoria de Durango 24.02399 -104.6702 2541
5461 11 212 28 85.98 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3223
540 9 223 12 85.72 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 305
4194 5 109 30 78.35 QUIMICA Victoria de Durango 24.02399 -104.6702 2484
1868 4 75 29 80.50 CIVIL Victoria de Durango 24.02399 -104.6702 1103
1477 5 94 29 82.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 874
852 2 20 20 90.40 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 495
4439 6 133 23 82.86 QUIMICA Victoria de Durango 24.02399 -104.6702 2623
4240 3 56 30 90.50 QUIMICA Victoria de Durango 24.02399 -104.6702 2515
5507 9 262 10 93.96 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3251
744 8 182 21 89.67 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 434
4294 4 81 28 86.24 QUIMICA Victoria de Durango 24.02399 -104.6702 2547
5550 5 98 28 84.14 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3278
5747 2 23 23 89.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3403
4620 2 22 31 86.60 QUIMICA Victoria de Durango 24.02399 -104.6702 2728
2132 3 57 29 89.58 CIVIL Victoria de Durango 24.02399 -104.6702 1254
1978 5 109 34 86.52 CIVIL Victoria de Durango 24.02399 -104.6702 1163
1944 5 118 23 94.08 CIVIL Victoria de Durango 24.02399 -104.6702 1146
5797 3 55 29 97.25 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3440
4633 4 86 28 81.56 QUIMICA Victoria de Durango 24.02399 -104.6702 2733
3810 3 49 27 83.45 MECATRONICA Victoria de Durango 24.02399 -104.6702 2258
2516 9 155 14 80.32 ELECTRONICA Victoria de Durango 24.02399 -104.6702 1483
3598 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2126
535 9 198 29 88.31 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 302
5476 11 166 29 80.11 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3235
1963 7 167 36 85.60 CIVIL Victoria de Durango 24.02399 -104.6702 1155
414 6 137 28 84.87 SISTEMAS Victoria de Durango 24.02399 -104.6702 247
2356 1 NA 24 0.00 ELECTRICA Victoria de Durango 24.02399 -104.6702 1385
3785 7 154 27 83.88 MECATRONICA Victoria de Durango 24.02399 -104.6702 2245
3905 8 174 16 82.73 MECATRONICA Victoria de Durango 24.02399 -104.6702 2310
4199 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2488
2933 5 112 30 95.16 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1717
1608 9 235 10 79.27 CIVIL Victoria de Durango 24.02399 -104.6702 946
3688 10 168 16 78.91 MECATRONICA Victoria de Durango 24.02399 -104.6702 2181
5754 3 55 29 87.75 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3410
5401 3 55 27 93.42 INFORMATICA Victoria de Durango 24.02399 -104.6702 3185
1072 3 24 28 87.33 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 635
4472 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2643
5757 8 166 14 85.28 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3411
3231 3 27 20 82.67 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1903
4233 2 25 31 92.50 QUIMICA Victoria de Durango 24.02399 -104.6702 2510
113 5 79 23 81.06 SISTEMAS Victoria de Durango 24.02399 -104.6702 67
1990 2 27 30 87.83 CIVIL Victoria de Durango 24.02399 -104.6702 1169
4356 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2579
1890 6 94 28 80.70 CIVIL Victoria de Durango 24.02399 -104.6702 1115
3863 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702 2284
5341 9 170 30 87.18 INFORMATICA Victoria de Durango 24.02399 -104.6702 3150
5911 8 121 22 84.54 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3517
3433 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2016
1095 5 54 12 84.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 648
4719 9 235 10 87.49 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2784
4731 12 226 9 87.36 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2791
1656 12 179 33 77.27 CIVIL Victoria de Durango 24.02399 -104.6702 975
568 5 106 36 89.87 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 322
218 1 NA 27 0.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 121
3440 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2022
2906 6 91 28 76.67 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1702
3391 10 230 5 81.50 MECANICA Victoria de Durango 24.02399 -104.6702 1993
1458 7 157 33 84.56 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 863
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
La muestra de alumnos de Localidad La Criba (Don Toño)
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
797 2 12 22 91.67 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 111
4345 6 90 33 79.47 QUIMICA La Criba (Don Toño) 24.18015 -104.5482 560
953 6 138 24 90.00 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 139
2566 5 105 28 88.13 ELECTRONICA La Criba (Don Toño) 24.18015 -104.5482 350
3997 6 125 23 85.78 MECATRONICA La Criba (Don Toño) 24.18015 -104.5482 530
1192 1 NA 23 0.00 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 175
2551 3 47 25 87.55 ELECTRONICA La Criba (Don Toño) 24.18015 -104.5482 347
587 6 142 24 94.80 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 79
1256 6 92 33 81.19 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 189
924 2 20 20 87.00 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 132
5628 3 19 29 87.00 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482 717
4961 7 162 33 86.76 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482 633
3773 5 61 17 81.79 MECATRONICA La Criba (Don Toño) 24.18015 -104.5482 501
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
La muestra de alumnos de Localidad Los Arroyos (Las Colonias)
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
554 1 NA 26 0.00 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328 55
5351 5 41 21 81.78 INFORMATICA Los Arroyos (Las Colonias) 23.69142 -105.0328 528
1498 4 57 20 85.92 BIOQUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 134
698 4 80 30 91.11 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328 61
5887 9 237 14 87.58 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328 570
4324 1 NA 25 0.00 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 424
4067 5 105 33 88.96 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328 398
2742 1 NA 27 0.00 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328 273
1407 1 NA 23 0.00 BIOQUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 120
2852 2 27 24 82.33 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328 286
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
La muestra de alumnos de Localidad La Esperanza
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
1429 1 NA 23 0.00 BIOQUIMICA La Esperanza 23.92139 -105.2973 105
2944 5 112 30 83.08 INDUSTRIAL La Esperanza 23.92139 -105.2973 205
1368 2 23 29 80.33 BIOQUIMICA La Esperanza 23.92139 -105.2973 102
1897 4 75 34 82.81 CIVIL La Esperanza 23.92139 -105.2973 138
1125 3 56 28 89.15 ARQUITECTURA La Esperanza 23.92139 -105.2973 92
2977 8 201 28 83.67 INDUSTRIAL La Esperanza 23.92139 -105.2973 208
516 11 186 16 78.92 ARQUITECTURA La Esperanza 23.92139 -105.2973 53
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
La muestra de alumnos de Localidad Los Caballos de Don Cruz
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
3083 6 137 29 84.52 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519 188
561 6 142 24 89.27 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 37
3680 9 220 15 85.78 MECATRONICA Los Caballos de Don Cruz 23.95737 -104.5519 218
5488 9 262 10 94.29 ADMINISTRACION Los Caballos de Don Cruz 23.95737 -104.5519 330
1123 6 93 17 85.10 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 59
1191 3 52 30 90.75 BIOQUIMICA Los Caballos de Don Cruz 23.95737 -104.5519 67
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
La muestra de alumnos de Localidad Las Curras
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
4735 11 206 19 84.07 GESTION EMPRESARIAL Las Curras 24.01172 -104.4686 238
2775 8 194 20 85.25 INDUSTRIAL Las Curras 24.01172 -104.4686 127
3229 6 104 33 85.29 INDUSTRIAL Las Curras 24.01172 -104.4686 157
4203 3 56 30 88.67 QUIMICA Las Curras 24.01172 -104.4686 206
3484 5 108 29 82.50 MECANICA Las Curras 24.01172 -104.4686 172
4.2.4.4.1 Visualizar con mapas
  • Cargar la librerías para mapas previamente
  • Usando los valores de latitud y longitud
map<-leaflet() %>%
  addTiles() %>%
  addMarkers(lat = unique(muestraloc1$latitud ), lng = unique(muestraloc1$longitud), popup = paste(unique(muestraloc1$localidad), "Muestra de:", nrow(muestraloc1), "alumnos"))  %>%
  addMarkers(lat = unique(muestraloc2$latitud ), lng = unique(muestraloc2$longitud), popup = paste(unique(muestraloc2$localidad), "Muestra de:", nrow(muestraloc2), "alumnos")) %>%
addMarkers(lat = unique(muestraloc3$latitud ), lng = unique(muestraloc3$longitud), popup = paste(unique(muestraloc3$localidad), "Muestra de:", nrow(muestraloc3), "alumnos")) %>% 
    addMarkers(lat = unique(muestraloc4$latitud ), lng = unique(muestraloc4$longitud), popup = paste(unique(muestraloc4$localidad), "Muestra de:", nrow(muestraloc4), "alumnos")) %>%
addMarkers(lat = unique(muestraloc5$latitud ), lng = unique(muestraloc5$longitud), popup = paste(unique(muestraloc5$localidad), "Muestra de:", nrow(muestraloc5), "alumnos")) %>%
  addMarkers(lat = unique(muestraloc6$latitud ), lng = unique(muestraloc6$longitud), popup = paste(unique(muestraloc6$localidad), "Muestra de:", nrow(muestraloc6), "alumnos"))
  
  
  
  
  
# Mostrar el mapa 
map

4.2.5 Interpretación de tipos de muestreo

Los distintos tipos de muestreo que encontramos en el caso son interesantes, ya que todos hacen la función de seleccionar de un conjunto de personas o cosas que se consideran representativos de los distintos grupos al que pertenecen, con la finalidad de estudiar o determinar las características del grupo en el que se encuentran.

De igual manera, se enfocan en dar un dato aleatorio, pero representativo, para que el grupo se defina de manera correcta y un poco más factible que estar buscando cada valor en el grupo.

5 Referencias Bibliográficas