Determinar y simular muestreos
Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.
El propósito de la estadística inferencial consiste en determinar y conocer el comportamiento sobre una población a partir de una muestra.
Una muestra es una porción, una proporción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible y sencillo que el estudio de toda la población. [@lind_estadistica_2015].
Por otra parte la importancia del muestreo como lo menciona [@anderson_estadistica_2008] es cuestión de minimizar costo de trabajo, recopilar información de una muestra es sustancialmente menor, que hacerlo de una población completa; especialmente cuando se deben realizar entrevistas personales para recopilar la información.
Finalmente, los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadísticas válidas [@lind_estadistica_2015].
Una muestra aleatoria simple de tamaño \(n\) de una población finita de tamaño \(N\) es una muestra seleccionada de manera que cada posible muestra de tamaño \(n\) tenga la misma probabilidad de ser seleccionada [@anderson_estadistica_2008].
De un conjunto de \(N\) elementos de una población, un muestreo aleatorio simple sería una especie de rifa o tómbola para elegir de de entre los \(N\) total de población una cantidad de \(n\) número de la muestra.
Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población [@lind_estadistica_2015].
Suele emplearse como alternativa al muestreo aleatorio simple, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente [@anderson_estadistica_2008].
El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población [@anderson_estadistica_2008]
Cuando una población se divide en grupos a partir de ciertas características, el muestreo aleatorio estratificado garantiza que cada grupo o estrato se encuentre representado en la muestra [@lind_estadistica_2015].
[@anderson_estadistica_2008] describe el muestreo aleatorio estratificado en donde los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad, tipo de industria, entre otros, está a discreción de la persona que diseña la muestra.
Por otra parte, para asegurar que la muestra sea una representación imparcial de las \(N\) observaciones, se debe determinar la frecuencia relativa y a partir de ahí generar las cantidad de muestra de cada estrato. [@lind_estadistica_2015].
La población se divide en conglomerados a partir de los límites naturales geográficos u otra clase. A continuación, estos se seleccionan al azar y se toma una muestra de forma aleatoria con elementos de cada grupo [@lind_estadistica_2015].
library(dplyr)
library(mosaic)
library(readr)
library(ggplot2) # Para gráficos
library(knitr) # Para formateo de datos
library(fdth) # Para tablas de frecuencias
library(leaflet) # Para hacer mapas
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/f_construir_datos_y_funciones.r", encoding = "UTF-8")
kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto de datos")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
JUAN | M | NO | NO | NO | SI | NO | SI | NO | NO | NO | NO | NO | SI |
JOSÉ LUIS | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
JOSÉ | M | NO | SI | NO | SI | NO | NO | NO | NO | NO | NO | SI | SI |
MARÍA GUADALUPE | F | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO | SI | SI |
FRANCISCO | M | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
GUADALUPE | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
MARÍA | F | NO | SI | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO |
JUANA | F | NO | NO | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO |
ANTONIO | M | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
JESÚS | M | NO | NO | SI | NO | NO | SI | NO | NO | SI | NO | NO | NO |
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
91 | ANDREA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI |
92 | ISABEL | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
93 | MARÍA TERESA | F | NO | SI | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO |
94 | IRMA | F | SI | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
95 | CARMEN | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
96 | LUCÍA | F | NO | SI | NO | SI | NO | NO | NO | SI | NO | NO | SI | SI |
97 | ADRIANA | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
98 | AGUSTÍN | M | NO | SI | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO |
99 | MARÍA DE LA LUZ | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
100 | GUSTAVO | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
Se cargan os datos de alumnos inscritos en una Institución de educación superior en un semestre con los atributos o variables siguientes:
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/datos_alumnos_lat_long.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
1 | 11 | 198 | 19 | 80.21 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
2 | 11 | 235 | 10 | 84.33 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3 | 9 | 235 | 10 | 95.25 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4 | 9 | 226 | 19 | 95.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
5 | 10 | 231 | 14 | 82.32 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
6 | 9 | 212 | 23 | 95.02 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
7 | 12 | 221 | 10 | 79.06 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
8 | 9 | 226 | 9 | 92.47 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
9 | 9 | 231 | 4 | 91.08 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
10 | 11 | 222 | 13 | 80.42 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
5920 | 7 | 169 | 23 | 89.14 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5921 | 5 | 109 | 26 | 87.83 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5922 | 3 | 55 | 29 | 92.83 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5923 | 2 | 23 | 23 | 88.60 | ADMINISTRACION | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5924 | 2 | 27 | 28 | 92.83 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
5925 | 7 | 94 | 13 | 80.95 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5926 | 5 | 103 | 32 | 92.68 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
5927 | 4 | 79 | 34 | 86.18 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5928 | 5 | 108 | 32 | 90.48 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
5929 | 7 | 169 | 32 | 92.33 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
set.seed(2023)
N <- nrow(personas)
n <- 10
muestra <- sample(x = personas$nombres, size = n, replace = FALSE)
kable(muestra, caption = "La muestra de personas")
x |
---|
MARÍA LUISA |
ALICIA |
ÓSCAR |
JAVIER |
FRANCISCA |
SALVADOR |
RAÚL |
SERGIO |
LUIS ÁNGEL |
FRANCISCO |
N <- nrow(alumnos)
n <- 100
registros <- sample(x = 1:N, size = n, replace = FALSE) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
959 | 4 | 80 | 30 | 84.17 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
4578 | 5 | 90 | 34 | 84.11 | QUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
5507 | 9 | 262 | 10 | 93.96 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
207 | 6 | 137 | 28 | 87.30 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4141 | 4 | 70 | 28 | 79.73 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
5892 | 5 | 113 | 27 | 93.38 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
3808 | 4 | 76 | 24 | 89.29 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
5765 | 3 | 55 | 29 | 92.58 | ADMINISTRACION | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
384 | 3 | 50 | 33 | 86.91 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
1527 | 8 | 189 | 24 | 82.90 | BIOQUIMICA | La Esperanza | 23.92139 | -105.2973 |
494 | 10 | 153 | 29 | 82.15 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
2530 | 9 | 217 | 13 | 84.89 | ELECTRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5502 | 9 | 245 | 11 | 89.42 | ADMINISTRACION | Las Curras | 24.01172 | -104.4686 |
3238 | 1 | NA | 27 | 0.00 | INDUSTRIAL | La Esperanza | 23.92139 | -105.2973 |
4949 | 5 | 111 | 30 | 88.75 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4265 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4338 | 2 | 15 | 26 | 87.75 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1022 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
2855 | 5 | 112 | 30 | 88.72 | INDUSTRIAL | Las Curras | 24.01172 | -104.4686 |
607 | 5 | 110 | 32 | 90.58 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
885 | 3 | 24 | 18 | 79.50 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
3372 | 10 | 185 | 29 | 79.24 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
5119 | 3 | 48 | 29 | 85.36 | GESTION EMPRESARIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3617 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
2118 | 4 | 38 | 26 | 81.63 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
4804 | 8 | 210 | 25 | 93.86 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
966 | 5 | 32 | 18 | 82.50 | ARQUITECTURA | Las Curras | 24.01172 | -104.4686 |
2246 | 9 | 225 | 10 | 89.98 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
4562 | 9 | 183 | 32 | 84.55 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
2850 | 8 | 184 | 21 | 81.83 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3939 | 2 | 16 | 28 | 82.00 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
1576 | 9 | 119 | 11 | 77.40 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
4760 | 9 | 215 | 20 | 87.38 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
1095 | 5 | 54 | 12 | 84.50 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
672 | 6 | 133 | 27 | 92.39 | ARQUITECTURA | Las Curras | 24.01172 | -104.4686 |
1582 | 12 | 210 | 20 | 78.20 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
4513 | 3 | 56 | 30 | 89.25 | QUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
5485 | 9 | 262 | 10 | 92.09 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
4206 | 1 | NA | 25 | 0.00 | QUIMICA | Las Curras | 24.01172 | -104.4686 |
4268 | 5 | 114 | 30 | 85.67 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
740 | 6 | 79 | 28 | 84.61 | ARQUITECTURA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5265 | 3 | 56 | 23 | 87.67 | TIC | La Criba (Don Toño) | 24.18015 | -104.5482 |
5280 | 3 | 46 | 23 | 85.20 | TIC | Victoria de Durango | 24.02399 | -104.6702 |
4522 | 7 | 172 | 32 | 86.72 | QUIMICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
241 | 5 | 112 | 25 | 91.63 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 |
5596 | 2 | 27 | 32 | 91.50 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
4943 | 8 | 190 | 35 | 86.58 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5525 | 7 | 169 | 27 | 91.39 | ADMINISTRACION | Las Curras | 24.01172 | -104.4686 |
2674 | 10 | 217 | 18 | 82.33 | INDUSTRIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
2892 | 5 | 51 | 29 | 79.50 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2444 | 5 | 90 | 23 | 82.29 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2844 | 6 | 139 | 28 | 88.19 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
5803 | 1 | NA | 23 | 0.00 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
2889 | 5 | 112 | 30 | 90.72 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5753 | 3 | 60 | 29 | 90.92 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
411 | 7 | 165 | 34 | 82.78 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
416 | 3 | 55 | 28 | 95.17 | SISTEMAS | Las Curras | 24.01172 | -104.4686 |
1600 | 9 | 225 | 20 | 85.02 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3267 | 3 | 51 | 29 | 94.75 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
830 | 5 | 97 | 26 | 93.50 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
5652 | 8 | 167 | 34 | 90.86 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
1489 | 3 | 52 | 32 | 91.25 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
438 | 5 | 83 | 30 | 85.06 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3506 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
4490 | 4 | 76 | 32 | 80.13 | QUIMICA | La Esperanza | 23.92139 | -105.2973 |
181 | 2 | 22 | 28 | 88.80 | SISTEMAS | Las Curras | 24.01172 | -104.4686 |
2040 | 7 | 173 | 30 | 84.36 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1275 | 4 | 74 | 28 | 82.47 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
3499 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
375 | 3 | 55 | 28 | 89.92 | SISTEMAS | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
3142 | 6 | 142 | 25 | 86.22 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
458 | 9 | 168 | 25 | 81.83 | ARQUITECTURA | La Esperanza | 23.92139 | -105.2973 |
160 | 7 | 142 | 26 | 82.65 | SISTEMAS | Las Curras | 24.01172 | -104.4686 |
5798 | 6 | 140 | 28 | 91.03 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
4177 | 3 | 56 | 30 | 92.17 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
864 | 5 | 110 | 32 | 87.54 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1892 | 3 | 42 | 23 | 90.67 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1789 | 6 | 143 | 30 | 84.63 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
5889 | 5 | 113 | 31 | 94.54 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
1593 | 10 | 205 | 25 | 81.16 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
4664 | 5 | 88 | 29 | 85.05 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4727 | 10 | 230 | 5 | 82.19 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
432 | 1 | NA | 27 | 0.00 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
3337 | 2 | 22 | 29 | 83.20 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
347 | 5 | 116 | 30 | 91.24 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
5897 | 6 | 140 | 29 | 92.37 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
4290 | 10 | 215 | 5 | 83.34 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4563 | 9 | 204 | 26 | 81.71 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
3480 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3035 | 2 | 12 | 19 | 82.67 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5335 | 13 | 230 | 5 | 79.74 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
4464 | 7 | 123 | 28 | 84.42 | QUIMICA | Las Curras | 24.01172 | -104.4686 |
1975 | 4 | 57 | 28 | 80.50 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
12 | 10 | 179 | 23 | 82.69 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 |
4305 | 2 | 11 | 25 | 91.67 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
4917 | 3 | 49 | 33 | 89.36 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
2956 | 6 | 145 | 33 | 85.18 | INDUSTRIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
3430 | 5 | 50 | 24 | 79.50 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
440 | 3 | 13 | 29 | 84.00 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5455 | 7 | 187 | 29 | 90.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
7 | MARÍA | F | NO | SI | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO |
17 | JUAN CARLOS | M | SI | NO | NO | NO | NO | NO | SI | NO | SI | NO | NO | NO |
27 | RAFAEL | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
37 | ENRIQUE | F | NO | NO | NO | NO | NO | NO | NO | NO | SI | NO | SI | NO |
47 | ALICIA | F | NO | SI | NO | NO | NO | SI | NO | NO | NO | SI | NO | NO |
57 | PATRICIA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
67 | SILVIA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO |
77 | PABLO | M | NO | NO | SI | NO | NO | NO | SI | SI | NO | NO | NO | NO |
87 | JULIO CESAR | M | SI | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
97 | ADRIANA | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
57 | 9 | 226 | 4 | 89.10 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
116 | 7 | 165 | 34 | 93.67 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
175 | 3 | 50 | 33 | 90.91 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
234 | 7 | 105 | 22 | 84.00 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
293 | 4 | 83 | 33 | 86.28 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
352 | 8 | 176 | 32 | 80.47 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
411 | 7 | 165 | 34 | 82.78 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
470 | 9 | 198 | 29 | 83.33 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
529 | 10 | 172 | 12 | 79.97 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
588 | 4 | 80 | 30 | 90.28 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
647 | 6 | 124 | 26 | 83.85 | ARQUITECTURA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
706 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
765 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
824 | 6 | 132 | 30 | 82.96 | ARQUITECTURA | La Esperanza | 23.92139 | -105.2973 |
883 | 6 | 91 | 30 | 85.53 | ARQUITECTURA | Las Curras | 24.01172 | -104.4686 |
942 | 5 | 88 | 30 | 83.32 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
1001 | 3 | 52 | 24 | 90.50 | ARQUITECTURA | La Esperanza | 23.92139 | -105.2973 |
1060 | 1 | NA | 26 | 0.00 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1119 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
1178 | 9 | 140 | 23 | 82.81 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1237 | 5 | 79 | 31 | 81.78 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1296 | 8 | 95 | 28 | 76.81 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1355 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1414 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1473 | 2 | 18 | 29 | 82.60 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1532 | 3 | 47 | 25 | 87.09 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1591 | 10 | 225 | 15 | 80.28 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
1650 | 9 | 235 | 10 | 91.00 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1709 | 5 | 67 | 8 | 82.71 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1768 | 6 | 139 | 30 | 85.21 | CIVIL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
1827 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1886 | 4 | 51 | 31 | 78.83 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
1945 | 3 | 55 | 30 | 87.33 | CIVIL | La Esperanza | 23.92139 | -105.2973 |
2004 | 4 | 78 | 18 | 81.06 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2063 | 5 | 121 | 31 | 87.12 | CIVIL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
2122 | 2 | 27 | 26 | 80.17 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2181 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2240 | 9 | 221 | 14 | 92.94 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2299 | 7 | 160 | 31 | 88.08 | ELECTRICA | La Esperanza | 23.92139 | -105.2973 |
2358 | 7 | 98 | 9 | 81.04 | ELECTRICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
2417 | 3 | 56 | 26 | 92.00 | ELECTRICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
2476 | 3 | 51 | 28 | 85.92 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2535 | 6 | 104 | 24 | 82.96 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 |
2594 | 1 | NA | 25 | 0.00 | ELECTRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
2653 | 5 | 105 | 28 | 95.17 | ELECTRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
2712 | 11 | 235 | 10 | 80.68 | INDUSTRIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
2771 | 4 | 75 | 32 | 80.59 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
2830 | 8 | 174 | 36 | 81.22 | INDUSTRIAL | Las Curras | 24.01172 | -104.4686 |
2889 | 5 | 112 | 30 | 90.72 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
2948 | 6 | 120 | 26 | 79.30 | INDUSTRIAL | Las Curras | 24.01172 | -104.4686 |
3007 | 6 | 142 | 25 | 83.56 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3066 | 7 | 149 | 25 | 87.74 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3125 | 3 | 55 | 27 | 84.08 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3184 | 6 | 139 | 28 | 84.48 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3243 | 3 | 51 | 29 | 86.83 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3302 | 5 | 95 | 27 | 81.18 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3361 | 5 | 87 | 31 | 84.70 | INDUSTRIAL | La Esperanza | 23.92139 | -105.2973 |
3420 | 7 | 132 | 27 | 83.52 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3479 | 7 | 142 | 35 | 80.45 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3538 | 5 | 108 | 29 | 84.88 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3597 | 5 | 103 | 34 | 81.17 | MECANICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
3656 | 6 | 113 | 29 | 79.72 | MECANICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3715 | 10 | 178 | 8 | 79.81 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3774 | 7 | 159 | 30 | 87.76 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3833 | 7 | 151 | 31 | 82.44 | MECATRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3892 | 6 | 76 | 20 | 81.18 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3951 | 6 | 47 | 4 | 82.09 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
4010 | 1 | NA | 25 | 0.00 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
4069 | 5 | 105 | 24 | 86.74 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
4128 | 11 | 161 | 32 | 81.21 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4187 | 5 | 109 | 25 | 87.22 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4246 | 9 | 230 | 5 | 85.70 | QUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
4305 | 2 | 11 | 25 | 91.67 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
4364 | 4 | 86 | 28 | 88.50 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4423 | 9 | 215 | 20 | 83.36 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4482 | 2 | 25 | 30 | 82.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4541 | 5 | 88 | 29 | 84.84 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
4600 | 9 | 204 | 20 | 82.31 | QUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
4659 | 7 | 162 | 30 | 88.71 | QUIMICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
4718 | 10 | 225 | 10 | 85.17 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4777 | 5 | 107 | 33 | 87.87 | GESTION EMPRESARIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
4836 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4895 | 3 | 53 | 29 | 87.92 | GESTION EMPRESARIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
4954 | 2 | 22 | 26 | 91.20 | GESTION EMPRESARIAL | La Esperanza | 23.92139 | -105.2973 |
5013 | 2 | 27 | 27 | 84.50 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5072 | 3 | 54 | 28 | 93.08 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5131 | 3 | 54 | 28 | 90.75 | GESTION EMPRESARIAL | Las Curras | 24.01172 | -104.4686 |
5190 | 3 | 45 | 33 | 85.10 | GESTION EMPRESARIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5249 | 2 | 22 | 27 | 92.40 | GESTION EMPRESARIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
5308 | 1 | NA | 26 | 0.00 | TIC | Victoria de Durango | 24.02399 | -104.6702 |
5367 | 7 | 85 | 18 | 82.58 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
5426 | 7 | 156 | 33 | 90.29 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
5485 | 9 | 262 | 10 | 92.09 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
5544 | 5 | 89 | 28 | 85.63 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
5603 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5662 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5721 | 8 | 180 | 34 | 85.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5780 | 4 | 84 | 33 | 89.94 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5839 | 6 | 140 | 28 | 91.93 | ADMINISTRACION | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
5898 | 2 | 23 | 28 | 87.80 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
N <- nrow(personas)
n <- 10
femeninos <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem
## [1] 0.43
frmas
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | orig.id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
24 | ROSA MARÍA | F | NO | NO | NO | NO | NO | SI | NO | SI | NO | NO | NO | NO | 24 |
42 | ADRIANA | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO | 42 |
18 | MARÍA FERNANDA | F | NO | SI | SI | NO | NO | NO | SI | SI | NO | SI | NO | NO | 18 |
4 | JUANA | F | NO | NO | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO | 4 |
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | orig.id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
40 | GABRIEL | M | SI | NO | SI | NO | NO | SI | NO | NO | NO | NO | NO | NO | 40 |
36 | JUAN MANUEL | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | SI | SI | NO | 36 |
7 | MIGUEL ÁNGEL | M | NO | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | 7 |
17 | RICARDO | M | NO | NO | NO | NO | SI | NO | NO | NO | NO | SI | NO | NO | 17 |
5 | ANTONIO | M | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | 5 |
N <- nrow(alumnos)
n <- 100
alumnos
## # A tibble: 5,929 × 9
## Alumno Semestre `Cr. Apr.` Carga Promedio Carrera localidad latitud longitud
## <dbl> <dbl> <dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl>
## 1 1 11 198 19 80.2 SISTEMAS Victoria… 24.0 -105.
## 2 2 11 235 10 84.3 SISTEMAS Los Arro… 23.7 -105.
## 3 3 9 235 10 95.2 SISTEMAS Victoria… 24.0 -105.
## 4 4 9 226 19 95 SISTEMAS Victoria… 24.0 -105.
## 5 5 10 231 14 82.3 SISTEMAS Victoria… 24.0 -105.
## 6 6 9 212 23 95.0 SISTEMAS Victoria… 24.0 -105.
## 7 7 12 221 10 79.1 SISTEMAS La Criba… 24.2 -105.
## 8 8 9 226 9 92.5 SISTEMAS Victoria… 24.0 -105.
## 9 9 9 231 4 91.1 SISTEMAS Los Arro… 23.7 -105.
## 10 10 11 222 13 80.4 SISTEMAS Victoria… 24.0 -105.
## # ℹ 5,919 more rows
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <- round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Category | f | rf | rf… | cf | cf… | muestra |
---|---|---|---|---|---|---|
INDUSTRIAL | 707 | 0.1192444 | 11.924439 | 707 | 11.92444 | 12 |
ARQUITECTURA | 675 | 0.1138472 | 11.384719 | 1382 | 23.30916 | 11 |
CIVIL | 648 | 0.1092933 | 10.929330 | 2030 | 34.23849 | 11 |
GESTION EMPRESARIAL | 585 | 0.0986676 | 9.866757 | 2615 | 44.10525 | 10 |
QUIMICA | 568 | 0.0958003 | 9.580030 | 3183 | 53.68528 | 10 |
ADMINISTRACION | 497 | 0.0838253 | 8.382527 | 3680 | 62.06780 | 8 |
SISTEMAS | 452 | 0.0762355 | 7.623545 | 4132 | 69.69135 | 8 |
BIOQUIMICA | 441 | 0.0743802 | 7.438016 | 4573 | 77.12936 | 7 |
MECATRONICA | 432 | 0.0728622 | 7.286220 | 5005 | 84.41558 | 7 |
MECANICA | 301 | 0.0507674 | 5.076741 | 5306 | 89.49233 | 5 |
ELECTRICA | 280 | 0.0472255 | 4.722550 | 5586 | 94.21488 | 5 |
ELECTRONICA | 161 | 0.0271547 | 2.715466 | 5747 | 96.93034 | 3 |
INFORMATICA | 101 | 0.0170349 | 1.703491 | 5848 | 98.63383 | 2 |
TIC | 81 | 0.0136617 | 1.366166 | 5929 | 100.00000 | 1 |
N <- nrow(alumnos)
n <- 100
sistemas <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas.")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
12 | 10 | 179 | 23 | 82.69 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 | 12 |
356 | 3 | 55 | 28 | 91.67 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 | 356 |
336 | 3 | 45 | 33 | 82.80 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 336 |
438 | 5 | 83 | 30 | 85.06 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 438 |
31 | 11 | 226 | 9 | 86.88 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 31 |
249 | 5 | 112 | 25 | 92.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 249 |
138 | 8 | 199 | 27 | 87.93 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 | 138 |
280 | 1 | NA | 27 | 0.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 280 |
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
2150 | 6 | 143 | 30 | 86.57 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 582 |
2202 | 1 | NA | 27 | 0.00 | CIVIL | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 634 |
2189 | 2 | 23 | 25 | 78.80 | CIVIL | La Esperanza | 23.92139 | -105.2973 | 621 |
2206 | 7 | 165 | 35 | 87.00 | CIVIL | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 638 |
1852 | 5 | 98 | 35 | 82.10 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 284 |
1890 | 6 | 94 | 28 | 80.70 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 322 |
2053 | 5 | 108 | 29 | 86.61 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 485 |
1703 | 4 | 71 | 28 | 86.47 | CIVIL | Las Curras | 24.01172 | -104.4686 | 135 |
1606 | 12 | 196 | 9 | 78.76 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 38 |
1893 | 8 | 188 | 28 | 86.08 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 325 |
1710 | 2 | 27 | 30 | 88.50 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 | 142 |
Mostrar los primeros diez y últimos diez alumnos verificando las tres columnas de localidad, latitud y longitud.
kable(head(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Los primeros diez registros de alumnos")
Alumno | localidad | latitud | longitud |
---|---|---|---|
1 | Victoria de Durango | 24.02399 | -104.6702 |
2 | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3 | Victoria de Durango | 24.02399 | -104.6702 |
4 | Victoria de Durango | 24.02399 | -104.6702 |
5 | Victoria de Durango | 24.02399 | -104.6702 |
6 | Victoria de Durango | 24.02399 | -104.6702 |
7 | La Criba (Don Toño) | 24.18015 | -104.5482 |
8 | Victoria de Durango | 24.02399 | -104.6702 |
9 | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
10 | Victoria de Durango | 24.02399 | -104.6702 |
kable(tail(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Las útimos diez registros de alumnos")
Alumno | localidad | latitud | longitud |
---|---|---|---|
5920 | Victoria de Durango | 24.02399 | -104.6702 |
5921 | Victoria de Durango | 24.02399 | -104.6702 |
5922 | Victoria de Durango | 24.02399 | -104.6702 |
5923 | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5924 | La Esperanza | 23.92139 | -105.2973 |
5925 | Victoria de Durango | 24.02399 | -104.6702 |
5926 | La Esperanza | 23.92139 | -105.2973 |
5927 | Victoria de Durango | 24.02399 | -104.6702 |
5928 | La Criba (Don Toño) | 24.18015 | -104.5482 |
5929 | La Criba (Don Toño) | 24.18015 | -104.5482 |
Determinar la frecuencias por localidad
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <- round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Category | f | rf | rf… | cf | cf… | muestra |
---|---|---|---|---|---|---|
Victoria de Durango | 3527 | 0.5948727 | 59.487266 | 3527 | 59.48727 | 59 |
La Criba (Don Toño) | 750 | 0.1264969 | 12.649688 | 4277 | 72.13695 | 13 |
Los Arroyos (Las Colonias) | 575 | 0.0969809 | 9.698094 | 4852 | 81.83505 | 10 |
La Esperanza | 419 | 0.0706696 | 7.066959 | 5271 | 88.90201 | 7 |
Los Caballos de Don Cruz | 355 | 0.0598752 | 5.987519 | 5626 | 94.88953 | 6 |
Las Curras | 303 | 0.0511047 | 5.110474 | 5929 | 100.00000 | 5 |
Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.
¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad
Simular por las seis localidades
localidades <- tabla_frec$Category
localidades
## [1] "Victoria de Durango" "La Criba (Don Toño)"
## [3] "Los Arroyos (Las Colonias)" "La Esperanza"
## [5] "Los Caballos de Don Cruz" "Las Curras"
N <- nrow(alumnos)
n <- 100
# Determinar cada conglomerado
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])
# Determinar frecuencias de cada conglomerado similiar a la tabla tabla_frec
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N
# Crear muestras
muestraloc1 <- sample(x = loc1, size = round(n * frloc1, 0), replace = FALSE)
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
5476 | 11 | 166 | 29 | 80.11 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3235 |
1916 | 6 | 138 | 35 | 85.66 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1129 |
5100 | 8 | 185 | 30 | 84.59 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2996 |
3366 | 9 | 142 | 17 | 77.32 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 1981 |
1344 | 2 | 23 | 29 | 84.67 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 793 |
3508 | 6 | 117 | 30 | 81.42 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2064 |
3236 | 2 | 21 | 24 | 87.60 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1908 |
2121 | 4 | 80 | 34 | 85.47 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1246 |
3410 | 9 | 177 | 28 | 79.97 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2005 |
568 | 5 | 106 | 36 | 89.87 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 322 |
3495 | 3 | 49 | 31 | 82.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2053 |
2539 | 5 | 85 | 25 | 87.89 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 | 1496 |
1550 | 4 | 82 | 28 | 86.44 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 911 |
1633 | 11 | 206 | 29 | 79.65 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 963 |
2230 | 10 | 208 | 18 | 82.68 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 | 1308 |
5318 | 1 | NA | 26 | 0.00 | TIC | Victoria de Durango | 24.02399 | -104.6702 | 3131 |
3074 | 2 | 32 | 28 | 91.71 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1806 |
5622 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3320 |
1098 | 2 | 26 | 26 | 89.50 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 650 |
4711 | 10 | 173 | 25 | 83.05 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2778 |
4122 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2435 |
280 | 1 | NA | 27 | 0.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 161 |
5477 | 9 | 238 | 19 | 91.34 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3236 |
4678 | 9 | 220 | 15 | 90.98 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2757 |
1978 | 5 | 109 | 34 | 86.52 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1163 |
2193 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1288 |
5879 | 3 | 55 | 29 | 93.50 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3497 |
2705 | 14 | 216 | 19 | 80.39 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1591 |
4258 | 5 | 114 | 30 | 90.46 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2527 |
414 | 6 | 137 | 28 | 84.87 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 247 |
1013 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 594 |
3607 | 8 | 186 | 28 | 83.66 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2130 |
4155 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2459 |
961 | 4 | 46 | 18 | 83.55 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 562 |
945 | 6 | 134 | 24 | 87.86 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 554 |
3114 | 2 | 27 | 24 | 92.50 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1833 |
3592 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2123 |
5396 | 7 | 146 | 29 | 85.34 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 | 3182 |
566 | 5 | 90 | 36 | 84.90 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 320 |
5665 | 3 | 55 | 29 | 94.17 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3350 |
2085 | 3 | 48 | 29 | 83.70 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1219 |
3185 | 6 | 134 | 32 | 81.97 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1877 |
4583 | 7 | 150 | 22 | 86.16 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2703 |
5061 | 5 | 87 | 36 | 88.11 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2972 |
1153 | 9 | 206 | 29 | 81.84 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 686 |
1372 | 4 | 71 | 34 | 81.50 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 813 |
3717 | 9 | 178 | 21 | 83.55 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2205 |
3862 | 1 | NA | 25 | 0.00 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2283 |
5716 | 6 | 125 | 33 | 88.07 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3385 |
2900 | 7 | 175 | 35 | 86.75 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1697 |
100 | 4 | 36 | 29 | 85.13 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 61 |
4913 | 5 | 112 | 36 | 94.13 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2897 |
1354 | 7 | 167 | 34 | 86.40 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 800 |
2175 | 7 | 111 | 30 | 86.83 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1277 |
1610 | 9 | 166 | 26 | 81.14 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 948 |
3742 | 3 | 58 | 28 | 84.38 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2217 |
1432 | 4 | 72 | 30 | 82.63 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 851 |
1342 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 792 |
1872 | 3 | 42 | 34 | 80.89 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1105 |
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
3130 | 5 | 77 | 22 | 84.67 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 | 421 |
536 | 11 | 174 | 17 | 82.68 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 72 |
844 | 4 | 80 | 30 | 89.72 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 119 |
807 | 3 | 48 | 32 | 89.82 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 113 |
3240 | 5 | 112 | 30 | 90.00 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 | 433 |
1256 | 6 | 92 | 33 | 81.19 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 189 |
3176 | 7 | 156 | 29 | 84.74 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 | 427 |
1359 | 4 | 69 | 30 | 82.81 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 205 |
3756 | 3 | 53 | 27 | 89.25 | MECATRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 499 |
1216 | 5 | 89 | 27 | 86.45 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 180 |
2602 | 3 | 43 | 28 | 85.70 | ELECTRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 358 |
881 | 4 | 80 | 30 | 90.72 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 125 |
2936 | 5 | 112 | 30 | 90.08 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 | 400 |
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
2355 | 1 | NA | 24 | 0.00 | ELECTRICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 228 |
9 | 9 | 231 | 4 | 91.08 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 2 |
1615 | 12 | 197 | 19 | 80.24 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 149 |
3802 | 5 | 79 | 24 | 87.78 | MECATRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 370 |
3980 | 5 | 109 | 24 | 89.83 | MECATRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 390 |
1358 | 5 | 105 | 35 | 85.70 | BIOQUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 116 |
5533 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 543 |
4507 | 5 | 114 | 30 | 88.75 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 446 |
3043 | 7 | 121 | 34 | 80.68 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 304 |
2866 | 6 | 102 | 36 | 81.87 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 288 |
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
4083 | 7 | 155 | 36 | 86.33 | MECATRONICA | La Esperanza | 23.92139 | -105.2973 | 288 |
351 | 3 | 54 | 29 | 85.92 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 | 33 |
3470 | 5 | 78 | 30 | 80.67 | MECANICA | La Esperanza | 23.92139 | -105.2973 | 244 |
367 | 5 | 116 | 30 | 89.88 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 | 36 |
1897 | 4 | 75 | 34 | 82.81 | CIVIL | La Esperanza | 23.92139 | -105.2973 | 138 |
1421 | 3 | 52 | 30 | 86.92 | BIOQUIMICA | La Esperanza | 23.92139 | -105.2973 | 104 |
112 | 5 | 112 | 25 | 86.83 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 | 14 |
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
2920 | 1 | NA | 27 | 0.00 | INDUSTRIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 179 |
4812 | 8 | 185 | 30 | 88.87 | GESTION EMPRESARIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 294 |
721 | 6 | 125 | 30 | 87.92 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 46 |
2429 | 1 | NA | 24 | 0.00 | ELECTRICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 147 |
665 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 44 |
615 | 4 | 60 | 12 | 82.62 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 39 |
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
2788 | 8 | 182 | 33 | 80.43 | INDUSTRIAL | Las Curras | 24.01172 | -104.4686 | 128 |
5614 | 5 | 104 | 23 | 87.59 | ADMINISTRACION | Las Curras | 24.01172 | -104.4686 | 292 |
3933 | 7 | 128 | 33 | 83.67 | MECATRONICA | Las Curras | 24.01172 | -104.4686 | 194 |
3475 | 1 | NA | 26 | 0.00 | MECANICA | Las Curras | 24.01172 | -104.4686 | 171 |
1958 | 1 | NA | 27 | 0.00 | CIVIL | Las Curras | 24.01172 | -104.4686 | 91 |
map<-leaflet() %>%
addTiles() %>%
addMarkers(lat = unique(muestraloc1$latitud ), lng = unique(muestraloc1$longitud), popup = paste(unique(muestraloc1$localidad), "Muestra de:", nrow(muestraloc1), "alumnos")) %>%
addMarkers(lat = unique(muestraloc2$latitud ), lng = unique(muestraloc2$longitud), popup = paste(unique(muestraloc2$localidad), "Muestra de:", nrow(muestraloc2), "alumnos")) %>%
addMarkers(lat = unique(muestraloc3$latitud ), lng = unique(muestraloc3$longitud), popup = paste(unique(muestraloc3$localidad), "Muestra de:", nrow(muestraloc3), "alumnos")) %>%
addMarkers(lat = unique(muestraloc4$latitud ), lng = unique(muestraloc4$longitud), popup = paste(unique(muestraloc4$localidad), "Muestra de:", nrow(muestraloc4), "alumnos")) %>%
addMarkers(lat = unique(muestraloc5$latitud ), lng = unique(muestraloc5$longitud), popup = paste(unique(muestraloc5$localidad), "Muestra de:", nrow(muestraloc5), "alumnos")) %>%
addMarkers(lat = unique(muestraloc6$latitud ), lng = unique(muestraloc6$longitud), popup = paste(unique(muestraloc6$localidad), "Muestra de:", nrow(muestraloc6), "alumnos"))
# Mostrar el mapa
map
El muestreo aleatorio simple es útil cuando se desea obtener una muestra representativa sin sesgos, el muestreo aleatorio sistemático es eficiente para poblaciones grandes, el muestreo aleatorio estratificado permite obtener estimaciones precisas para diferentes grupos y el muestreo por conglomerados es adecuado cuando es difícil seleccionar elementos individuales y se pueden agrupar en conglomerados.