Determinar y simular muestreos
Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.
El propósito de la estadística inferencial consiste en determinar y conocer el comportamiento sobre una población a partir de una muestra.
Una muestra es una porción, una proporción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible y sencillo que el estudio de toda la población.
Por otra parte la importancia del muestreo como lo menciona es cuestión de minimizar costo de trabajo, recopilar información de una muestra es sustancialmente menor, que hacerlo de una población completa; especialmente cuando se deben realizar entrevistas personales para recopilar la información.
Finamente, los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadísticas válidas.
Una muestra aleatoria simple de tamaño \(n\) de una población finita de tamaño \(N\) es una muestra seleccionada de manera que cada posible muestra de tamaño \(n\) tenga la misma probabilidad de ser seleccionadas.
De un conjunto de \(N\) elementos de una población, un muestreo aleatorio simple sería una especie de rifa o tómbola para elegir de de entre los \(N\) total de población una cantidad de \(n\) número de la muestra.
Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población.
Suele emplearse como alternativa al muestreo aleatorio simple, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente.
El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población.
Cuando una población se divide en grupos a partir de ciertas características, el muestreo aleatorio estratificado garantiza que cada grupo o estrato se encuentre representado en la muestra.
(Anderson Estadistica 2008) describe el muestreo aleatorio estratificado en donde los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad, tipo de industria, entre otros, está a discreción de la persona que diseña la muestra.
Por otra parte, para asegurar que la muestra sea una representación imparcial de las \(N\) observaciones, se debe determinar la frecuencia relativa y a partir de ahí generar las cantidad de muestra de cada estrato.
La población se divide en conglomerados a partir de los límites naturales geográficos u otra clase. A continuación, estos se seleccionan al azar y se toma una muestra de forma aleatoria con elementos de cada grupo.
library(dplyr)
library(mosaic)
library(readr)
library(ggplot2) # Para gráficos
library(knitr) # Para formateo de datos
library(fdth) # Para tablas de frecuencias
library(leaflet) # Para hacer mapas
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/construir_datos_y_funciones.r", encoding = "UTF-8")
kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto dedatos")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
JUAN | M | NO | NO | NO | SI | NO | SI | NO | NO | NO | NO | NO | SI |
JOSÉ LUIS | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
JOSÉ | M | NO | SI | NO | SI | NO | NO | NO | NO | NO | NO | SI | SI |
MARÍA GUADALUPE | F | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO | SI | SI |
FRANCISCO | M | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
GUADALUPE | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
MARÍA | F | NO | SI | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO |
JUANA | F | NO | NO | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO |
ANTONIO | M | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
JESÚS | M | NO | NO | SI | NO | NO | SI | NO | NO | SI | NO | NO | NO |
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
91 | ANDREA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI |
92 | ISABEL | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
93 | MARÍA TERESA | F | NO | SI | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO |
94 | IRMA | F | SI | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
95 | CARMEN | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
96 | LUCÍA | F | NO | SI | NO | SI | NO | NO | NO | SI | NO | NO | SI | SI |
97 | ADRIANA | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
98 | AGUSTÍN | M | NO | SI | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO |
99 | MARÍA DE LA LUZ | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
100 | GUSTAVO | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
Se cargan os datos de alumnos inscritos en una Institución de educación superior en en un semestre con los atributos siguientes:
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/datos/datos_alumnos.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
1 | 11 | 198 | 19 | 80.21 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
2 | 11 | 235 | 10 | 84.33 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3 | 9 | 235 | 10 | 95.25 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4 | 9 | 226 | 19 | 95.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
5 | 10 | 231 | 14 | 82.32 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
6 | 9 | 212 | 23 | 95.02 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
7 | 12 | 221 | 10 | 79.06 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
8 | 9 | 226 | 9 | 92.47 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
9 | 9 | 231 | 4 | 91.08 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
10 | 11 | 222 | 13 | 80.42 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
5920 | 7 | 169 | 23 | 89.14 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5921 | 5 | 109 | 26 | 87.83 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5922 | 3 | 55 | 29 | 92.83 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5923 | 2 | 23 | 23 | 88.60 | ADMINISTRACION | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5924 | 2 | 27 | 28 | 92.83 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
5925 | 7 | 94 | 13 | 80.95 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5926 | 5 | 103 | 32 | 92.68 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
5927 | 4 | 79 | 34 | 86.18 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5928 | 5 | 108 | 32 | 90.48 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
5929 | 7 | 169 | 32 | 92.33 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
set.seed(2022)
N <- nrow(personas)
n <- 10
muestra <- sample(x = personas$nombres, size = n, replace = FALSE)
kable(muestra, caption = "La muestra de personas")
x |
---|
GUSTAVO |
LUIS |
RUBEN |
SANTIAGO |
RAMÓN |
MARÍA DE GUADALUPE |
GUADALUPE |
ÁNGEL |
AGUSTÍN |
MANUEL |
N <- nrow(alumnos)
n <- 100
registros <- sample(x = 1:N, size = n, replace = FALSE) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
1272 | 4 | 82 | 28 | 89.11 | BIOQUIMICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
1522 | 5 | 84 | 34 | 80.16 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
951 | 4 | 52 | 18 | 80.17 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
4609 | 1 | NA | 25 | 0.00 | QUIMICA | La Esperanza | 23.92139 | -105.2973 |
3379 | 11 | 163 | 18 | 79.08 | MECANICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
800 | 8 | 173 | 25 | 82.58 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
2497 | 11 | 225 | 10 | 81.98 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3938 | 7 | 170 | 25 | 82.11 | MECATRONICA | Las Curras | 24.01172 | -104.4686 |
2426 | 5 | 65 | 21 | 77.75 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
1548 | 6 | 140 | 30 | 84.27 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
828 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Las Curras | 24.01172 | -104.4686 |
428 | 6 | 132 | 33 | 85.69 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
1990 | 2 | 27 | 30 | 87.83 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
3007 | 6 | 142 | 25 | 83.56 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
4455 | 5 | 66 | 25 | 86.57 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
3269 | 6 | 94 | 32 | 82.95 | INDUSTRIAL | La Esperanza | 23.92139 | -105.2973 |
3595 | 5 | 48 | 20 | 80.73 | MECANICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
988 | 7 | 158 | 36 | 84.97 | ARQUITECTURA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1131 | 12 | 244 | 15 | 78.49 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4372 | 3 | 41 | 30 | 83.67 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1598 | 12 | 219 | 11 | 78.43 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1608 | 9 | 235 | 10 | 79.27 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
797 | 2 | 12 | 22 | 91.67 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
194 | 8 | 184 | 32 | 88.55 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4589 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
2304 | 1 | NA | 24 | 0.00 | ELECTRICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
234 | 7 | 105 | 22 | 84.00 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
5031 | 8 | 210 | 25 | 92.36 | GESTION EMPRESARIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3425 | 8 | 205 | 20 | 88.60 | MECANICA | La Esperanza | 23.92139 | -105.2973 |
3359 | 3 | 27 | 13 | 81.71 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2003 | 8 | 178 | 28 | 82.76 | CIVIL | La Esperanza | 23.92139 | -105.2973 |
1080 | 2 | 4 | 22 | 90.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
3073 | 6 | 125 | 22 | 87.36 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2430 | 3 | 42 | 28 | 82.40 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
3091 | 4 | 69 | 24 | 80.75 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
4597 | 10 | 200 | 24 | 83.39 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
3900 | 7 | 194 | 21 | 95.12 | MECATRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5426 | 7 | 156 | 33 | 90.29 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
2473 | 1 | NA | 24 | 0.00 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
5481 | 9 | 247 | 10 | 90.69 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5368 | 1 | NA | 27 | 0.00 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
1994 | 2 | 27 | 27 | 87.00 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3704 | 9 | 225 | 10 | 85.19 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
4513 | 3 | 56 | 30 | 89.25 | QUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
4088 | 4 | 76 | 20 | 90.06 | MECATRONICA | Las Curras | 24.01172 | -104.4686 |
3802 | 5 | 79 | 24 | 87.78 | MECATRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1242 | 6 | 124 | 30 | 83.52 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1936 | 5 | 103 | 33 | 85.86 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2647 | 1 | NA | 25 | 0.00 | ELECTRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
351 | 3 | 54 | 29 | 85.92 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 |
1516 | 4 | 79 | 26 | 88.22 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
4997 | 5 | 123 | 34 | 94.27 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
1578 | 10 | 205 | 25 | 81.95 | CIVIL | Las Curras | 24.01172 | -104.4686 |
3827 | 3 | 53 | 27 | 84.92 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
5826 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
2392 | 5 | 70 | 20 | 79.88 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
536 | 11 | 174 | 17 | 82.68 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
5585 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
1484 | 3 | 52 | 30 | 93.50 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1871 | 6 | 97 | 28 | 78.81 | CIVIL | La Esperanza | 23.92139 | -105.2973 |
1221 | 7 | 170 | 31 | 90.08 | BIOQUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5230 | 3 | 53 | 29 | 86.83 | GESTION EMPRESARIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5126 | 6 | 131 | 35 | 86.39 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4010 | 1 | NA | 25 | 0.00 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
4855 | 5 | 108 | 33 | 88.83 | GESTION EMPRESARIAL | Las Curras | 24.01172 | -104.4686 |
5399 | 7 | 160 | 29 | 87.26 | INFORMATICA | La Esperanza | 23.92139 | -105.2973 |
1128 | 11 | 164 | 32 | 78.83 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
5544 | 5 | 89 | 28 | 85.63 | ADMINISTRACION | La Esperanza | 23.92139 | -105.2973 |
1569 | 10 | 152 | 27 | 76.81 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
607 | 5 | 110 | 32 | 90.58 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 |
3724 | 7 | 155 | 34 | 87.52 | MECATRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
366 | 5 | 103 | 25 | 86.91 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4055 | 3 | 43 | 14 | 81.10 | MECATRONICA | La Esperanza | 23.92139 | -105.2973 |
4921 | 5 | 117 | 31 | 92.92 | GESTION EMPRESARIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
2377 | 7 | 120 | 21 | 82.56 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
5155 | 6 | 137 | 33 | 90.10 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
404 | 4 | 73 | 34 | 83.50 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
736 | 5 | 60 | 29 | 80.31 | ARQUITECTURA | La Esperanza | 23.92139 | -105.2973 |
239 | 6 | 129 | 31 | 83.89 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4076 | 7 | 144 | 32 | 88.52 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
5058 | 6 | 142 | 29 | 85.13 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5173 | 2 | 37 | 30 | 93.25 | GESTION EMPRESARIAL | La Esperanza | 23.92139 | -105.2973 |
3514 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
177 | 1 | NA | 27 | 0.00 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 |
584 | 5 | 34 | 23 | 88.38 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
3409 | 10 | 163 | 28 | 79.50 | MECANICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
4560 | 5 | 99 | 30 | 88.90 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
2546 | 1 | NA | 25 | 0.00 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 |
1397 | 4 | 77 | 28 | 85.71 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4623 | 3 | 56 | 30 | 94.75 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5025 | 6 | 53 | 18 | 80.08 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
2162 | 3 | 57 | 29 | 85.17 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1211 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
2869 | 8 | 207 | 33 | 85.57 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1245 | 3 | 39 | 25 | 83.89 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1736 | 3 | 47 | 33 | 87.80 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
5713 | 5 | 113 | 27 | 93.29 | ADMINISTRACION | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1901 | 5 | 117 | 31 | 87.08 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3195 | 7 | 72 | 32 | 87.82 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2761 | 2 | 21 | 30 | 81.80 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4 | MARÍA GUADALUPE | F | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO | SI | SI |
14 | MANUEL | M | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
24 | MIGUEL | M | NO | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO |
34 | MARCO ANTONIO | M | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
44 | FRANCISCA | F | NO | NO | SI | NO | NO | NO | SI | NO | NO | NO | NO | NO |
54 | MARTHA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI | NO |
64 | GABRIELA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
74 | ANA MARÍA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI | NO |
84 | JORGE JESÚS | M | NO | SI | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
94 | IRMA | F | SI | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
25 | 11 | 230 | 15 | 84.02 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
84 | 7 | 165 | 34 | 82.50 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
143 | 7 | 192 | 29 | 91.93 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
202 | 3 | 50 | 28 | 80.73 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
261 | 4 | 78 | 29 | 81.18 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
320 | 7 | 165 | 34 | 88.31 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
379 | 7 | 87 | 21 | 82.58 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
438 | 5 | 83 | 30 | 85.06 | SISTEMAS | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
497 | 10 | 227 | 10 | 88.70 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
556 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
615 | 4 | 60 | 12 | 82.62 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
674 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
733 | 4 | 26 | 32 | 80.67 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
792 | 6 | 142 | 24 | 89.83 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
851 | 2 | 22 | 22 | 85.40 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
910 | 5 | 87 | 35 | 84.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
969 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
1028 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
1087 | 2 | 26 | 26 | 89.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 |
1146 | 9 | 247 | 11 | 85.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1205 | 7 | 193 | 24 | 88.65 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1264 | 1 | NA | 23 | 0.00 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1323 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1382 | 3 | 52 | 30 | 89.08 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1441 | 3 | 52 | 30 | 79.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1500 | 1 | NA | 23 | 0.00 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
1559 | 3 | 49 | 30 | 91.18 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
1618 | 11 | 185 | 30 | 79.18 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1677 | 5 | 96 | 30 | 85.95 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1736 | 3 | 47 | 33 | 87.80 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1795 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
1854 | 4 | 70 | 32 | 81.53 | CIVIL | La Esperanza | 23.92139 | -105.2973 |
1913 | 4 | 65 | 27 | 83.14 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
1972 | 5 | 82 | 31 | 80.06 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2031 | 4 | 72 | 27 | 78.73 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2090 | 4 | 78 | 33 | 83.59 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2149 | 5 | 102 | 33 | 84.23 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2208 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 |
2267 | 9 | 174 | 27 | 82.72 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2326 | 3 | 46 | 28 | 85.55 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2385 | 3 | 56 | 26 | 93.08 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2444 | 5 | 90 | 23 | 82.29 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 |
2503 | 10 | 202 | 23 | 81.25 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 |
2562 | 1 | NA | 25 | 0.00 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 |
2621 | 1 | NA | 25 | 0.00 | ELECTRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
2680 | 10 | 218 | 17 | 82.43 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2739 | 14 | 204 | 26 | 80.30 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2798 | 3 | 43 | 34 | 89.90 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2857 | 4 | 84 | 33 | 86.32 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2916 | 5 | 112 | 30 | 91.24 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
2975 | 4 | 53 | 32 | 79.25 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3034 | 5 | 85 | 31 | 88.21 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3093 | 5 | 104 | 34 | 84.39 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3152 | 7 | 167 | 29 | 87.95 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3211 | 8 | 206 | 29 | 83.30 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3270 | 7 | 146 | 32 | 85.79 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 |
3329 | 2 | 27 | 24 | 87.33 | INDUSTRIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
3388 | 11 | 225 | 10 | 79.27 | MECANICA | Las Curras | 24.01172 | -104.4686 |
3447 | 3 | 34 | 28 | 78.88 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3506 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3565 | 3 | 34 | 32 | 75.63 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 |
3624 | 1 | NA | 26 | 0.00 | MECANICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
3683 | 9 | 176 | 15 | 81.68 | MECATRONICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
3742 | 3 | 58 | 28 | 84.38 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3801 | 5 | 80 | 23 | 85.06 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3860 | 4 | 61 | 4 | 82.29 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3919 | 3 | 53 | 27 | 79.92 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
3978 | 7 | 138 | 31 | 81.20 | MECATRONICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
4037 | 7 | 164 | 20 | 86.77 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 |
4096 | 7 | 145 | 21 | 80.52 | MECATRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 |
4155 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4214 | 7 | 172 | 31 | 86.94 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
4273 | 9 | 214 | 11 | 87.95 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4332 | 4 | 86 | 28 | 79.61 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4391 | 5 | 95 | 28 | 82.30 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4450 | 7 | 142 | 26 | 82.17 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 |
4509 | 5 | 114 | 25 | 85.42 | QUIMICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 |
4568 | 10 | 230 | 5 | 81.38 | QUIMICA | Las Curras | 24.01172 | -104.4686 |
4627 | 11 | 209 | 26 | 81.30 | QUIMICA | Las Curras | 24.01172 | -104.4686 |
4686 | 11 | 200 | 30 | 85.86 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4745 | 9 | 188 | 16 | 89.70 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4804 | 8 | 210 | 25 | 93.86 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4863 | 5 | 118 | 29 | 87.28 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4922 | 6 | 131 | 30 | 85.54 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
4981 | 6 | 63 | 21 | 77.71 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5040 | 6 | 55 | 28 | 82.50 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5099 | 3 | 54 | 28 | 92.17 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5158 | 4 | 69 | 29 | 81.73 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 |
5217 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL | La Criba (Don Toño) | 24.18015 | -104.5482 |
5276 | 5 | 106 | 28 | 87.09 | TIC | La Criba (Don Toño) | 24.18015 | -104.5482 |
5335 | 13 | 230 | 5 | 79.74 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
5394 | 5 | 109 | 27 | 90.71 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 |
5453 | 9 | 234 | 23 | 92.33 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 |
5512 | 6 | 52 | 32 | 84.73 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5571 | 5 | 108 | 32 | 92.09 | ADMINISTRACION | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5630 | 3 | 55 | 29 | 93.17 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5689 | 8 | 219 | 27 | 85.93 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5748 | 4 | 84 | 29 | 89.72 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5807 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5866 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5925 | 7 | 94 | 13 | 80.95 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
N <- nrow(personas)
n <- 10
femeninos <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem
## [1] 0.43
frmas
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | orig.id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
29 | MARÍA DE GUADALUPE | F | NO | NO | NO | NO | SI | NO | NO | SI | NO | SI | NO | NO | 29 |
3 | MARÍA | F | NO | SI | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO | 3 |
4 | JUANA | F | NO | NO | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO | 4 |
36 | ANDREA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI | 36 |
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | orig.id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
47 | LUIS ÁNGEL | M | NO | NO | NO | NO | NO | NO | SI | NO | SI | NO | NO | NO | 47 |
38 | SALVADOR | M | SI | NO | NO | NO | NO | NO | SI | NO | NO | NO | SI | NO | 38 |
5 | ANTONIO | M | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | 5 |
45 | PABLO | M | NO | NO | SI | NO | NO | NO | SI | SI | NO | NO | NO | NO | 45 |
1 | JUAN | M | NO | NO | NO | SI | NO | SI | NO | NO | NO | NO | NO | SI | 1 |
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <- round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Category | f | rf | rf… | cf | cf… | muestra |
---|---|---|---|---|---|---|
INDUSTRIAL | 707 | 0.1192444 | 11.924439 | 707 | 11.92444 | 12 |
ARQUITECTURA | 675 | 0.1138472 | 11.384719 | 1382 | 23.30916 | 11 |
CIVIL | 648 | 0.1092933 | 10.929330 | 2030 | 34.23849 | 11 |
GESTION EMPRESARIAL | 585 | 0.0986676 | 9.866757 | 2615 | 44.10525 | 10 |
QUIMICA | 568 | 0.0958003 | 9.580030 | 3183 | 53.68528 | 10 |
ADMINISTRACION | 497 | 0.0838253 | 8.382527 | 3680 | 62.06780 | 8 |
SISTEMAS | 452 | 0.0762355 | 7.623545 | 4132 | 69.69135 | 8 |
BIOQUIMICA | 441 | 0.0743802 | 7.438016 | 4573 | 77.12936 | 7 |
MECATRONICA | 432 | 0.0728622 | 7.286220 | 5005 | 84.41558 | 7 |
MECANICA | 301 | 0.0507674 | 5.076741 | 5306 | 89.49233 | 5 |
ELECTRICA | 280 | 0.0472255 | 4.722550 | 5586 | 94.21488 | 5 |
ELECTRONICA | 161 | 0.0271547 | 2.715466 | 5747 | 96.93034 | 3 |
INFORMATICA | 101 | 0.0170349 | 1.703491 | 5848 | 98.63383 | 2 |
TIC | 81 | 0.0136617 | 1.366166 | 5929 | 100.00000 | 1 |
N <- nrow(alumnos)
n <- 100
sistemas <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas.")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
46 | 9 | 221 | 14 | 90.71 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 46 |
20 | 11 | 165 | 33 | 78.00 | SISTEMAS | Las Curras | 24.01172 | -104.4686 | 20 |
410 | 3 | 22 | 22 | 80.40 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 410 |
77 | 1 | NA | 27 | 0.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 77 |
26 | 11 | 235 | 10 | 83.84 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 26 |
443 | 7 | 160 | 34 | 90.34 | SISTEMAS | La Esperanza | 23.92139 | -105.2973 | 443 |
278 | 2 | 27 | 28 | 85.33 | SISTEMAS | La Criba (Don Toño) | 24.18015 | -104.5482 | 278 |
34 | 11 | 177 | 29 | 83.92 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 34 |
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
1994 | 2 | 27 | 27 | 87.00 | CIVIL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 426 |
1939 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 371 |
2157 | 3 | 57 | 31 | 86.83 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 589 |
1869 | 3 | 57 | 24 | 90.83 | CIVIL | Las Curras | 24.01172 | -104.4686 | 301 |
2193 | 1 | NA | 27 | 0.00 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 625 |
1810 | 5 | 109 | 30 | 82.48 | CIVIL | La Esperanza | 23.92139 | -105.2973 | 242 |
1980 | 8 | 189 | 32 | 84.21 | CIVIL | La Criba (Don Toño) | 24.18015 | -104.5482 | 412 |
1947 | 6 | 112 | 28 | 80.64 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 379 |
1929 | 8 | 142 | 24 | 79.10 | CIVIL | La Esperanza | 23.92139 | -105.2973 | 361 |
2085 | 3 | 48 | 29 | 83.70 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 517 |
2216 | 3 | 52 | 33 | 84.45 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 648 |
Mostrar los primeros diez y últimos diez alumnos verificando las tres columnas de localidad, latitud y longitud.
kable(head(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Los primeros diez registros de alumnos")
Alumno | localidad | latitud | longitud |
---|---|---|---|
1 | Victoria de Durango | 24.02399 | -104.6702 |
2 | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
3 | Victoria de Durango | 24.02399 | -104.6702 |
4 | Victoria de Durango | 24.02399 | -104.6702 |
5 | Victoria de Durango | 24.02399 | -104.6702 |
6 | Victoria de Durango | 24.02399 | -104.6702 |
7 | La Criba (Don Toño) | 24.18015 | -104.5482 |
8 | Victoria de Durango | 24.02399 | -104.6702 |
9 | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
10 | Victoria de Durango | 24.02399 | -104.6702 |
kable(tail(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Las útimos diez registros de alumnos")
Alumno | localidad | latitud | longitud |
---|---|---|---|
5920 | Victoria de Durango | 24.02399 | -104.6702 |
5921 | Victoria de Durango | 24.02399 | -104.6702 |
5922 | Victoria de Durango | 24.02399 | -104.6702 |
5923 | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 |
5924 | La Esperanza | 23.92139 | -105.2973 |
5925 | Victoria de Durango | 24.02399 | -104.6702 |
5926 | La Esperanza | 23.92139 | -105.2973 |
5927 | Victoria de Durango | 24.02399 | -104.6702 |
5928 | La Criba (Don Toño) | 24.18015 | -104.5482 |
5929 | La Criba (Don Toño) | 24.18015 | -104.5482 |
Determinar la frecuencias por localidad
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <- round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Category | f | rf | rf… | cf | cf… | muestra |
---|---|---|---|---|---|---|
Victoria de Durango | 3527 | 0.5948727 | 59.487266 | 3527 | 59.48727 | 59 |
La Criba (Don Toño) | 750 | 0.1264969 | 12.649688 | 4277 | 72.13695 | 13 |
Los Arroyos (Las Colonias) | 575 | 0.0969809 | 9.698094 | 4852 | 81.83505 | 10 |
La Esperanza | 419 | 0.0706696 | 7.066959 | 5271 | 88.90201 | 7 |
Los Caballos de Don Cruz | 355 | 0.0598752 | 5.987519 | 5626 | 94.88953 | 6 |
Las Curras | 303 | 0.0511047 | 5.110474 | 5929 | 100.00000 | 5 |
Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.
¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad
Simular por las seis localidades
localidades <- tabla_frec$Category
localidades
## [1] "Victoria de Durango" "La Criba (Don Toño)"
## [3] "Los Arroyos (Las Colonias)" "La Esperanza"
## [5] "Los Caballos de Don Cruz" "Las Curras"
N <- nrow(alumnos)
n <- 100
# Determinar cada conglomerado
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])
# Determinar frecuencias de cada conglomerado similiar a la tabla tabla_frec
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N
# Crear muestras
muestraloc1 <- sample(x = loc1, size = round(n * frloc1, 0), replace = FALSE)
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
4286 | 7 | 167 | 32 | 88.51 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2541 |
5461 | 11 | 212 | 28 | 85.98 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3223 |
540 | 9 | 223 | 12 | 85.72 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 305 |
4194 | 5 | 109 | 30 | 78.35 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2484 |
1868 | 4 | 75 | 29 | 80.50 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1103 |
1477 | 5 | 94 | 29 | 82.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 874 |
852 | 2 | 20 | 20 | 90.40 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 495 |
4439 | 6 | 133 | 23 | 82.86 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2623 |
4240 | 3 | 56 | 30 | 90.50 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2515 |
5507 | 9 | 262 | 10 | 93.96 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3251 |
744 | 8 | 182 | 21 | 89.67 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 434 |
4294 | 4 | 81 | 28 | 86.24 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2547 |
5550 | 5 | 98 | 28 | 84.14 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3278 |
5747 | 2 | 23 | 23 | 89.00 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3403 |
4620 | 2 | 22 | 31 | 86.60 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2728 |
2132 | 3 | 57 | 29 | 89.58 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1254 |
1978 | 5 | 109 | 34 | 86.52 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1163 |
1944 | 5 | 118 | 23 | 94.08 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1146 |
5797 | 3 | 55 | 29 | 97.25 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3440 |
4633 | 4 | 86 | 28 | 81.56 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2733 |
3810 | 3 | 49 | 27 | 83.45 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2258 |
2516 | 9 | 155 | 14 | 80.32 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 | 1483 |
3598 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2126 |
535 | 9 | 198 | 29 | 88.31 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 302 |
5476 | 11 | 166 | 29 | 80.11 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3235 |
1963 | 7 | 167 | 36 | 85.60 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1155 |
414 | 6 | 137 | 28 | 84.87 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 247 |
2356 | 1 | NA | 24 | 0.00 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 | 1385 |
3785 | 7 | 154 | 27 | 83.88 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2245 |
3905 | 8 | 174 | 16 | 82.73 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2310 |
4199 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2488 |
2933 | 5 | 112 | 30 | 95.16 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1717 |
1608 | 9 | 235 | 10 | 79.27 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 946 |
3688 | 10 | 168 | 16 | 78.91 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2181 |
5754 | 3 | 55 | 29 | 87.75 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3410 |
5401 | 3 | 55 | 27 | 93.42 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 | 3185 |
1072 | 3 | 24 | 28 | 87.33 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 635 |
4472 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2643 |
5757 | 8 | 166 | 14 | 85.28 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3411 |
3231 | 3 | 27 | 20 | 82.67 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1903 |
4233 | 2 | 25 | 31 | 92.50 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2510 |
113 | 5 | 79 | 23 | 81.06 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 67 |
1990 | 2 | 27 | 30 | 87.83 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1169 |
4356 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2579 |
1890 | 6 | 94 | 28 | 80.70 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 1115 |
3863 | 1 | NA | 25 | 0.00 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2284 |
5341 | 9 | 170 | 30 | 87.18 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 | 3150 |
5911 | 8 | 121 | 22 | 84.54 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3517 |
3433 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2016 |
1095 | 5 | 54 | 12 | 84.50 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 648 |
4719 | 9 | 235 | 10 | 87.49 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2784 |
4731 | 12 | 226 | 9 | 87.36 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2791 |
1656 | 12 | 179 | 33 | 77.27 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 975 |
568 | 5 | 106 | 36 | 89.87 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 322 |
218 | 1 | NA | 27 | 0.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 121 |
3440 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2022 |
2906 | 6 | 91 | 28 | 76.67 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1702 |
3391 | 10 | 230 | 5 | 81.50 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 1993 |
1458 | 7 | 157 | 33 | 84.56 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 863 |
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
797 | 2 | 12 | 22 | 91.67 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 111 |
4345 | 6 | 90 | 33 | 79.47 | QUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 560 |
953 | 6 | 138 | 24 | 90.00 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 139 |
2566 | 5 | 105 | 28 | 88.13 | ELECTRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 350 |
3997 | 6 | 125 | 23 | 85.78 | MECATRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 530 |
1192 | 1 | NA | 23 | 0.00 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 175 |
2551 | 3 | 47 | 25 | 87.55 | ELECTRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 347 |
587 | 6 | 142 | 24 | 94.80 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 79 |
1256 | 6 | 92 | 33 | 81.19 | BIOQUIMICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 189 |
924 | 2 | 20 | 20 | 87.00 | ARQUITECTURA | La Criba (Don Toño) | 24.18015 | -104.5482 | 132 |
5628 | 3 | 19 | 29 | 87.00 | ADMINISTRACION | La Criba (Don Toño) | 24.18015 | -104.5482 | 717 |
4961 | 7 | 162 | 33 | 86.76 | GESTION EMPRESARIAL | La Criba (Don Toño) | 24.18015 | -104.5482 | 633 |
3773 | 5 | 61 | 17 | 81.79 | MECATRONICA | La Criba (Don Toño) | 24.18015 | -104.5482 | 501 |
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
554 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 55 |
5351 | 5 | 41 | 21 | 81.78 | INFORMATICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 528 |
1498 | 4 | 57 | 20 | 85.92 | BIOQUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 134 |
698 | 4 | 80 | 30 | 91.11 | ARQUITECTURA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 61 |
5887 | 9 | 237 | 14 | 87.58 | ADMINISTRACION | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 570 |
4324 | 1 | NA | 25 | 0.00 | QUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 424 |
4067 | 5 | 105 | 33 | 88.96 | MECATRONICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 398 |
2742 | 1 | NA | 27 | 0.00 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 273 |
1407 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 120 |
2852 | 2 | 27 | 24 | 82.33 | INDUSTRIAL | Los Arroyos (Las Colonias) | 23.69142 | -105.0328 | 286 |
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
1429 | 1 | NA | 23 | 0.00 | BIOQUIMICA | La Esperanza | 23.92139 | -105.2973 | 105 |
2944 | 5 | 112 | 30 | 83.08 | INDUSTRIAL | La Esperanza | 23.92139 | -105.2973 | 205 |
1368 | 2 | 23 | 29 | 80.33 | BIOQUIMICA | La Esperanza | 23.92139 | -105.2973 | 102 |
1897 | 4 | 75 | 34 | 82.81 | CIVIL | La Esperanza | 23.92139 | -105.2973 | 138 |
1125 | 3 | 56 | 28 | 89.15 | ARQUITECTURA | La Esperanza | 23.92139 | -105.2973 | 92 |
2977 | 8 | 201 | 28 | 83.67 | INDUSTRIAL | La Esperanza | 23.92139 | -105.2973 | 208 |
516 | 11 | 186 | 16 | 78.92 | ARQUITECTURA | La Esperanza | 23.92139 | -105.2973 | 53 |
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
3083 | 6 | 137 | 29 | 84.52 | INDUSTRIAL | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 188 |
561 | 6 | 142 | 24 | 89.27 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 37 |
3680 | 9 | 220 | 15 | 85.78 | MECATRONICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 218 |
5488 | 9 | 262 | 10 | 94.29 | ADMINISTRACION | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 330 |
1123 | 6 | 93 | 17 | 85.10 | ARQUITECTURA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 59 |
1191 | 3 | 52 | 30 | 90.75 | BIOQUIMICA | Los Caballos de Don Cruz | 23.95737 | -104.5519 | 67 |
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
4735 | 11 | 206 | 19 | 84.07 | GESTION EMPRESARIAL | Las Curras | 24.01172 | -104.4686 | 238 |
2775 | 8 | 194 | 20 | 85.25 | INDUSTRIAL | Las Curras | 24.01172 | -104.4686 | 127 |
3229 | 6 | 104 | 33 | 85.29 | INDUSTRIAL | Las Curras | 24.01172 | -104.4686 | 157 |
4203 | 3 | 56 | 30 | 88.67 | QUIMICA | Las Curras | 24.01172 | -104.4686 | 206 |
3484 | 5 | 108 | 29 | 82.50 | MECANICA | Las Curras | 24.01172 | -104.4686 | 172 |
map<-leaflet() %>%
addTiles() %>%
addMarkers(lat = unique(muestraloc1$latitud ), lng = unique(muestraloc1$longitud), popup = paste(unique(muestraloc1$localidad), "Muestra de:", nrow(muestraloc1), "alumnos")) %>%
addMarkers(lat = unique(muestraloc2$latitud ), lng = unique(muestraloc2$longitud), popup = paste(unique(muestraloc2$localidad), "Muestra de:", nrow(muestraloc2), "alumnos")) %>%
addMarkers(lat = unique(muestraloc3$latitud ), lng = unique(muestraloc3$longitud), popup = paste(unique(muestraloc3$localidad), "Muestra de:", nrow(muestraloc3), "alumnos")) %>%
addMarkers(lat = unique(muestraloc4$latitud ), lng = unique(muestraloc4$longitud), popup = paste(unique(muestraloc4$localidad), "Muestra de:", nrow(muestraloc4), "alumnos")) %>%
addMarkers(lat = unique(muestraloc5$latitud ), lng = unique(muestraloc5$longitud), popup = paste(unique(muestraloc5$localidad), "Muestra de:", nrow(muestraloc5), "alumnos")) %>%
addMarkers(lat = unique(muestraloc6$latitud ), lng = unique(muestraloc6$longitud), popup = paste(unique(muestraloc6$localidad), "Muestra de:", nrow(muestraloc6), "alumnos"))
# Mostrar el mapa
map
Los distintos tipos de muestreo que encontramos en el caso son interesantes, ya que todos hacen la función de seleccionar de un conjunto de personas o cosas que se consideran representativos de los distintos grupos al que pertenecen, con la finalidad de estudiar o determinar las características del grupo en el que se encuentran.
De igual manera, se enfocan en dar un dato aleatorio, pero representativo, para que el grupo se defina de manera correcta y un poco más factible que estar buscando cada valor en el grupo.