Determinar y simular muestreos
Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.
El propósito de la estadística inferencial consiste en determinar y conocer el comportamiento sobre una población a partir de una muestra.
Una muestra es una porción, una proporción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible y sencillo que el estudio de toda la población. [@lind_estadistica_2015].
Por otra parte la importancia del muestreo como lo menciona [@anderson_estadistica_2008] es cuestión de minimizar costo de trabajo, recopilar información de una muestra es sustancialmente menor, que hacerlo de una población completa; especialmente cuando se deben realizar entrevistas personales para recopilar la información.
Finamente, los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadísticas válidas [@lind_estadistica_2015].
Una muestra aleatoria simple de tamaño \(n\) de una población finita de tamaño \(N\) es una muestra seleccionada de manera que cada posible muestra de tamaño \(n\) tenga la misma probabilidad de ser seleccionada [@anderson_estadistica_2008].
De un cojunto de \(N\) elementos de una población, un muestreo aleatorio simple sería una especíe de rifa o tómbola para elegir de de entre los \(N\) total de población una cantidad de \(n\) número de la muestra.
Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población [@lind_estadistica_2015].
Suele emplearse como alternativa al muestreo aleatorio simple, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente [@anderson_estadistica_2008].
El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población [@anderson_estadistica_2008]
Cuando una población se divide en grupos a partir de ciertas características, el muestreo aleatorio estratificado garantiza que cada grupo o estrato se encuentre representado en la muestra [@lind_estadistica_2015].
[@anderson_estadistica_2008] describe el muestreo aleatorio estratificado en donde los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad, tipo de industria, enre otros, está a discreción de la persona que diseña la muestra.
Por otra parte, para asegurar que la muestra sea una representación imparcial de las \(N\) observaciones, se debe determinar la frecuencia relativa y a partir de ahí generar las cantidad de muestra de cada estrato. [@lind_estadistica_2015].
La población se divide en conglomerados a partir de los límites naturales geográficos u otra clase. A continuación, estos se seleccionan al azar y se toma una muestra de forma aleatoria con elementos de cada grupo [@lind_estadistica_2015].
library(dplyr)
library(mosaic)
library(readr)
library(ggplot2) # Para gráficos
library(knitr) # Para formateo de datos
library(fdth) # Para tablas de frecuencias
library(leaflet) # Para hacer mapas
source("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/funciones/construir%20datos%20y%20funciones.r", encoding = "UTF-8")
kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto dedatos")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
JUAN | M | NO | NO | NO | SI | NO | SI | NO | NO | NO | NO | NO | SI |
JOSÉ LUIS | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
JOSÉ | M | NO | SI | NO | SI | NO | NO | NO | NO | NO | NO | SI | SI |
MARÍA GUADALUPE | F | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO | SI | SI |
FRANCISCO | M | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
GUADALUPE | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
MARÍA | F | NO | SI | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO |
JUANA | F | NO | NO | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO |
ANTONIO | M | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
JESÚS | M | NO | NO | SI | NO | NO | SI | NO | NO | SI | NO | NO | NO |
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
91 | ANDREA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI |
92 | ISABEL | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
93 | MARÍA TERESA | F | NO | SI | NO | NO | SI | NO | NO | SI | NO | NO | NO | NO |
94 | IRMA | F | SI | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
95 | CARMEN | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
96 | LUCÍA | F | NO | SI | NO | SI | NO | NO | NO | SI | NO | NO | SI | SI |
97 | ADRIANA | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
98 | AGUSTÍN | M | NO | SI | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO |
99 | MARÍA DE LA LUZ | F | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO |
100 | GUSTAVO | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
Se cargan os datos de alumnos inscritos en una Institución de educación superior en el semetre septiembre 2020 a enero 2021, con los atributos siguientes:
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/datos%20alumnos.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera |
---|---|---|---|---|---|
1 | 11 | 198 | 19 | 80.21 | SISTEMAS |
2 | 11 | 235 | 10 | 84.33 | SISTEMAS |
3 | 9 | 235 | 10 | 95.25 | SISTEMAS |
4 | 9 | 226 | 19 | 95.00 | SISTEMAS |
5 | 10 | 231 | 14 | 82.32 | SISTEMAS |
6 | 9 | 212 | 23 | 95.02 | SISTEMAS |
7 | 12 | 221 | 10 | 79.06 | SISTEMAS |
8 | 9 | 226 | 9 | 92.47 | SISTEMAS |
9 | 9 | 231 | 4 | 91.08 | SISTEMAS |
10 | 11 | 222 | 13 | 80.42 | SISTEMAS |
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera |
---|---|---|---|---|---|
5920 | 7 | 169 | 23 | 89.14 | ADMINISTRACION |
5921 | 5 | 109 | 26 | 87.83 | ADMINISTRACION |
5922 | 3 | 55 | 29 | 92.83 | ADMINISTRACION |
5923 | 2 | 23 | 23 | 88.60 | ADMINISTRACION |
5924 | 2 | 27 | 28 | 92.83 | ADMINISTRACION |
5925 | 7 | 94 | 13 | 80.95 | ADMINISTRACION |
5926 | 5 | 103 | 32 | 92.68 | ADMINISTRACION |
5927 | 4 | 79 | 34 | 86.18 | ADMINISTRACION |
5928 | 5 | 108 | 32 | 90.48 | ADMINISTRACION |
5929 | 7 | 169 | 32 | 92.33 | ADMINISTRACION |
N <- nrow(personas)
n <- 10
muestra <- sample(personas$nombres, n)
kable(muestra, caption = "La muestra de personas")
x |
---|
DANIEL |
JUAN MANUEL |
MIGUEL |
GUSTAVO |
FRANCISCA |
RAÚL |
JUAN |
LUCÍA |
MARÍA TERESA |
JORGE |
N <- nrow(alumnos)
n <- 100
registros <- sample(N, n) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera |
---|---|---|---|---|---|
2700 | 9 | 202 | 19 | 82.26 | INDUSTRIAL |
1164 | 9 | 129 | 18 | 83.79 | BIOQUIMICA |
1469 | 7 | 150 | 36 | 80.81 | BIOQUIMICA |
5645 | 3 | 55 | 29 | 97.67 | ADMINISTRACION |
3227 | 7 | 163 | 30 | 86.30 | INDUSTRIAL |
4973 | 6 | 133 | 33 | 85.54 | GESTION EMPRESARIAL |
5866 | 1 | NA | 27 | 0.00 | ADMINISTRACION |
1513 | 6 | 67 | 34 | 78.60 | BIOQUIMICA |
4076 | 7 | 144 | 32 | 88.52 | MECATRONICA |
2521 | 9 | 222 | 23 | 86.40 | ELECTRONICA |
5624 | 3 | 55 | 29 | 96.67 | ADMINISTRACION |
4985 | 4 | 55 | 29 | 80.42 | GESTION EMPRESARIAL |
5075 | 5 | 116 | 32 | 87.71 | GESTION EMPRESARIAL |
5041 | 7 | 140 | 35 | 82.27 | GESTION EMPRESARIAL |
395 | 1 | NA | 27 | 0.00 | SISTEMAS |
3795 | 4 | 66 | 29 | 86.47 | MECATRONICA |
5683 | 1 | NA | 27 | 0.00 | ADMINISTRACION |
1577 | 9 | 165 | 16 | 78.86 | CIVIL |
2306 | 5 | 89 | 27 | 86.33 | ELECTRICA |
3510 | 3 | 41 | 24 | 76.80 | MECANICA |
1415 | 6 | 123 | 29 | 82.48 | BIOQUIMICA |
830 | 5 | 97 | 26 | 93.50 | ARQUITECTURA |
200 | 7 | 107 | 17 | 79.26 | SISTEMAS |
5484 | 11 | 257 | 5 | 87.44 | ADMINISTRACION |
25 | 11 | 230 | 15 | 84.02 | SISTEMAS |
2596 | 3 | 52 | 25 | 92.67 | ELECTRONICA |
3863 | 1 | NA | 25 | 0.00 | MECATRONICA |
74 | 10 | 230 | 15 | 83.94 | SISTEMAS |
1933 | 1 | NA | 27 | 0.00 | CIVIL |
1691 | 4 | 75 | 32 | 84.19 | CIVIL |
2587 | 5 | 90 | 20 | 83.50 | ELECTRONICA |
886 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
4827 | 7 | 150 | 25 | 88.75 | GESTION EMPRESARIAL |
4756 | 9 | 230 | 15 | 91.77 | GESTION EMPRESARIAL |
663 | 7 | 151 | 23 | 85.22 | ARQUITECTURA |
2503 | 10 | 202 | 23 | 81.25 | ELECTRONICA |
4892 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL |
4549 | 6 | 133 | 23 | 83.25 | QUIMICA |
308 | 4 | 83 | 29 | 91.00 | SISTEMAS |
2139 | 6 | 143 | 30 | 84.77 | CIVIL |
1319 | 7 | 124 | 34 | 83.15 | BIOQUIMICA |
5755 | 4 | 84 | 29 | 87.44 | ADMINISTRACION |
5920 | 7 | 169 | 23 | 89.14 | ADMINISTRACION |
3632 | 1 | NA | 26 | 0.00 | MECANICA |
3546 | 3 | 48 | 22 | 78.64 | MECANICA |
1619 | 9 | 225 | 10 | 84.85 | CIVIL |
1632 | 9 | 159 | 15 | 80.15 | CIVIL |
4890 | 7 | 170 | 35 | 87.44 | GESTION EMPRESARIAL |
2090 | 4 | 78 | 33 | 83.59 | CIVIL |
1764 | 1 | NA | 27 | 0.00 | CIVIL |
612 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
1097 | 7 | 139 | 24 | 84.62 | ARQUITECTURA |
796 | 7 | 116 | 34 | 81.12 | ARQUITECTURA |
240 | 2 | 27 | 28 | 92.33 | SISTEMAS |
1202 | 1 | NA | 23 | 0.00 | BIOQUIMICA |
4673 | 12 | 219 | 16 | 89.93 | GESTION EMPRESARIAL |
5370 | 5 | 41 | 4 | 81.44 | INFORMATICA |
1901 | 5 | 117 | 31 | 87.08 | CIVIL |
3696 | 11 | 231 | 4 | 83.33 | MECATRONICA |
3370 | 11 | 225 | 10 | 81.86 | MECANICA |
1197 | 3 | 57 | 27 | 82.54 | BIOQUIMICA |
3032 | 3 | 55 | 29 | 89.00 | INDUSTRIAL |
4867 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL |
1967 | 1 | NA | 27 | 0.00 | CIVIL |
3638 | 7 | 170 | 27 | 86.59 | MECANICA |
934 | 7 | 170 | 28 | 88.58 | ARQUITECTURA |
4100 | 9 | 225 | 5 | 87.96 | QUIMICA |
5193 | 6 | 138 | 33 | 86.21 | GESTION EMPRESARIAL |
5450 | 10 | 262 | 10 | 88.60 | ADMINISTRACION |
1067 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
3404 | 10 | 172 | 18 | 81.13 | MECANICA |
4217 | 12 | 225 | 10 | 78.46 | QUIMICA |
1449 | 1 | NA | 23 | 0.00 | BIOQUIMICA |
2720 | 9 | 202 | 24 | 82.28 | INDUSTRIAL |
5151 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL |
3110 | 1 | NA | 27 | 0.00 | INDUSTRIAL |
1051 | 6 | 127 | 24 | 88.19 | ARQUITECTURA |
4783 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL |
5643 | 2 | 27 | 28 | 92.67 | ADMINISTRACION |
4482 | 2 | 25 | 30 | 82.00 | QUIMICA |
4046 | 1 | NA | 25 | 0.00 | MECATRONICA |
2183 | 2 | 27 | 30 | 83.50 | CIVIL |
659 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
5318 | 1 | NA | 26 | 0.00 | TIC |
2101 | 2 | 23 | 25 | 80.80 | CIVIL |
1758 | 4 | 80 | 34 | 85.94 | CIVIL |
2297 | 5 | 94 | 33 | 84.77 | ELECTRICA |
3793 | 7 | 128 | 31 | 84.46 | MECATRONICA |
822 | 3 | 48 | 32 | 90.45 | ARQUITECTURA |
352 | 8 | 176 | 32 | 80.47 | SISTEMAS |
3467 | 3 | 42 | 32 | 82.30 | MECANICA |
443 | 7 | 160 | 34 | 90.34 | SISTEMAS |
241 | 5 | 112 | 25 | 91.63 | SISTEMAS |
4569 | 3 | 51 | 30 | 88.64 | QUIMICA |
3456 | 6 | 89 | 32 | 78.30 | MECANICA |
5534 | 8 | 177 | 34 | 86.89 | ADMINISTRACION |
3666 | 12 | 190 | 5 | 78.35 | MECATRONICA |
2155 | 2 | 22 | 26 | 93.40 | CIVIL |
3527 | 1 | NA | 26 | 0.00 | MECANICA |
1607 | 10 | 231 | 4 | 83.15 | CIVIL |
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
6 | GUADALUPE | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO |
16 | MARÍA DEL CARMEN | F | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO | NO |
26 | JAVIER | F | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | SI | NO |
36 | FRANCISCO JAVIER | F | SI | NO | NO | NO | NO | NO | NO | SI | NO | NO | SI | NO |
46 | TERESA | F | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO |
56 | YOLANDA | F | SI | NO | NO | NO | SI | NO | NO | NO | NO | NO | NO | NO |
66 | VÍCTOR MANUEL | M | NO | SI | SI | SI | NO | NO | NO | NO | NO | NO | NO | NO |
76 | MARÍA ISABEL | F | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI |
86 | JOSÉ GUADALUPE | M | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | NO | SI |
96 | LUCÍA | F | NO | SI | NO | SI | NO | NO | NO | SI | NO | NO | SI | SI |
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera |
---|---|---|---|---|---|
40 | 9 | 217 | 18 | 92.00 | SISTEMAS |
99 | 1 | NA | 27 | 0.00 | SISTEMAS |
158 | 1 | NA | 27 | 0.00 | SISTEMAS |
217 | 1 | NA | 27 | 0.00 | SISTEMAS |
276 | 3 | 8 | 22 | 80.00 | SISTEMAS |
335 | 3 | 50 | 28 | 92.00 | SISTEMAS |
394 | 3 | 50 | 28 | 88.55 | SISTEMAS |
453 | 9 | 219 | 16 | 89.98 | ARQUITECTURA |
512 | 9 | 223 | 4 | 90.24 | ARQUITECTURA |
571 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
630 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
689 | 1 | NA | 26 | 0.00 | ARQUITECTURA |
748 | 6 | 117 | 33 | 86.38 | ARQUITECTURA |
807 | 3 | 48 | 32 | 89.82 | ARQUITECTURA |
866 | 6 | 142 | 28 | 88.53 | ARQUITECTURA |
925 | 4 | 80 | 30 | 93.39 | ARQUITECTURA |
984 | 6 | 120 | 28 | 85.59 | ARQUITECTURA |
1043 | 2 | 26 | 26 | 88.33 | ARQUITECTURA |
1102 | 3 | 52 | 28 | 88.33 | ARQUITECTURA |
1161 | 9 | 247 | 11 | 90.62 | BIOQUIMICA |
1220 | 5 | 81 | 34 | 85.44 | BIOQUIMICA |
1279 | 3 | 52 | 30 | 97.92 | BIOQUIMICA |
1338 | 4 | 77 | 22 | 80.47 | BIOQUIMICA |
1397 | 4 | 77 | 28 | 85.71 | BIOQUIMICA |
1456 | 6 | 118 | 34 | 84.35 | BIOQUIMICA |
1515 | 5 | 99 | 26 | 86.86 | BIOQUIMICA |
1574 | 12 | 230 | 5 | 79.42 | CIVIL |
1633 | 11 | 206 | 29 | 79.65 | CIVIL |
1692 | 8 | 193 | 27 | 80.38 | CIVIL |
1751 | 7 | 175 | 24 | 87.25 | CIVIL |
1810 | 5 | 109 | 30 | 82.48 | CIVIL |
1869 | 3 | 57 | 24 | 90.83 | CIVIL |
1928 | 5 | 100 | 19 | 80.00 | CIVIL |
1987 | 5 | 101 | 28 | 83.71 | CIVIL |
2046 | 8 | 150 | 33 | 81.77 | CIVIL |
2105 | 8 | 178 | 30 | 79.41 | CIVIL |
2164 | 1 | NA | 27 | 0.00 | CIVIL |
2223 | 9 | 220 | 15 | 83.30 | ELECTRICA |
2282 | 5 | 94 | 26 | 84.09 | ELECTRICA |
2341 | 3 | 46 | 28 | 91.55 | ELECTRICA |
2400 | 1 | NA | 24 | 0.00 | ELECTRICA |
2459 | 1 | NA | 24 | 0.00 | ELECTRICA |
2518 | 11 | 192 | 23 | 83.88 | ELECTRONICA |
2577 | 3 | 52 | 25 | 87.67 | ELECTRONICA |
2636 | 5 | 105 | 28 | 92.65 | ELECTRONICA |
2695 | 9 | 226 | 4 | 85.18 | INDUSTRIAL |
2754 | 5 | 93 | 34 | 83.29 | INDUSTRIAL |
2813 | 5 | 98 | 32 | 83.41 | INDUSTRIAL |
2872 | 7 | 156 | 36 | 84.71 | INDUSTRIAL |
2931 | 2 | 27 | 24 | 82.83 | INDUSTRIAL |
2990 | 9 | 235 | 10 | 84.96 | INDUSTRIAL |
3049 | 2 | 27 | 24 | 81.50 | INDUSTRIAL |
3108 | 8 | 123 | 34 | 82.50 | INDUSTRIAL |
3167 | 2 | 27 | 28 | 88.33 | INDUSTRIAL |
3226 | 1 | NA | 27 | 0.00 | INDUSTRIAL |
3285 | 2 | 27 | 24 | 81.00 | INDUSTRIAL |
3344 | 5 | 55 | 27 | 86.69 | INDUSTRIAL |
3403 | 9 | 175 | 28 | 83.45 | MECANICA |
3462 | 7 | 83 | 30 | 78.05 | MECANICA |
3521 | 7 | 137 | 34 | 86.20 | MECANICA |
3580 | 8 | 175 | 21 | 85.34 | MECANICA |
3639 | 3 | 30 | 22 | 83.00 | MECANICA |
3698 | 9 | 219 | 16 | 89.63 | MECATRONICA |
3757 | 1 | NA | 25 | 0.00 | MECATRONICA |
3816 | 5 | 108 | 30 | 86.71 | MECATRONICA |
3875 | 4 | 67 | 23 | 79.07 | MECATRONICA |
3934 | 3 | 53 | 27 | 86.50 | MECATRONICA |
3993 | 8 | 151 | 27 | 79.53 | MECATRONICA |
4052 | 5 | 110 | 24 | 85.17 | MECATRONICA |
4111 | 9 | 224 | 6 | 91.26 | QUIMICA |
4170 | 10 | 211 | 24 | 80.44 | QUIMICA |
4229 | 3 | 36 | 30 | 89.25 | QUIMICA |
4288 | 13 | 235 | 10 | 78.98 | QUIMICA |
4347 | 7 | 138 | 24 | 85.07 | QUIMICA |
4406 | 4 | 86 | 28 | 81.44 | QUIMICA |
4465 | 9 | 214 | 21 | 89.05 | QUIMICA |
4524 | 10 | 127 | 13 | 78.89 | QUIMICA |
4583 | 7 | 150 | 22 | 86.16 | QUIMICA |
4642 | 2 | 25 | 31 | 89.17 | QUIMICA |
4701 | 9 | 230 | 5 | 94.75 | GESTION EMPRESARIAL |
4760 | 9 | 215 | 20 | 87.38 | GESTION EMPRESARIAL |
4819 | 3 | 54 | 28 | 87.08 | GESTION EMPRESARIAL |
4878 | 3 | 54 | 28 | 87.42 | GESTION EMPRESARIAL |
4937 | 7 | 167 | 33 | 88.00 | GESTION EMPRESARIAL |
4996 | 3 | 54 | 28 | 95.33 | GESTION EMPRESARIAL |
5055 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL |
5114 | 7 | 185 | 25 | 95.74 | GESTION EMPRESARIAL |
5173 | 2 | 37 | 30 | 93.25 | GESTION EMPRESARIAL |
5232 | 3 | 54 | 28 | 89.08 | GESTION EMPRESARIAL |
5291 | 5 | 101 | 28 | 81.27 | TIC |
5350 | 9 | 215 | 16 | 84.57 | INFORMATICA |
5409 | 3 | 55 | 27 | 87.92 | INFORMATICA |
5468 | 11 | 240 | 22 | 84.88 | ADMINISTRACION |
5527 | 1 | NA | 27 | 0.00 | ADMINISTRACION |
5586 | 1 | NA | 27 | 0.00 | ADMINISTRACION |
5645 | 3 | 55 | 29 | 97.67 | ADMINISTRACION |
5704 | 5 | 79 | 29 | 86.06 | ADMINISTRACION |
5763 | 5 | 113 | 27 | 92.83 | ADMINISTRACION |
5822 | 5 | 113 | 27 | 95.63 | ADMINISTRACION |
5881 | 7 | 135 | 34 | 83.90 | ADMINISTRACION |
N <- nrow(personas)
n <- 10
femeninos <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem
## [1] 0.43
frmas
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | orig.id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
26 | GLORIA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | 26 |
36 | ANDREA | F | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | SI | 36 |
39 | IRMA | F | SI | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | 39 |
10 | FRANCISCO JAVIER | F | SI | NO | NO | NO | NO | NO | NO | SI | NO | NO | SI | NO | 10 |
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
nombres | generos | ajedrez | beisbol | tiro.arco | pesas | futbol | softbol | atletismo | folklorico | tahitiano | teatro | rondalla | pantomima | orig.id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
20 | RAFAEL | M | NO | NO | NO | NO | NO | NO | NO | SI | NO | NO | NO | NO | 20 |
3 | JOSÉ | M | NO | SI | NO | SI | NO | NO | NO | NO | NO | NO | SI | SI | 3 |
31 | SERGIO | M | SI | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | NO | 31 |
47 | LUIS ÁNGEL | M | NO | NO | NO | NO | NO | NO | SI | NO | SI | NO | NO | NO | 47 |
46 | RUBEN | M | NO | SI | NO | NO | NO | NO | NO | NO | NO | NO | SI | NO | 46 |
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <- round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Category | f | rf | rf… | cf | cf… | muestra |
---|---|---|---|---|---|---|
INDUSTRIAL | 707 | 0.1192444 | 11.924439 | 707 | 11.92444 | 12 |
ARQUITECTURA | 675 | 0.1138472 | 11.384719 | 1382 | 23.30916 | 11 |
CIVIL | 648 | 0.1092933 | 10.929330 | 2030 | 34.23849 | 11 |
GESTION EMPRESARIAL | 585 | 0.0986676 | 9.866757 | 2615 | 44.10525 | 10 |
QUIMICA | 568 | 0.0958003 | 9.580030 | 3183 | 53.68528 | 10 |
ADMINISTRACION | 497 | 0.0838253 | 8.382527 | 3680 | 62.06780 | 8 |
SISTEMAS | 452 | 0.0762355 | 7.623545 | 4132 | 69.69135 | 8 |
BIOQUIMICA | 441 | 0.0743802 | 7.438016 | 4573 | 77.12936 | 7 |
MECATRONICA | 432 | 0.0728622 | 7.286220 | 5005 | 84.41558 | 7 |
MECANICA | 301 | 0.0507674 | 5.076741 | 5306 | 89.49233 | 5 |
ELECTRICA | 280 | 0.0472255 | 4.722550 | 5586 | 94.21488 | 5 |
ELECTRONICA | 161 | 0.0271547 | 2.715466 | 5747 | 96.93034 | 3 |
INFORMATICA | 101 | 0.0170349 | 1.703491 | 5848 | 98.63383 | 2 |
TIC | 81 | 0.0136617 | 1.366166 | 5929 | 100.00000 | 1 |
N <- nrow(alumnos)
n <- 100
sistemas <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | orig.id |
---|---|---|---|---|---|---|
130 | 4 | 87 | 33 | 87.89 | SISTEMAS | 130 |
335 | 3 | 50 | 28 | 92.00 | SISTEMAS | 335 |
142 | 3 | 36 | 23 | 89.13 | SISTEMAS | 142 |
199 | 1 | NA | 27 | 0.00 | SISTEMAS | 199 |
30 | 11 | 226 | 9 | 81.78 | SISTEMAS | 30 |
52 | 10 | 138 | 31 | 79.33 | SISTEMAS | 52 |
449 | 1 | NA | 27 | 0.00 | SISTEMAS | 449 |
414 | 6 | 137 | 28 | 84.87 | SISTEMAS | 414 |
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | orig.id |
---|---|---|---|---|---|---|
1847 | 5 | 122 | 30 | 86.00 | CIVIL | 279 |
2207 | 6 | 38 | 35 | 77.38 | CIVIL | 639 |
2128 | 6 | 118 | 34 | 78.44 | CIVIL | 560 |
2184 | 1 | NA | 27 | 0.00 | CIVIL | 616 |
1794 | 6 | 137 | 34 | 87.66 | CIVIL | 226 |
1740 | 5 | 113 | 30 | 88.63 | CIVIL | 172 |
2009 | 4 | 82 | 31 | 82.71 | CIVIL | 441 |
1578 | 10 | 205 | 25 | 81.95 | CIVIL | 10 |
1905 | 7 | 154 | 32 | 82.64 | CIVIL | 337 |
1984 | 6 | 133 | 30 | 86.79 | CIVIL | 416 |
1731 | 8 | 187 | 25 | 86.03 | CIVIL | 163 |
N <- nrow(alumnos)
n <- 100
locdurangomx <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/locdurangomx.csv", encoding = "UTF-8")
Segundo por medio de función sample() generar cinco registros aleatorios de localidades y agregar un sexto registro de Victoria de Durango.
set.seed(1000)
localidades6 <- locdurangomx[sample(nrow(locdurangomx), 5), ]
localidades6 <- rbind(localidades6, locdurangomx[1,])
registros <- locdurangomx[sample(localidades6$X, N, replace = TRUE, prob = c(.10, 0.12, 0.05, 0.07, 0.06, 0.60)),c("Nom_Loc", "Lat_Decimal", "Lon_Decimal")]
alumnos$localidad <- registros$Nom_Loc
alumnos$latitud <- registros$Lat_Decimal
alumnos$longitud <- registros$Lon_Decimal
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
1 | 11 | 198 | 19 | 80.21 | SISTEMAS | Las Aves | 23.94883 | -104.5715 |
2 | 11 | 235 | 10 | 84.33 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
3 | 9 | 235 | 10 | 95.25 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
4 | 9 | 226 | 19 | 95.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
5 | 10 | 231 | 14 | 82.32 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
6 | 9 | 212 | 23 | 95.02 | SISTEMAS | Las Aves | 23.94883 | -104.5715 |
7 | 12 | 221 | 10 | 79.06 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
8 | 9 | 226 | 9 | 92.47 | SISTEMAS | Los Fresnos | 24.08339 | -104.6095 |
9 | 9 | 231 | 4 | 91.08 | SISTEMAS | Las Aves | 23.94883 | -104.5715 |
10 | 11 | 222 | 13 | 80.42 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 |
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud |
---|---|---|---|---|---|---|---|---|
5920 | 7 | 169 | 23 | 89.14 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5921 | 5 | 109 | 26 | 87.83 | ADMINISTRACION | Los Fresnos | 24.08339 | -104.6095 |
5922 | 3 | 55 | 29 | 92.83 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5923 | 2 | 23 | 23 | 88.60 | ADMINISTRACION | Michel [Granja] | 24.00545 | -104.7152 |
5924 | 2 | 27 | 28 | 92.83 | ADMINISTRACION | Las Brisas | 23.97352 | -104.5800 |
5925 | 7 | 94 | 13 | 80.95 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5926 | 5 | 103 | 32 | 92.68 | ADMINISTRACION | Las Aves | 23.94883 | -104.5715 |
5927 | 4 | 79 | 34 | 86.18 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5928 | 5 | 108 | 32 | 90.48 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 |
5929 | 7 | 169 | 32 | 92.33 | ADMINISTRACION | Microondas el Tecolote | 24.05248 | -104.8519 |
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <- round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Category | f | rf | rf… | cf | cf… | muestra |
---|---|---|---|---|---|---|
Victoria de Durango | 3564 | 0.6011132 | 60.111317 | 3564 | 60.11132 | 60 |
Las Brisas | 691 | 0.1165458 | 11.654579 | 4255 | 71.76590 | 12 |
Las Aves | 626 | 0.1055827 | 10.558273 | 4881 | 82.32417 | 11 |
Los Fresnos | 431 | 0.0726935 | 7.269354 | 5312 | 89.59352 | 7 |
Microondas el Tecolote | 329 | 0.0554900 | 5.548997 | 5641 | 95.14252 | 6 |
Michel [Granja] | 288 | 0.0485748 | 4.857480 | 5929 | 100.00000 | 5 |
Quinto Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.
¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad
Simular por las seis localidades
N <- nrow(alumnos)
n <- 100
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N
muestraloc1 <- sample(loc1, round(n * frloc1, 0))
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
5752 | 3 | 55 | 29 | 95.67 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3462 |
1354 | 7 | 167 | 34 | 86.40 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 809 |
5197 | 8 | 195 | 25 | 87.88 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 3142 |
4694 | 9 | 230 | 15 | 92.17 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2835 |
1656 | 12 | 179 | 33 | 77.27 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 995 |
3520 | 1 | NA | 26 | 0.00 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2155 |
1220 | 5 | 81 | 34 | 85.44 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 728 |
1366 | 2 | 23 | 29 | 90.17 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 818 |
579 | 4 | 80 | 30 | 89.11 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 331 |
2440 | 1 | NA | 24 | 0.00 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 | 1484 |
5184 | 3 | 60 | 29 | 84.85 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 3132 |
1337 | 8 | 186 | 24 | 84.36 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 798 |
945 | 6 | 134 | 24 | 87.86 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 563 |
4561 | 1 | NA | 25 | 0.00 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2751 |
949 | 2 | 26 | 26 | 87.67 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 565 |
853 | 2 | 24 | 22 | 87.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 511 |
4009 | 2 | 25 | 28 | 80.67 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2423 |
981 | 5 | 110 | 32 | 89.50 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 587 |
3423 | 7 | 102 | 30 | 80.91 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2093 |
5597 | 8 | 207 | 27 | 93.09 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3369 |
2461 | 7 | 150 | 28 | 82.79 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 | 1496 |
1351 | 3 | 52 | 30 | 85.75 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 807 |
343 | 8 | 165 | 28 | 81.31 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 201 |
4890 | 7 | 170 | 35 | 87.44 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2947 |
1348 | 7 | 164 | 32 | 91.03 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 806 |
739 | 1 | NA | 26 | 0.00 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 433 |
1212 | 7 | 165 | 36 | 86.37 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 723 |
3020 | 3 | 55 | 29 | 92.15 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1848 |
1394 | 2 | 23 | 29 | 86.83 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 836 |
4023 | 1 | NA | 25 | 0.00 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2434 |
2358 | 7 | 98 | 9 | 81.04 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 | 1435 |
4165 | 4 | 53 | 20 | 77.91 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2522 |
4937 | 7 | 167 | 33 | 88.00 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 2978 |
2500 | 9 | 197 | 20 | 84.05 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 | 1518 |
866 | 6 | 142 | 28 | 88.53 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 518 |
307 | 2 | 27 | 28 | 77.00 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 180 |
5480 | 9 | 228 | 24 | 86.23 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3304 |
5413 | 1 | NA | 27 | 0.00 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 | 3267 |
5861 | 7 | 169 | 32 | 93.89 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3521 |
661 | 3 | 52 | 28 | 83.42 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 384 |
1654 | 10 | 171 | 32 | 78.42 | CIVIL | Victoria de Durango | 24.02399 | -104.6702 | 994 |
4474 | 8 | 205 | 20 | 83.76 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2699 |
4055 | 3 | 43 | 14 | 81.10 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2453 |
746 | 4 | 76 | 28 | 89.29 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 436 |
3336 | 7 | 179 | 26 | 89.12 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 2038 |
5409 | 3 | 55 | 27 | 87.92 | INFORMATICA | Victoria de Durango | 24.02399 | -104.6702 | 3266 |
5033 | 3 | 50 | 28 | 94.45 | GESTION EMPRESARIAL | Victoria de Durango | 24.02399 | -104.6702 | 3034 |
549 | 9 | 218 | 17 | 88.69 | ARQUITECTURA | Victoria de Durango | 24.02399 | -104.6702 | 313 |
2620 | 3 | 47 | 23 | 86.91 | ELECTRONICA | Victoria de Durango | 24.02399 | -104.6702 | 1591 |
186 | 3 | 41 | 28 | 83.89 | SISTEMAS | Victoria de Durango | 24.02399 | -104.6702 | 110 |
1297 | 3 | 52 | 30 | 87.00 | BIOQUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 775 |
3034 | 5 | 85 | 31 | 88.21 | INDUSTRIAL | Victoria de Durango | 24.02399 | -104.6702 | 1858 |
4007 | 7 | 115 | 27 | 82.96 | MECATRONICA | Victoria de Durango | 24.02399 | -104.6702 | 2421 |
5690 | 4 | 79 | 29 | 88.53 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3421 |
4231 | 7 | 172 | 32 | 88.94 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2561 |
3544 | 3 | 48 | 27 | 82.82 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2165 |
2218 | 11 | 235 | 10 | 84.19 | ELECTRICA | Victoria de Durango | 24.02399 | -104.6702 | 1345 |
5545 | 7 | 145 | 29 | 85.77 | ADMINISTRACION | Victoria de Durango | 24.02399 | -104.6702 | 3341 |
4135 | 7 | 172 | 26 | 85.39 | QUIMICA | Victoria de Durango | 24.02399 | -104.6702 | 2500 |
3613 | 3 | 52 | 24 | 85.50 | MECANICA | Victoria de Durango | 24.02399 | -104.6702 | 2207 |
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
2268 | 10 | 216 | 14 | 83.80 | ELECTRICA | Las Brisas | 23.97352 | -104.58 | 262 |
5323 | 1 | NA | 26 | 0.00 | TIC | Las Brisas | 23.97352 | -104.58 | 631 |
2994 | 7 | 172 | 33 | 86.44 | INDUSTRIAL | Las Brisas | 23.97352 | -104.58 | 344 |
4348 | 5 | 114 | 30 | 89.92 | QUIMICA | Las Brisas | 23.97352 | -104.58 | 515 |
3182 | 2 | 27 | 24 | 83.00 | INDUSTRIAL | Las Brisas | 23.97352 | -104.58 | 375 |
2346 | 5 | 99 | 28 | 84.35 | ELECTRICA | Las Brisas | 23.97352 | -104.58 | 271 |
2814 | 7 | 163 | 35 | 84.35 | INDUSTRIAL | Las Brisas | 23.97352 | -104.58 | 326 |
5766 | 1 | NA | 27 | 0.00 | ADMINISTRACION | Las Brisas | 23.97352 | -104.58 | 678 |
2753 | 6 | 158 | 26 | 88.00 | INDUSTRIAL | Las Brisas | 23.97352 | -104.58 | 321 |
4882 | 3 | 32 | 31 | 84.43 | GESTION EMPRESARIAL | Las Brisas | 23.97352 | -104.58 | 577 |
3378 | 10 | 225 | 10 | 82.12 | MECANICA | Las Brisas | 23.97352 | -104.58 | 391 |
1305 | 1 | NA | 23 | 0.00 | BIOQUIMICA | Las Brisas | 23.97352 | -104.58 | 161 |
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
3085 | 5 | NA | 26 | 0.00 | INDUSTRIAL | Las Aves | 23.94883 | -104.5715 | 320 |
244 | 5 | 112 | 25 | 87.54 | SISTEMAS | Las Aves | 23.94883 | -104.5715 | 23 |
1061 | 8 | 168 | 32 | 82.86 | ARQUITECTURA | Las Aves | 23.94883 | -104.5715 | 121 |
39 | 9 | 222 | 13 | 92.21 | SISTEMAS | Las Aves | 23.94883 | -104.5715 | 6 |
4015 | 4 | 62 | 26 | 85.00 | MECATRONICA | Las Aves | 23.94883 | -104.5715 | 439 |
1448 | 7 | 174 | 27 | 87.08 | BIOQUIMICA | Las Aves | 23.94883 | -104.5715 | 165 |
4301 | 6 | 129 | 26 | 84.96 | QUIMICA | Las Aves | 23.94883 | -104.5715 | 462 |
390 | 5 | 107 | 30 | 80.26 | SISTEMAS | Las Aves | 23.94883 | -104.5715 | 41 |
3641 | 5 | 57 | 23 | 78.85 | MECANICA | Las Aves | 23.94883 | -104.5715 | 387 |
3522 | 1 | NA | 26 | 0.00 | MECANICA | Las Aves | 23.94883 | -104.5715 | 366 |
306 | 4 | 87 | 33 | 93.26 | SISTEMAS | Las Aves | 23.94883 | -104.5715 | 34 |
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
4732 | 12 | 225 | 10 | 86.83 | GESTION EMPRESARIAL | Los Fresnos | 24.08339 | -104.6095 | 310 |
4974 | 8 | 205 | 30 | 88.56 | GESTION EMPRESARIAL | Los Fresnos | 24.08339 | -104.6095 | 332 |
5248 | 1 | NA | 27 | 0.00 | GESTION EMPRESARIAL | Los Fresnos | 24.08339 | -104.6095 | 356 |
4853 | 2 | 32 | 27 | 94.57 | GESTION EMPRESARIAL | Los Fresnos | 24.08339 | -104.6095 | 325 |
2243 | 10 | 226 | 9 | 82.25 | ELECTRICA | Los Fresnos | 24.08339 | -104.6095 | 154 |
5503 | 10 | 262 | 10 | 93.87 | ADMINISTRACION | Los Fresnos | 24.08339 | -104.6095 | 388 |
1152 | 11 | 108 | 17 | 78.00 | BIOQUIMICA | Los Fresnos | 24.08339 | -104.6095 | 72 |
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
2935 | 5 | 104 | 34 | 86.39 | INDUSTRIAL | Microondas el Tecolote | 24.05248 | -104.8519 | 168 |
2340 | 1 | NA | 24 | 0.00 | ELECTRICA | Microondas el Tecolote | 24.05248 | -104.8519 | 133 |
1209 | 5 | 104 | 30 | 82.91 | BIOQUIMICA | Microondas el Tecolote | 24.05248 | -104.8519 | 62 |
236 | 1 | NA | 27 | 0.00 | SISTEMAS | Microondas el Tecolote | 24.05248 | -104.8519 | 15 |
5268 | 5 | 101 | 28 | 82.55 | TIC | Microondas el Tecolote | 24.05248 | -104.8519 | 294 |
2138 | 5 | 99 | 33 | 84.43 | CIVIL | Microondas el Tecolote | 24.05248 | -104.8519 | 116 |
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
Alumno | Semestre | Cr. Apr. | Carga | Promedio | Carrera | localidad | latitud | longitud | orig.id |
---|---|---|---|---|---|---|---|---|---|
3554 | 3 | 52 | 31 | 86.33 | MECANICA | Michel [Granja] | 24.00545 | -104.7152 | 175 |
4555 | 6 | 133 | 23 | 83.14 | QUIMICA | Michel [Granja] | 24.00545 | -104.7152 | 223 |
2499 | 11 | 205 | 15 | 79.93 | ELECTRONICA | Michel [Granja] | 24.00545 | -104.7152 | 119 |
2495 | 3 | 51 | 28 | 92.50 | ELECTRICA | Michel [Granja] | 24.00545 | -104.7152 | 118 |
2977 | 8 | 201 | 28 | 83.67 | INDUSTRIAL | Michel [Granja] | 24.00545 | -104.7152 | 143 |
map<-leaflet() %>%
addTiles() %>%
addMarkers(lat=localidades6$Lat_Decimal[1],lng=localidades6$Lon_Decimal[1] ,popup=localidades6$Nom_Loc[1]) %>%
addMarkers(lat=localidades6$Lat_Decimal[2],lng=localidades6$Lon_Decimal[2] ,popup=localidades6$Nom_Loc[2]) %>%
addMarkers(lat=localidades6$Lat_Decimal[3],lng=localidades6$Lon_Decimal[3] ,popup=localidades6$Nom_Loc[3]) %>%
addMarkers(lat=localidades6$Lat_Decimal[4],lng=localidades6$Lon_Decimal[4] ,popup=localidades6$Nom_Loc[4]) %>%
addMarkers (lat=localidades6$Lat_Decimal[5],lng=localidades6$Lon_Decimal[5] ,popup=localidades6$Nom_Loc[5]) %>%
addMarkers (lat=localidades6$Lat_Decimal[6],lng=localidades6$Lon_Decimal[6] ,popup=localidades6$Nom_Loc[6])
# Mostrar el mapa
map
El muestreo como tal se puede derivar en tres tipos:
Muestreo aleatorio simple
El muestreo aleatorio simple es una técnica de muestreo en la que todos los elementos que forman el universo y que por lo tanto están incluídos en el marco muestral tienen idéntica probabilidad de ser seleccionados para la muestra. El proceso de muestreo que emplea esta técnica es equivalente a hacer un sorteo entre los individuos del universo: asignamos a cada persona un boleto, introducimos los boletos en una urna y empezamos a extraer boletos al azar. Todos los individuos que tengan un boleto extraído de la urna formarían la muestra. Obviamente, en la práctica, estos métodos pueden automatizarse mediante el uso de programas informático; Dependiendo de si los individuos del universo pueden ser seleccionados más de una vez en la muestra o no, hablaremos de muestreo aleatorio simple con reposición o sin reposición.
Muestreo aleatorio sistemático
El muestreo sistemático es un tipo de muestreo probabilístico que se basa en enlistar a toda una población, elegir de forma aleatoria al primer individuo para la muestra y luego, a partir de un intervalo definido por el investigador, seleccionar al resto de los individuos que conformarán la muestra.
Muestreo aleatorio estratificado
Una muestra aleatoria estratificada es aquella obtenida separando los elementos de la población en grupos no superpuestos, llamados estratos, y luego seleccionando una muestra aleatoria simplede cada estrato.
Muestreo por conglomerados
El muestreo por conglomerados es una técnica que aprovecha la existencia de grupos o conglomerados en la población que representan correctamente el total de la población en relación a la característica que queremos medir. Dicho de otro modo, estos grupos contienen toda la variabilidad de la población. Si esto sucede, podemos seleccionar únicamente algunos de estos conglomerados para conocer la información de interés del total de la población.
Podemos ver esta técnica desde otro punto de vista. Mientras que en todas las técnicas vistas hasta ahora las unidades de muestreo coinciden con las unidades a estudiar, en el muestreo por conglomerados las unidades de muestreo son grupos de unidades a estudiar , algo que puede resultar muy beneficioso en términos de coste. A cambio, es habitual obtener una menor precisión al usar esta técnica, causada por falta de heterogeneidad dentro de los conglomerados
En este caso implementamos los 4 tipos de muestreo en un ejercicio individual para cada y usamos formulas de R Studio para llegar al resultado
Caso 1
En el primer caso usamos una base de datos con un conjunto de 100 nombres de personas y sus atributo de género y la actividad deportiva o cultura que practican para con el muestreo aleatorio simple determinar los primeros y últimos 10 generar una muestra de nuestro universo.
Caso 2
En el segundo caso se uso una base de datos con datos de alumnos inscritos en una Institución de educación superior en el semestre septiembre 2020 a enero 2021, con los atributos siguientes:
No de control (modificado y no real),
Número Consecutivo de alumno
Semestre que cursa
Créditos aprobados
Carga académica que cursa
Promedio aritmético
Carrera
Y de igual manera se seleccionaron los primeros y últimos 10 generar una muestra de nuestro universo.
Caso 3
por ultimo en el caso 3 se encuestaron a 10 personas de 100 y de la base de datos del caso 1 se obtuvo el muestreo aleatorio simple para realizar el muestreo aleatorio sistemático y dejar un universo donde la muestra sea 10 personas en la muestra de un total de 10 personas en el universo
Con la base de datos del caso 2 se realizo el muestreo sistematizado para obtener una muestra de 100 alumnos;
Con el sistema aleatorio estratificado :
Con el conjunto de datos de personas se trata de encontrar 10 , pero que sea representativa de acuerdo y conforme al género femenino y masculino.
¿Cuál es la frecuencia relativa del género femenino?
¿Cuál es la frecuencia relativa del género masculino?
Ambas frecuencias multiplicar por el tamaño de la muestra para garantizar imparcialidad en la muestra.
Por ultimo con el sistema de aglomerados se cargo un conjunto de datos de las localidades de la ciudad de durango después se añadieron una columna de localidad a la base de datos de alumnos y se determino las localidades con mas alumnos del tecnológico por localidad , luego por carrera y se gráfico en un mapa para para visualizarlo