Objetivo

Determinar y simular muestreos

Descripción

Con un conjunto de datos utilizar mecanismos de programación para determinar muestreos mediante técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.

Sustento teórico

El propósito de la estadística inferencial consiste en determinar y conocer el comportamiento sobre una población a partir de una muestra.

Una muestra es una porción, una proporción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible y sencillo que el estudio de toda la población. [@lind_estadistica_2015].

Por otra parte la importancia del muestreo como lo menciona [@anderson_estadistica_2008] es cuestión de minimizar costo de trabajo, recopilar información de una muestra es sustancialmente menor, que hacerlo de una población completa; especialmente cuando se deben realizar entrevistas personales para recopilar la información.

Finamente, los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadísticas válidas [@lind_estadistica_2015].

Muestreo aleatorio simple

Una muestra aleatoria simple de tamaño \(n\) de una población finita de tamaño \(N\) es una muestra seleccionada de manera que cada posible muestra de tamaño \(n\) tenga la misma probabilidad de ser seleccionada [@anderson_estadistica_2008].

De un conjunto de \(N\) elementos de una población, un muestreo aleatorio simple sería una especie de rifa o tómbola para elegir de de entre los \(N\) total de población una cantidad de \(n\) número de la muestra.

Muestreo aleatorio sistemático

Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población [@lind_estadistica_2015].

Suele emplearse como alternativa al muestreo aleatorio simple, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente [@anderson_estadistica_2008].

El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población [@anderson_estadistica_2008]

Muestreo aleatorio estratificado

Cuando una población se divide en grupos a partir de ciertas características, el muestreo aleatorio estratificado garantiza que cada grupo o estrato se encuentre representado en la muestra [@lind_estadistica_2015].

[@anderson_estadistica_2008] describe el muestreo aleatorio estratificado en donde los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad, tipo de industria, entre otros, está a discreción de la persona que diseña la muestra.

Por otra parte, para asegurar que la muestra sea una representación imparcial de las \(N\) observaciones, se debe determinar la frecuencia relativa y a partir de ahí generar las cantidad de muestra de cada estrato. [@lind_estadistica_2015].

Muestreo por conglomerados

La población se divide en conglomerados a partir de los límites naturales geográficos u otra clase. A continuación, estos se seleccionan al azar y se toma una muestra de forma aleatoria con elementos de cada grupo [@lind_estadistica_2015].

Desarrollo

Cargar librerías

library(dplyr)
library(mosaic)
library(readr)
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos
library(fdth)     # Para tablas de frecuencias
library(leaflet)  # Para hacer mapas

Cargar datos

Cargar datos de nombres de personas

  • Se carga un conjunto de 100 nombres de personas con sus atributo de género y la actividad deportiva o cultura que practican,
  • Cargando un datos llamando a una función que construye los datos.
  • El argumento encoding significa que acepte acentos en los datos.
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Enero%20Junio%202022/funciones/construir%20datos%20y%20funciones.r", encoding = "UTF-8")
kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto dedatos")
Los primeros diez registros de nombres en el conjunto dedatos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
JUAN M NO NO NO SI NO SI NO NO NO NO NO SI
JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI
MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO
GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
JUANA F NO NO NO NO SI NO NO SI NO NO NO NO
ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JESÚS M NO NO SI NO NO SI NO NO SI NO NO NO
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
Las útimos diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
91 ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI
92 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
93 MARÍA TERESA F NO SI NO NO SI NO NO SI NO NO NO NO
94 IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
95 CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO
96 LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
98 AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO
99 MARÍA DE LA LUZ F NO NO NO NO NO NO SI NO NO NO NO NO
100 GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO

Cargar datos de alumnos

  • Se cargan os datos de alumnos inscritos en una Institución de educación superior en en un semestre con los atributos siguientes:

    • No de control (modificado y no real),
    • Número Consecutivo de alumno
    • Semestre que cursa
    • Créditos aprobados
    • Carga académica que cursa
    • Promedio aritmético
    • Carrera
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Enero%20Junio%202022/datos/datos%20alumnos.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera
1 11 198 19 80.21 SISTEMAS
2 11 235 10 84.33 SISTEMAS
3 9 235 10 95.25 SISTEMAS
4 9 226 19 95.00 SISTEMAS
5 10 231 14 82.32 SISTEMAS
6 9 212 23 95.02 SISTEMAS
7 12 221 10 79.06 SISTEMAS
8 9 226 9 92.47 SISTEMAS
9 9 231 4 91.08 SISTEMAS
10 11 222 13 80.42 SISTEMAS
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera
5920 7 169 23 89.14 ADMINISTRACION
5921 5 109 26 87.83 ADMINISTRACION
5922 3 55 29 92.83 ADMINISTRACION
5923 2 23 23 88.60 ADMINISTRACION
5924 2 27 28 92.83 ADMINISTRACION
5925 7 94 13 80.95 ADMINISTRACION
5926 5 103 32 92.68 ADMINISTRACION
5927 4 79 34 86.18 ADMINISTRACION
5928 5 108 32 90.48 ADMINISTRACION
5929 7 169 32 92.33 ADMINISTRACION

Sembrar una semilla

set.seed(2021)

Simular muestreos

Muestreo aleatorio simple

  • Hay que encuestar a diez personas de 100 para hacerles alguna entrevista, ¿a quienes?
  • Con el conjunto de datos seleccionar 10 personas aleatoriamente con la función sample()
N <- nrow(personas)
n <- 10
muestra <- sample(personas$nombres, n)
kable(muestra, caption = "La muestra de personas")
La muestra de personas
x
MARÍA
VERÓNICA
TERESA
MARÍA DE LOS ÁNGELES
PEDRO
GABRIEL
GABRIELA
MARÍA DE LA LUZ
MARÍA DE JESÚS
RICARDO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?
N <- nrow(alumnos)
n <- 100
registros <- sample(N, n) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera
5452 9 247 10 93.44 ADMINISTRACION
2995 7 109 31 84.84 INDUSTRIAL
956 7 170 28 87.56 ARQUITECTURA
5266 7 162 32 83.23 TIC
1147 9 146 23 81.84 BIOQUIMICA
1212 7 165 36 86.37 BIOQUIMICA
4733 8 210 25 89.41 GESTION EMPRESARIAL
2435 7 141 33 85.03 ELECTRICA
3886 3 43 27 86.50 MECATRONICA
360 5 78 31 87.41 SISTEMAS
4634 8 204 31 86.10 QUIMICA
4260 11 209 5 82.79 QUIMICA
2149 5 102 33 84.23 CIVIL
4438 1 NA 25 0.00 QUIMICA
4767 11 213 15 86.91 GESTION EMPRESARIAL
1776 1 NA 27 0.00 CIVIL
3426 5 73 29 80.29 MECANICA
3652 7 123 35 79.41 MECANICA
3926 4 52 4 87.25 MECATRONICA
4741 9 215 20 89.98 GESTION EMPRESARIAL
3145 2 27 24 84.00 INDUSTRIAL
3366 9 142 17 77.32 MECANICA
5394 5 109 27 90.71 INFORMATICA
683 4 68 28 80.38 ARQUITECTURA
2875 1 NA 27 0.00 INDUSTRIAL
754 3 52 28 93.50 ARQUITECTURA
1094 1 NA 26 0.00 ARQUITECTURA
3414 3 48 23 83.00 MECANICA
4806 1 NA 27 0.00 GESTION EMPRESARIAL
2751 3 41 31 87.30 INDUSTRIAL
2127 7 173 30 89.42 CIVIL
4770 6 72 31 83.06 GESTION EMPRESARIAL
2045 3 61 33 82.92 CIVIL
4091 4 80 24 89.11 MECATRONICA
5746 5 113 27 90.75 ADMINISTRACION
400 8 109 29 80.54 SISTEMAS
881 4 80 30 90.72 ARQUITECTURA
1624 11 221 14 79.46 CIVIL
1553 4 79 26 87.61 BIOQUIMICA
4838 8 210 25 92.34 GESTION EMPRESARIAL
1381 1 NA 23 0.00 BIOQUIMICA
5086 4 82 30 91.44 GESTION EMPRESARIAL
3528 3 52 28 86.17 MECANICA
1491 6 121 30 83.35 BIOQUIMICA
3139 7 171 36 86.08 INDUSTRIAL
3714 10 225 10 84.74 MECATRONICA
2833 6 115 27 81.19 INDUSTRIAL
4090 8 154 20 83.09 MECATRONICA
4777 5 107 33 87.87 GESTION EMPRESARIAL
5241 5 112 31 89.67 GESTION EMPRESARIAL
2559 3 52 25 87.33 ELECTRONICA
4465 9 214 21 89.05 QUIMICA
3037 3 50 30 87.17 INDUSTRIAL
2203 5 58 32 78.50 CIVIL
5624 3 55 29 96.67 ADMINISTRACION
2443 3 46 28 84.09 ELECTRICA
4718 10 225 10 85.17 GESTION EMPRESARIAL
1487 1 NA 23 0.00 BIOQUIMICA
5842 3 55 29 94.67 ADMINISTRACION
3657 3 52 27 87.08 MECANICA
3603 5 74 24 78.18 MECANICA
1552 1 NA 23 0.00 BIOQUIMICA
1506 5 74 31 81.94 BIOQUIMICA
362 6 137 28 88.47 SISTEMAS
4606 5 114 30 89.63 QUIMICA
3830 7 107 36 80.87 MECATRONICA
2348 5 78 24 82.26 ELECTRICA
790 1 NA 26 0.00 ARQUITECTURA
550 10 160 20 84.97 ARQUITECTURA
1144 9 264 10 86.56 BIOQUIMICA
3853 5 105 24 89.57 MECATRONICA
2849 5 108 34 88.88 INDUSTRIAL
430 2 NA 27 0.00 SISTEMAS
2709 9 197 13 83.49 INDUSTRIAL
4979 3 54 28 96.83 GESTION EMPRESARIAL
2649 3 52 25 90.75 ELECTRONICA
2143 7 155 17 82.18 CIVIL
3757 1 NA 25 0.00 MECATRONICA
3977 1 NA 25 0.00 MECATRONICA
535 9 198 29 88.31 ARQUITECTURA
4331 5 104 29 82.27 QUIMICA
3030 2 27 24 83.83 INDUSTRIAL
420 5 65 19 83.93 SISTEMAS
606 2 26 26 88.83 ARQUITECTURA
3374 11 168 15 77.35 MECANICA
1799 5 109 34 83.74 CIVIL
4381 5 104 30 84.23 QUIMICA
1683 2 27 30 89.00 CIVIL
5745 8 192 34 90.17 ADMINISTRACION
2468 8 124 23 84.00 ELECTRICA
5833 2 27 33 96.00 ADMINISTRACION
3187 1 NA 27 0.00 INDUSTRIAL
4721 9 224 11 90.34 GESTION EMPRESARIAL
3401 9 178 8 80.74 MECANICA
1674 3 48 29 80.70 CIVIL
3704 9 225 10 85.19 MECATRONICA
1345 3 52 30 94.50 BIOQUIMICA
2171 2 27 30 93.83 CIVIL
5317 5 101 29 91.36 TIC
4283 3 56 30 91.33 QUIMICA

3.2. Muestreo aleatorio sistemático

  • Con el conjunto de datos personas, iniciar en un valor aletorio e identificar los siguientes de 10 en 10 hasta tener diez personas.
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
La muestra sistematizada de personas
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
2 JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
12 PEDRO M NO NO NO NO NO NO NO NO NO NO NO NO
22 JORGE M SI NO NO NO NO NO NO NO NO NO NO NO
32 JOSÉ ANTONIO M NO NO SI NO NO NO NO SI NO NO NO NO
42 ROSA F SI NO NO NO NO SI NO NO NO NO NO NO
52 ARMANDO M NO NO SI NO NO NO SI NO NO NO NO NO
62 GLORIA F NO NO NO NO NO NO NO NO NO NO NO NO
72 ÓSCAR M SI NO NO NO NO NO NO NO NO NO NO NO
82 MARÍA DEL ROSARIO F NO NO SI NO NO SI NO NO NO NO NO NO
92 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?, bajo el muetreo sistematizado
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera
8 9 226 9 92.47 SISTEMAS
67 9 231 4 94.16 SISTEMAS
126 1 NA 27 0.00 SISTEMAS
185 4 78 29 84.24 SISTEMAS
244 5 112 25 87.54 SISTEMAS
303 1 NA 27 0.00 SISTEMAS
362 6 137 28 88.47 SISTEMAS
421 5 33 9 81.00 SISTEMAS
480 12 206 17 83.58 ARQUITECTURA
539 10 179 32 83.97 ARQUITECTURA
598 2 20 20 86.60 ARQUITECTURA
657 8 211 20 91.28 ARQUITECTURA
716 5 110 32 92.75 ARQUITECTURA
775 5 106 32 89.17 ARQUITECTURA
834 1 NA 26 0.00 ARQUITECTURA
893 1 NA 26 0.00 ARQUITECTURA
952 3 48 22 88.73 ARQUITECTURA
1011 7 186 25 90.26 ARQUITECTURA
1070 8 202 25 82.59 ARQUITECTURA
1129 9 238 20 86.78 BIOQUIMICA
1188 9 105 33 77.05 BIOQUIMICA
1247 5 110 30 84.21 BIOQUIMICA
1306 7 130 30 80.68 BIOQUIMICA
1365 1 NA 23 0.00 BIOQUIMICA
1424 1 NA 23 0.00 BIOQUIMICA
1483 3 52 27 91.33 BIOQUIMICA
1542 5 110 30 89.00 BIOQUIMICA
1601 10 226 9 79.77 CIVIL
1660 15 215 30 76.49 CIVIL
1719 6 143 30 94.17 CIVIL
1778 5 97 34 85.10 CIVIL
1837 6 112 35 80.13 CIVIL
1896 6 131 29 87.00 CIVIL
1955 4 69 28 83.27 CIVIL
2014 6 131 31 81.89 CIVIL
2073 5 96 17 79.35 CIVIL
2132 3 57 29 89.58 CIVIL
2191 2 27 30 88.50 CIVIL
2250 9 210 20 84.15 ELECTRICA
2309 5 58 20 80.79 ELECTRICA
2368 1 NA 24 0.00 ELECTRICA
2427 1 NA 24 0.00 ELECTRICA
2486 6 95 23 84.45 ELECTRICA
2545 1 NA 25 0.00 ELECTRONICA
2604 1 NA 25 0.00 ELECTRONICA
2663 11 197 26 80.34 INDUSTRIAL
2722 10 235 10 83.72 INDUSTRIAL
2781 1 NA 27 0.00 INDUSTRIAL
2840 1 NA 27 0.00 INDUSTRIAL
2899 1 NA 27 0.00 INDUSTRIAL
2958 1 NA 27 0.00 INDUSTRIAL
3017 3 51 34 94.00 INDUSTRIAL
3076 7 152 23 84.06 INDUSTRIAL
3135 6 159 27 83.64 INDUSTRIAL
3194 7 67 10 81.13 INDUSTRIAL
3253 7 149 30 83.68 INDUSTRIAL
3312 1 NA 27 0.00 INDUSTRIAL
3371 10 211 24 80.07 MECANICA
3430 5 50 24 79.50 MECANICA
3489 6 127 29 82.89 MECANICA
3548 3 49 27 78.36 MECANICA
3607 8 186 28 83.66 MECANICA
3666 12 190 5 78.35 MECATRONICA
3725 7 142 33 82.23 MECATRONICA
3784 5 56 21 81.31 MECATRONICA
3843 3 53 27 87.33 MECATRONICA
3902 4 76 29 86.88 MECATRONICA
3961 3 53 27 86.83 MECATRONICA
4020 2 25 18 83.50 MECATRONICA
4079 1 NA 25 0.00 MECATRONICA
4138 3 56 30 89.42 QUIMICA
4197 8 157 10 83.61 QUIMICA
4256 6 123 28 81.38 QUIMICA
4315 9 215 15 90.00 QUIMICA
4374 7 172 32 92.67 QUIMICA
4433 6 123 28 86.38 QUIMICA
4492 1 NA 25 0.00 QUIMICA
4551 2 25 31 91.33 QUIMICA
4610 7 167 26 91.77 QUIMICA
4669 9 209 16 91.07 GESTION EMPRESARIAL
4728 10 194 31 82.83 GESTION EMPRESARIAL
4787 3 54 28 87.67 GESTION EMPRESARIAL
4846 3 49 33 84.36 GESTION EMPRESARIAL
4905 1 NA 27 0.00 GESTION EMPRESARIAL
4964 7 170 29 86.69 GESTION EMPRESARIAL
5023 1 NA 27 0.00 GESTION EMPRESARIAL
5082 4 32 23 89.43 GESTION EMPRESARIAL
5141 3 54 28 91.92 GESTION EMPRESARIAL
5200 1 NA 27 0.00 GESTION EMPRESARIAL
5259 11 176 10 78.82 TIC
5318 1 NA 26 0.00 TIC
5377 3 55 27 91.83 INFORMATICA
5436 9 190 27 89.95 ADMINISTRACION
5495 10 245 17 88.39 ADMINISTRACION
5554 7 146 27 88.42 ADMINISTRACION
5613 6 131 24 86.71 ADMINISTRACION
5672 1 NA 27 0.00 ADMINISTRACION
5731 7 128 32 82.75 ADMINISTRACION
5790 5 108 28 89.00 ADMINISTRACION
5849 7 151 32 86.25 ADMINISTRACION
5908 7 170 31 91.58 ADMINISTRACION

Muestreo aleatorio estratificado

  • Con el conjunto de datos de personas se trata de encontrar 10 , pero que sea representativa de acuerdo y conforme al género femenino y masculino.

  • ¿Cuál es la frecuencia relativa del género femenino?

  • ¿Cuál es la frecuencia relativa del género masculino?

  • Ambas frecuencias multiplicar por el tamaño de la muestra para garantizar imparcialidad en la muestra.

    N <- nrow(personas)
    n <- 10
    femeninos  <- filter(personas, generos=='F')
    masculinos <- filter(personas, generos=='M')
    frfem <- nrow(femeninos) / N
    frmas <- nrow(masculinos) / N
    frfem 
    ## [1] 0.43
    frmas
    ## [1] 0.57
    muestraFem <- sample(femeninos, n * frfem)
    kable(muestraFem, caption = "La muestra de personas Femenino")
    La muestra de personas Femenino
    nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
    29 MARÍA DE GUADALUPE F NO NO NO NO SI NO NO SI NO SI NO NO 29
    7 JAVIER F NO NO NO NO NO SI NO NO NO NO SI NO 7
    11 ENRIQUE F NO NO NO NO NO NO NO NO SI NO SI NO 11
    3 MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO 3
    muestraMas <- sample(masculinos, n * frmas)
    kable(muestraMas, caption = "La muestra de personas Masculino")
    La muestra de personas Masculino
    nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
    46 RUBEN M NO SI NO NO NO NO NO NO NO NO SI NO 46
    20 RAFAEL M NO NO NO NO NO NO NO SI NO NO NO NO 20
    23 DAVID M NO NO NO NO NO NO NO NO NO NO NO NO 23
    45 PABLO M NO NO SI NO NO NO SI SI NO NO NO NO 45
    1 JUAN M NO NO NO SI NO SI NO NO NO NO NO SI 1
N <- nrow(personas)
n <- 10
femeninos  <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem 
## [1] 0.43
frmas 
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
La muestra de personas Femenino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
15 FRANCISCA F NO NO SI NO NO NO SI NO NO NO NO NO 15
32 MARÍA ISABEL F NO SI NO NO NO NO NO NO NO NO NO SI 32
23 MARÍA DE LOS ÁNGELES F NO NO NO SI NO NO NO NO NO NO SI NO 23
27 GABRIELA F NO NO NO NO NO NO NO NO NO NO NO NO 27
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
La muestra de personas Masculino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
45 PABLO M NO NO SI NO NO NO SI SI NO NO NO NO 45
1 JUAN M NO NO NO SI NO SI NO NO NO NO NO SI 1
51 JOSÉ GUADALUPE M NO NO NO NO NO SI NO NO NO NO NO SI 51
4 FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO 4
56 AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO 56
  • Simular muestreo estratificado por carreas de alumnos determinando las frecuencias relativas por medio de la función fdt_cat()
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Tabla de frecuencia de alumnos
Category f rf rf… cf cf… muestra
INDUSTRIAL 707 0.1192444 11.924439 707 11.92444 12
ARQUITECTURA 675 0.1138472 11.384719 1382 23.30916 11
CIVIL 648 0.1092933 10.929330 2030 34.23849 11
GESTION EMPRESARIAL 585 0.0986676 9.866757 2615 44.10525 10
QUIMICA 568 0.0958003 9.580030 3183 53.68528 10
ADMINISTRACION 497 0.0838253 8.382527 3680 62.06780 8
SISTEMAS 452 0.0762355 7.623545 4132 69.69135 8
BIOQUIMICA 441 0.0743802 7.438016 4573 77.12936 7
MECATRONICA 432 0.0728622 7.286220 5005 84.41558 7
MECANICA 301 0.0507674 5.076741 5306 89.49233 5
ELECTRICA 280 0.0472255 4.722550 5586 94.21488 5
ELECTRONICA 161 0.0271547 2.715466 5747 96.93034 3
INFORMATICA 101 0.0170349 1.703491 5848 98.63383 2
TIC 81 0.0136617 1.366166 5929 100.00000 1
  • ¿Cuáles alumnos?
  • Sólo simular carreras de SISTEMAS Y CIVIL
N <- nrow(alumnos)
n <- 100
sistemas  <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas")
La muestra de alumnos de Sistemas
Alumno Semestre Cr. Apr. Carga Promedio Carrera orig.id
13 9 226 19 96.27 SISTEMAS 13
198 1 NA 27 0.00 SISTEMAS 198
94 7 83 33 85.39 SISTEMAS 94
85 1 NA 27 0.00 SISTEMAS 85
302 1 NA 27 0.00 SISTEMAS 302
39 9 222 13 92.21 SISTEMAS 39
384 3 50 33 86.91 SISTEMAS 384
141 5 84 35 81.50 SISTEMAS 141
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
La muestra de alumnos de Civil
Alumno Semestre Cr. Apr. Carga Promedio Carrera orig.id
1733 4 87 34 89.05 CIVIL 165
2192 2 22 25 89.60 CIVIL 624
2026 6 130 35 82.46 CIVIL 458
2069 1 NA 27 0.00 CIVIL 501
1782 6 111 34 83.13 CIVIL 214
1960 5 109 23 83.70 CIVIL 392
1746 4 71 26 80.87 CIVIL 178
2151 6 143 30 93.10 CIVIL 583
1912 1 NA 27 0.00 CIVIL 344
2133 7 183 29 89.66 CIVIL 565
1781 2 27 30 91.83 CIVIL 213
N <- nrow(alumnos)
n <- 100
sistemas  <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil 
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas")
La muestra de alumnos de Sistemas
Alumno Semestre Cr. Apr. Carga Promedio Carrera orig.id
43 13 227 8 80.53 SISTEMAS 43
438 5 83 30 85.06 SISTEMAS 438
421 5 33 9 81.00 SISTEMAS 421
125 1 NA 27 0.00 SISTEMAS 125
77 1 NA 27 0.00 SISTEMAS 77
374 7 160 35 85.71 SISTEMAS 374
69 9 222 13 86.54 SISTEMAS 69
48 9 212 4 91.28 SISTEMAS 48
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
La muestra de alumnos de Civil
Alumno Semestre Cr. Apr. Carga Promedio Carrera orig.id
1996 5 89 23 82.16 CIVIL 428
1771 2 22 29 89.20 CIVIL 203
1795 1 NA 27 0.00 CIVIL 227
1779 1 NA 27 0.00 CIVIL 211
1753 5 112 29 95.29 CIVIL 185
1893 8 188 28 86.08 CIVIL 325
1843 3 47 22 83.50 CIVIL 275
1689 8 171 36 78.00 CIVIL 121
2038 2 27 30 95.50 CIVIL 470
1676 2 22 20 89.20 CIVIL 108
1846 4 76 31 84.94 CIVIL 278

Muestreo por conglomerados

  • En un proceso de simulación, al conjunto de datos alumnos agregar tres columnas: la localidad, latitud y longitud
  • Primero cargar datos de localidades de Durango
N <- nrow(alumnos)
n <- 100
locdurangomx <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Enero%20Junio%202022/datos/locdurangomx.csv", encoding = "UTF-8")

Segundo por medio de función sample() generar cinco registros aleatorios de localidades y agregar un sexto registro de Victoria de Durango.

Las localidades será un domicilio para simular el lugar en donde geográficamente viven los alumnos.

set.seed(2021)
localidades6 <- locdurangomx[sample(nrow(locdurangomx), 5), ]
localidades6 <- rbind(localidades6, locdurangomx[1,])
localidades6
##       X      Mapa Cve_Ent Nom_Ent Nom_Abr Cve_Mun Nom_Mun Cve_Loc
## 903 903 100051616      10 Durango    Dgo.       5 Durango    1616
## 166 166 100050349      10 Durango    Dgo.       5 Durango     349
## 442 442 100050904      10 Durango    Dgo.       5 Durango     904
## 743 743 100051371      10 Durango    Dgo.       5 Durango    1371
## 908 908 100051622      10 Durango    Dgo.       5 Durango    1622
## 1     1 100050001      10 Durango    Dgo.       5 Durango       1
##                         Nom_Loc Ámbito        Latitud        Longitud
## 903           Liberación Social      R 24°06´53.990"N 105°19´34.000"W
## 166          Revueltas [Rancho]      R 23°58´00.989"N 104°38´36.576"W
## 442              Rancho el Doce      R 24°01´11.048"N 104°33´54.670"W
## 743              Las Avestruces      R 24°04´40.829"N 104°33´20.779"W
## 908 Mauricio Alvarado Rodríguez      R 24°12´02.741"N 104°33´57.265"W
## 1           Victoria de Durango      U 24°01´26.357"N 104°40´12.700"W
##     Lat_Decimal Lon_Decimal Altitud Cve_Carta Pob_Total Pob_Masculina
## 903    24.11500   -105.3261    2506    G13C89         0             0
## 166    23.96694   -104.6435    1880    F13B12         7             *
## 442    24.01974   -104.5652    1867    G13D82         0             0
## 743    24.07801   -104.5558    1861    G13D82         0             0
## 908    24.20076   -104.5659    1868    G13D82         0             0
## 1      24.02399   -104.6702    1890    G13D81    518709        250073
##     Pob_Femenina Total.De.Viviendas.Habitadas
## 903            0                            0
## 166            *                            2
## 442            0                            0
## 743            0                            0
## 908            0                            0
## 1         268636                       133191
  • Tercero agregar las columnas: nombre de localidad, latitud y longitud al conjunto de datos alumnos con una probabilidad de que sean de Victoria de Durango del 60%.

  • Mostrar los primeros diez y últimos diez alumnos verificando las tres nuevas columnas.

    registros <- locdurangomx[sample(localidades6$X, N, replace = TRUE, prob = c(.10, 0.12, 0.05, 0.07, 0.06, 0.60)),c("Nom_Loc", "Lat_Decimal", "Lon_Decimal")]
    alumnos$localidad <- registros$Nom_Loc
    alumnos$latitud <- registros$Lat_Decimal
    alumnos$longitud <- registros$Lon_Decimal
    kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
    Los primeros diez registros de alumnos
    Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
    1 11 198 19 80.21 SISTEMAS Revueltas [Rancho] 23.96694 -104.6435
    2 11 235 10 84.33 SISTEMAS Victoria de Durango 24.02399 -104.6702
    3 9 235 10 95.25 SISTEMAS Liberación Social 24.11500 -105.3261
    4 9 226 19 95.00 SISTEMAS Rancho el Doce 24.01974 -104.5652
    5 10 231 14 82.32 SISTEMAS Victoria de Durango 24.02399 -104.6702
    6 9 212 23 95.02 SISTEMAS Las Avestruces 24.07801 -104.5558
    7 12 221 10 79.06 SISTEMAS Revueltas [Rancho] 23.96694 -104.6435
    8 9 226 9 92.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
    9 9 231 4 91.08 SISTEMAS Las Avestruces 24.07801 -104.5558
    10 11 222 13 80.42 SISTEMAS Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
5920 7 169 23 89.14 ADMINISTRACION Revueltas [Rancho] 23.96694 -104.6435
5921 5 109 26 87.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5922 3 55 29 92.83 ADMINISTRACION Revueltas [Rancho] 23.96694 -104.6435
5923 2 23 23 88.60 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5924 2 27 28 92.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5925 7 94 13 80.95 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5926 5 103 32 92.68 ADMINISTRACION Mauricio Alvarado Rodríguez 24.20076 -104.5659
5927 4 79 34 86.18 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5928 5 108 32 90.48 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5929 7 169 32 92.33 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
registros <- locdurangomx[sample(localidades6$X, N, replace = TRUE, prob = c(.10, 0.12, 0.05, 0.07, 0.06, 0.60)),c("Nom_Loc", "Lat_Decimal", "Lon_Decimal")]
alumnos$localidad <- registros$Nom_Loc
alumnos$latitud <- registros$Lat_Decimal
alumnos$longitud <- registros$Lon_Decimal
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
1 11 198 19 80.21 SISTEMAS Victoria de Durango 24.02399 -104.6702
2 11 235 10 84.33 SISTEMAS Victoria de Durango 24.02399 -104.6702
3 9 235 10 95.25 SISTEMAS Victoria de Durango 24.02399 -104.6702
4 9 226 19 95.00 SISTEMAS Victoria de Durango 24.02399 -104.6702
5 10 231 14 82.32 SISTEMAS Victoria de Durango 24.02399 -104.6702
6 9 212 23 95.02 SISTEMAS Victoria de Durango 24.02399 -104.6702
7 12 221 10 79.06 SISTEMAS Liberación Social 24.11500 -105.3261
8 9 226 9 92.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
9 9 231 4 91.08 SISTEMAS Mauricio Alvarado Rodríguez 24.20076 -104.5659
10 11 222 13 80.42 SISTEMAS Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
5920 7 169 23 89.14 ADMINISTRACION Mauricio Alvarado Rodríguez 24.20076 -104.5659
5921 5 109 26 87.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5922 3 55 29 92.83 ADMINISTRACION Revueltas [Rancho] 23.96694 -104.6435
5923 2 23 23 88.60 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5924 2 27 28 92.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5925 7 94 13 80.95 ADMINISTRACION Las Avestruces 24.07801 -104.5558
5926 5 103 32 92.68 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5927 4 79 34 86.18 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5928 5 108 32 90.48 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5929 7 169 32 92.33 ADMINISTRACION Revueltas [Rancho] 23.96694 -104.6435
  • Cuarto encontrar frecuencias por localidad

    N <- nrow(alumnos)
    n <- 100
    tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
    tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
    kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
    Tabla de frecuencia de alumnos por localidad
    Category f rf rf… cf cf… muestra
    Victoria de Durango 3458 0.5832349 58.323495 3458 58.32349 58
    Revueltas [Rancho] 765 0.1290268 12.902682 4223 71.22618 13
    Liberación Social 615 0.1037274 10.372744 4838 81.59892 10
    Las Avestruces 397 0.0669590 6.695901 5235 88.29482 7
    Mauricio Alvarado Rodríguez 375 0.0632484 6.324844 5610 94.61967 6
    Rancho el Doce 319 0.0538033 5.380334 5929 100.00000 5
N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Tabla de frecuencia de alumnos por localidad
Category f rf rf… cf cf… muestra
Victoria de Durango 3458 0.5832349 58.323495 3458 58.32349 58
Revueltas [Rancho] 765 0.1290268 12.902682 4223 71.22618 13
Liberación Social 615 0.1037274 10.372744 4838 81.59892 10
Las Avestruces 397 0.0669590 6.695901 5235 88.29482 7
Mauricio Alvarado Rodríguez 375 0.0632484 6.324844 5610 94.61967 6
Rancho el Doce 319 0.0538033 5.380334 5929 100.00000 5
  • Quinto Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.

  • ¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad

  • Simular por las seis localidades

N <- nrow(alumnos)
n <- 100
# Determinar cada conglomerado
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])
# Determinar frecuencias de cada conglomerado similiar a la tabla tabla_frec
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N
# Crear muestras
muestraloc1 <- sample(loc1, round(n * frloc1, 0))
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
La muestra de alumnos de Localidad Victoria de Durango
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
5454 9 225 11 93.38 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3184
417 8 123 32 81.07 SISTEMAS Victoria de Durango 24.02399 -104.6702 251
4112 6 71 19 80.80 QUIMICA Victoria de Durango 24.02399 -104.6702 2390
3557 5 103 34 82.00 MECANICA Victoria de Durango 24.02399 -104.6702 2081
4553 7 133 19 84.82 QUIMICA Victoria de Durango 24.02399 -104.6702 2650
2829 2 17 24 83.25 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1627
4226 5 114 30 87.21 QUIMICA Victoria de Durango 24.02399 -104.6702 2457
4586 5 35 15 81.25 QUIMICA Victoria de Durango 24.02399 -104.6702 2669
5245 4 87 35 87.16 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 3057
1958 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702 1119
1150 9 211 24 87.34 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 667
3491 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2035
3610 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2110
2582 3 38 23 88.11 ELECTRONICA Victoria de Durango 24.02399 -104.6702 1493
905 3 52 28 96.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 513
5915 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3450
4107 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2386
4216 4 81 28 84.65 QUIMICA Victoria de Durango 24.02399 -104.6702 2450
1468 4 64 25 78.40 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 848
2766 5 96 29 83.27 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1590
45 13 230 5 85.04 SISTEMAS Victoria de Durango 24.02399 -104.6702 29
210 4 65 28 81.29 SISTEMAS Victoria de Durango 24.02399 -104.6702 127
5490 10 262 10 89.60 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3203
5050 2 22 27 90.00 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2943
5749 7 168 34 87.89 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3355
4527 10 210 20 81.02 QUIMICA Victoria de Durango 24.02399 -104.6702 2637
1488 7 154 29 80.58 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 863
1160 9 184 32 80.77 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 669
5889 5 113 31 94.54 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3431
2883 4 76 36 90.65 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1669
2171 2 27 30 93.83 CIVIL Victoria de Durango 24.02399 -104.6702 1256
2227 11 235 10 83.32 ELECTRICA Victoria de Durango 24.02399 -104.6702 1287
2940 5 111 35 86.08 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1702
2483 8 138 26 83.81 ELECTRICA Victoria de Durango 24.02399 -104.6702 1446
844 4 80 30 89.72 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 482
2357 5 94 31 84.32 ELECTRICA Victoria de Durango 24.02399 -104.6702 1361
5354 3 51 27 86.64 INFORMATICA Victoria de Durango 24.02399 -104.6702 3124
872 7 166 28 86.17 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 491
1063 8 152 26 81.79 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 604
5516 5 118 31 93.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3218
179 8 155 29 82.15 SISTEMAS Victoria de Durango 24.02399 -104.6702 109
183 4 74 35 82.63 SISTEMAS Victoria de Durango 24.02399 -104.6702 112
2797 8 198 31 85.67 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1605
1212 7 165 36 86.37 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 698
3337 2 22 29 83.20 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1938
5650 3 50 30 85.55 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3297
4448 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2591
4844 6 143 28 93.30 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2816
1274 3 57 27 85.08 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 739
290 5 111 28 90.17 SISTEMAS Victoria de Durango 24.02399 -104.6702 174
3870 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702 2246
5567 8 146 31 88.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3253
1637 9 216 19 83.33 CIVIL Victoria de Durango 24.02399 -104.6702 945
3380 11 230 5 82.56 MECANICA Victoria de Durango 24.02399 -104.6702 1967
2975 4 53 32 79.25 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1724
3299 2 27 24 92.83 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1915
2433 5 89 28 86.57 ELECTRICA Victoria de Durango 24.02399 -104.6702 1411
5131 3 54 28 90.75 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2994
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
La muestra de alumnos de Localidad Revueltas [Rancho]
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2715 9 235 10 88.89 INDUSTRIAL Revueltas [Rancho] 23.96694 -104.6435 352
4255 2 25 31 94.00 QUIMICA Revueltas [Rancho] 23.96694 -104.6435 569
1478 6 111 31 86.13 BIOQUIMICA Revueltas [Rancho] 23.96694 -104.6435 190
3729 3 44 27 78.20 MECATRONICA Revueltas [Rancho] 23.96694 -104.6435 479
2634 5 95 25 89.10 ELECTRONICA Revueltas [Rancho] 23.96694 -104.6435 339
4143 3 35 26 84.50 QUIMICA Revueltas [Rancho] 23.96694 -104.6435 551
3754 8 181 16 87.58 MECATRONICA Revueltas [Rancho] 23.96694 -104.6435 486
3981 1 NA 25 0.00 MECATRONICA Revueltas [Rancho] 23.96694 -104.6435 529
3890 3 39 36 80.11 MECATRONICA Revueltas [Rancho] 23.96694 -104.6435 515
5871 3 50 34 89.55 ADMINISTRACION Revueltas [Rancho] 23.96694 -104.6435 753
2759 7 171 29 86.82 INDUSTRIAL Revueltas [Rancho] 23.96694 -104.6435 359
1424 1 NA 23 0.00 BIOQUIMICA Revueltas [Rancho] 23.96694 -104.6435 182
5208 5 116 31 92.40 GESTION EMPRESARIAL Revueltas [Rancho] 23.96694 -104.6435 672
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
La muestra de alumnos de Localidad Liberación Social
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
3462 7 83 30 78.05 MECANICA Liberación Social 24.115 -105.3261 352
4288 13 235 10 78.98 QUIMICA Liberación Social 24.115 -105.3261 439
4234 7 142 31 94.77 QUIMICA Liberación Social 24.115 -105.3261 435
884 2 22 22 82.40 ARQUITECTURA Liberación Social 24.115 -105.3261 103
63 9 235 10 91.80 SISTEMAS Liberación Social 24.115 -105.3261 10
370 1 NA 27 0.00 SISTEMAS Liberación Social 24.115 -105.3261 46
4292 3 56 30 89.25 QUIMICA Liberación Social 24.115 -105.3261 440
2170 2 27 27 81.33 CIVIL Liberación Social 24.115 -105.3261 214
5067 6 144 34 88.48 GESTION EMPRESARIAL Liberación Social 24.115 -105.3261 516
2073 5 96 17 79.35 CIVIL Liberación Social 24.115 -105.3261 208
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
La muestra de alumnos de Localidad Las Avestruces
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2655 5 75 23 86.18 ELECTRONICA Las Avestruces 24.07801 -104.5558 183
1400 4 77 23 88.12 BIOQUIMICA Las Avestruces 24.07801 -104.5558 99
4223 8 209 26 86.14 QUIMICA Las Avestruces 24.07801 -104.5558 271
4708 10 185 30 82.69 GESTION EMPRESARIAL Las Avestruces 24.07801 -104.5558 309
2985 3 51 29 90.83 INDUSTRIAL Las Avestruces 24.07801 -104.5558 199
2421 1 NA 24 0.00 ELECTRICA Las Avestruces 24.07801 -104.5558 166
3747 3 39 32 79.33 MECATRONICA Las Avestruces 24.07801 -104.5558 247
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
La muestra de alumnos de Localidad Mauricio Alvarado Rodríguez
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2188 1 NA 27 0.00 CIVIL Mauricio Alvarado Rodríguez 24.20076 -104.5659 139
5229 5 113 30 93.67 GESTION EMPRESARIAL Mauricio Alvarado Rodríguez 24.20076 -104.5659 346
1575 10 225 10 80.04 CIVIL Mauricio Alvarado Rodríguez 24.20076 -104.5659 97
903 4 76 34 83.65 ARQUITECTURA Mauricio Alvarado Rodríguez 24.20076 -104.5659 60
4148 5 108 29 84.91 QUIMICA Mauricio Alvarado Rodríguez 24.20076 -104.5659 269
1307 7 105 28 79.30 BIOQUIMICA Mauricio Alvarado Rodríguez 24.20076 -104.5659 79
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
La muestra de alumnos de Localidad Rancho el Doce
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
902 3 48 24 87.36 ARQUITECTURA Rancho el Doce 24.01974 -104.5652 49
15 10 235 10 85.14 SISTEMAS Rancho el Doce 24.01974 -104.5652 1
677 6 139 27 88.03 ARQUITECTURA Rancho el Doce 24.01974 -104.5652 37
1211 1 NA 23 0.00 BIOQUIMICA Rancho el Doce 24.01974 -104.5652 70
2536 3 47 25 87.82 ELECTRONICA Rancho el Doce 24.01974 -104.5652 159
Visualizar con mapas
  • Cargar la librerías para mapas previamente
  • Usando los valores de latitud y longitud
map<-leaflet() %>%
  addTiles() %>%
  addMarkers(lat=localidades6$Lat_Decimal[1],lng=localidades6$Lon_Decimal[1] ,popup = localidades6$Nom_Loc[1]) %>%
   addMarkers(lat=localidades6$Lat_Decimal[2],lng=localidades6$Lon_Decimal[2] ,popup=localidades6$Nom_Loc[2]) %>%
   addMarkers(lat=localidades6$Lat_Decimal[3],lng=localidades6$Lon_Decimal[3] ,popup=localidades6$Nom_Loc[4]) %>%
   addMarkers  (lat=localidades6$Lat_Decimal[5],lng=localidades6$Lon_Decimal[5] ,popup=localidades6$Nom_Loc[5]) %>%
   addMarkers  (lat=localidades6$Lat_Decimal[6],lng=localidades6$Lon_Decimal[6] ,popup=localidades6$Nom_Loc[6])
# Mostrar el mapa 
map

Interpretación de tipos de muestreo

En este caso nuevo, podemos determinar distintas cosas de las cuales hablare mas delante, como lo decía podemos determinar distintas cosas a traves de muestras.

En si una muestra es una parte o cantidad pequeña de una cosa que se considera representativa del total y que se toma o se separa de ella con ciertos métodos para someterla a estudio, análisis o experimentación.

Ahora si metiendonos al caso, podemos observar un conjunto de datos se utilizaron mecanismos de programación para determinar distintas muestras por medio de técnicas de aleatorio simple, aleatorio sistemático, aleatorio estratificado y por conglomerados.

Así por muestras que decidimos tomas o mas bien hicimos aleatoriamente, obtuvimos distintos resultados Dirigiéndolos a estudiantes de sistemas y civil; también de personas.

Esto a sido todo por este caso.

Referencias Bibliográficas