Los Objetivos De La Práctica

* El Objetivo General De La Práctica

A continuación se presenta el objetivo general de la práctica:

  • Desarrollar, Determinar y Similas Los Diferentes Tipos De Muestreos

* Los Objetivos Específicos De La Práctica

A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:

  • Con Un Conjunto De Datos Utilizar Mecanismos De Programación Para Determinar Muestreos Mediante Técnicas De Aleatorio Simple.

  • Con Un Conjunto De Datos Utilizar Mecanismos De Programación Para Determinar Muestreos Mediante Técnicas De Aleatorio Sistemático

  • Con Un Conjunto De Datos Utilizar Mecanismos De Programación Para Determinar Muestreos Mediante Técnicas De Aleatorio Estratificado

  • Con Un Conjunto De Datos Utilizar Mecanismos De Programación Para Determinar Muestreos Mediante Técnicas Por Conclomerado

  • Realizar la Interpretación De La Práctica Correspondiente.

* Investigaciones Pertinentes

* La Probabilidad

La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.

Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.

Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.

* Las Variables Estadísticas

La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):

Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.

Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.

  • También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido en dólares. Las variables son del tipo cuantitativo (se expresan con un número)

Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.

  • Así, otra variable que podríamos encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa. Es decir, no se expresa con número.

* Los Tipos De Variables Estadísticas

Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:

  • Variable Cuantitativa: Son variables que se expresan numéricamente.

    • Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.

    • Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.

  • Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.

    • Variable Ordinal: Expresa diferentes niveles y orden.

    • Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.

* El Muestreo Estdístico

El muestreo es el proceso mediante el cual se selecciona un grupo de observaciones que pertenecen a una población. Esto, con el fin de realizar un estudio estadístico.

En otras palabras, es el procedimiento mediante el cual se toman a ciertos individuos que pertenecen a una población que está siendo sujeto de un análisis.

El muestreo es necesario por el hecho de que las poblaciones pueden ser demasiado grandes y no es factible (económica y materialmente hablando) tomar datos de todos los individuos.

El objetivo es que la muestra sea representativa. Es decir, que sus indicadores como la media de edad, el ingreso promedio, el porcentaje de hombres y de mujeres, entre otros, sea el mismo, o muy similar al de la población.

* Los Diferentes Tipos De Muestreo

Los tipos de muestreo pueden distinguirse en función de distintos criterios. Así, según la técnica para seleccionar el subgrupo, se pueden diferenciar los siguientes:

* El Muestreo Probabilístico

Las observaciones son seleccionadas en base a la aleatoriedad, es decir, al azar. En esta categoría podemos encontrar:

  • Muestreo aleatorio simple: Todos los individuos de la población tienen la misma probabilidad de ser elegidos como parte de la muestra. Tiene ventajas, como el hecho de que es fácil de llevar a cabo a través de sistemas informáticos. Sin embargo, se requiere el listado completo de toda la población y, si la muestra es muy pequeña, la selección podría no ser representativa.

  • Sistemático: Se elige una observación al azar y, para seleccionar el resto de la muestra, se utilizan intervalos numéricos regulares. Es decir, supongamos que tengo una población de 10.000 y, aleatoriamente, selecciono la observación 600, después de lo cual puedo considerar intervalos de 30 observaciones. En este caso, tomaría las observaciones 600, 630, 660, 690, 720, 750, 780, y así sucesivamente.

  • Aleatorio estratificado: Se divide a la población en estratos, que son grupos que comparten características en común y son más homogéneos, inclusive, que la población en su conjunto. Entonces, se selecciona una muestra, ya sea de manera aleatoria o sistemática, dentro de cada estrato. El objetivo es lograr una representatividad de cada estrato.

  • Por conglomerados o clústeres: Consiste en crear grupos más pequeños que la población, los cuales reflejen o compartan todas las características de esta. Luego, elegimos alguno de los conglomerados como muestra y lo analizamos de forma detallada. Muestreo estratificado

* El Muestreo No Probabilístico

La selección de la muestra no depende de la probabilidad, sino de la decisión de los investigadores. Podemos distinguir algunas subcategorías:

  • Por conveniencia: Consiste en que el investigador captará a los sujetos que estén a su disponibilidad. Por ejemplo, por su proximidad o facilidad de acceso.

  • Método opinático o intencional: El investigador utiliza su juicio o criterio para elegir a quienes van a participar como parte de la muestra.

  • Casual o accidental: El investigador selecciona sin juicio previo a los individuos que van a formar parte de la muestra. Por ejemplo, esto suele suceder cuando se hacen encuestas en la calle.

  • Bola de nieve: Consiste en que, después de encontrar al primer sujeto (o primeros sujetos) de la muestra, el investigador le pide ayuda a él (o ellos) para identificar a otros individuos con esas mismas características

* Desarrollo Metodológico De La Práctica

En los siguientes ejercicios también se utilizan funciones de paquetes predeterminados de lenguaje de R para una mejor comprensión de la distribución binomial.

* Actividad No. 1 - Importar E Implementar Las Librerías

# Importación De Los Paquetes Y Librerías Necesarias Para La Realización De La Práctica 
library(dplyr)
library(mosaic)
library(readr)
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos
library(fdth)     # Para tablas de frecuencias
library(leaflet)  # Para hacer mapas

# Acomodo Del Tipo De Notación Para El Muestro De Los Valores Obtenidos 
options(scipen=999) # Notación normal
# options(scipen=1) # Notación científica

* Actividad No. 2 - Importar E Implementar Las Funciones Previamente Codificadas

# Funciones Previamente Codificadas 
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/f_construir_datos_y_funciones.r", encoding = "UTF-8")

* Actividad No. 3 - El Ejercicio De Nombres De Personas

* Los Datos Pertienetes Para La Realización De La Práctica

  • Se carga un conjunto de 100 nombres de personas con sus atributo de género y la actividad deportiva o cultura que practican,
  • Cargando un datos llamando a una función que construye los datos.
kable(head(personas, 10), caption = "Los primeros diez registros de nombres en el conjunto de datos")
Los primeros diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
JUAN M NO NO NO SI NO SI NO NO NO NO NO SI
JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI
MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO
GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
JUANA F NO NO NO NO SI NO NO SI NO NO NO NO
ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JESÚS M NO NO SI NO NO SI NO NO SI NO NO NO
kable(tail(personas, 10), caption = "Las útimos diez registros de nombres en el conjunto de datos")
Las útimos diez registros de nombres en el conjunto de datos
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
91 ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI
92 ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
93 MARÍA TERESA F NO SI NO NO SI NO NO SI NO NO NO NO
94 IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
95 CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO
96 LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
98 AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO
99 MARÍA DE LA LUZ F NO NO NO NO NO NO SI NO NO NO NO NO
100 GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO

* Actividad No. 4 - El Ejercicio De Los Alumnos

* Los Datos Pertienetes Para La Realización De La Práctica

  • Se cargan os datos de alumnos inscritos en una Institución de educación superior en un semestre con los atributos o variables siguientes:

    • No de control (modificado y no real),
    • Número Consecutivo de alumno
    • Semestre que cursa
    • Créditos aprobados
    • Carga académica que cursa
    • Promedio aritmético
    • Carrera
alumnos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/datos_alumnos_lat_long.csv")
kable(head(alumnos, 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
1 11 198 19 80.21 SISTEMAS Victoria de Durango 24.02399 -104.6702
2 11 235 10 84.33 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
3 9 235 10 95.25 SISTEMAS Victoria de Durango 24.02399 -104.6702
4 9 226 19 95.00 SISTEMAS Victoria de Durango 24.02399 -104.6702
5 10 231 14 82.32 SISTEMAS Victoria de Durango 24.02399 -104.6702
6 9 212 23 95.02 SISTEMAS Victoria de Durango 24.02399 -104.6702
7 12 221 10 79.06 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
8 9 226 9 92.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
9 9 231 4 91.08 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
10 11 222 13 80.42 SISTEMAS Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos, 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
5920 7 169 23 89.14 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5921 5 109 26 87.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5922 3 55 29 92.83 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5923 2 23 23 88.60 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328
5924 2 27 28 92.83 ADMINISTRACION La Esperanza 23.92139 -105.2973
5925 7 94 13 80.95 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5926 5 103 32 92.68 ADMINISTRACION La Esperanza 23.92139 -105.2973
5927 4 79 34 86.18 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5928 5 108 32 90.48 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
5929 7 169 32 92.33 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482

* Implantación De Una Semilla Para Números Aleatorios

# Implementando Una Semilla 
set.seed(2023)

* La Simulación De Los Diferentes De Muestreo

* El Muestreo Aleatorio Simple

  • Hay que encuestar a diez personas de 100 para hacerles alguna entrevista, ¿a quienes?
  • Con el conjunto de datos seleccionar 10 personas aleatoriamente con la función sample(). Con el argumento replace=FALSE significa que no se repita el elemento seleccionado en la muestra.
N <- nrow(personas)
n <- 10
muestra <- sample(x = personas$nombres, size = n, replace = FALSE)
kable(muestra, caption = "La muestra de personas")
La muestra de personas
x
MARÍA LUISA
ALICIA
ÓSCAR
JAVIER
FRANCISCA
SALVADOR
RAÚL
SERGIO
LUIS ÁNGEL
FRANCISCO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?
N <- nrow(alumnos)
n <- 100
registros <- sample(x = 1:N, size = n, replace = FALSE) # Genera los números
muestra <- alumnos[registros, ]
kable(muestra, caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
959 4 80 30 84.17 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519
4578 5 90 34 84.11 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
5507 9 262 10 93.96 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
207 6 137 28 87.30 SISTEMAS Victoria de Durango 24.02399 -104.6702
4141 4 70 28 79.73 QUIMICA Victoria de Durango 24.02399 -104.6702
5892 5 113 27 93.38 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
3808 4 76 24 89.29 MECATRONICA Victoria de Durango 24.02399 -104.6702
5765 3 55 29 92.58 ADMINISTRACION Los Caballos de Don Cruz 23.95737 -104.5519
384 3 50 33 86.91 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
1527 8 189 24 82.90 BIOQUIMICA La Esperanza 23.92139 -105.2973
494 10 153 29 82.15 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519
2530 9 217 13 84.89 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
5502 9 245 11 89.42 ADMINISTRACION Las Curras 24.01172 -104.4686
3238 1 NA 27 0.00 INDUSTRIAL La Esperanza 23.92139 -105.2973
4949 5 111 30 88.75 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4265 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702
4338 2 15 26 87.75 QUIMICA Victoria de Durango 24.02399 -104.6702
1022 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
2855 5 112 30 88.72 INDUSTRIAL Las Curras 24.01172 -104.4686
607 5 110 32 90.58 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
885 3 24 18 79.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
3372 10 185 29 79.24 MECANICA Victoria de Durango 24.02399 -104.6702
5119 3 48 29 85.36 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482
3617 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
2118 4 38 26 81.63 CIVIL La Criba (Don Toño) 24.18015 -104.5482
4804 8 210 25 93.86 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
966 5 32 18 82.50 ARQUITECTURA Las Curras 24.01172 -104.4686
2246 9 225 10 89.98 ELECTRICA Victoria de Durango 24.02399 -104.6702
4562 9 183 32 84.55 QUIMICA Victoria de Durango 24.02399 -104.6702
2850 8 184 21 81.83 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3939 2 16 28 82.00 MECATRONICA Victoria de Durango 24.02399 -104.6702
1576 9 119 11 77.40 CIVIL La Criba (Don Toño) 24.18015 -104.5482
4760 9 215 20 87.38 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
1095 5 54 12 84.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
672 6 133 27 92.39 ARQUITECTURA Las Curras 24.01172 -104.4686
1582 12 210 20 78.20 CIVIL La Criba (Don Toño) 24.18015 -104.5482
4513 3 56 30 89.25 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
5485 9 262 10 92.09 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
4206 1 NA 25 0.00 QUIMICA Las Curras 24.01172 -104.4686
4268 5 114 30 85.67 QUIMICA Victoria de Durango 24.02399 -104.6702
740 6 79 28 84.61 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328
5265 3 56 23 87.67 TIC La Criba (Don Toño) 24.18015 -104.5482
5280 3 46 23 85.20 TIC Victoria de Durango 24.02399 -104.6702
4522 7 172 32 86.72 QUIMICA Los Caballos de Don Cruz 23.95737 -104.5519
241 5 112 25 91.63 SISTEMAS La Esperanza 23.92139 -105.2973
5596 2 27 32 91.50 ADMINISTRACION La Esperanza 23.92139 -105.2973
4943 8 190 35 86.58 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5525 7 169 27 91.39 ADMINISTRACION Las Curras 24.01172 -104.4686
2674 10 217 18 82.33 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519
2892 5 51 29 79.50 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
2444 5 90 23 82.29 ELECTRICA Victoria de Durango 24.02399 -104.6702
2844 6 139 28 88.19 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
5803 1 NA 23 0.00 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
2889 5 112 30 90.72 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5753 3 60 29 90.92 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
411 7 165 34 82.78 SISTEMAS Victoria de Durango 24.02399 -104.6702
416 3 55 28 95.17 SISTEMAS Las Curras 24.01172 -104.4686
1600 9 225 20 85.02 CIVIL La Criba (Don Toño) 24.18015 -104.5482
3267 3 51 29 94.75 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
830 5 97 26 93.50 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
5652 8 167 34 90.86 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
1489 3 52 32 91.25 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
438 5 83 30 85.06 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
3506 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
4490 4 76 32 80.13 QUIMICA La Esperanza 23.92139 -105.2973
181 2 22 28 88.80 SISTEMAS Las Curras 24.01172 -104.4686
2040 7 173 30 84.36 CIVIL Victoria de Durango 24.02399 -104.6702
1275 4 74 28 82.47 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
3499 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
375 3 55 28 89.92 SISTEMAS Los Caballos de Don Cruz 23.95737 -104.5519
3142 6 142 25 86.22 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
458 9 168 25 81.83 ARQUITECTURA La Esperanza 23.92139 -105.2973
160 7 142 26 82.65 SISTEMAS Las Curras 24.01172 -104.4686
5798 6 140 28 91.03 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
4177 3 56 30 92.17 QUIMICA Victoria de Durango 24.02399 -104.6702
864 5 110 32 87.54 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
1892 3 42 23 90.67 CIVIL Victoria de Durango 24.02399 -104.6702
1789 6 143 30 84.63 CIVIL Victoria de Durango 24.02399 -104.6702
5889 5 113 31 94.54 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
1593 10 205 25 81.16 CIVIL Victoria de Durango 24.02399 -104.6702
4664 5 88 29 85.05 QUIMICA Victoria de Durango 24.02399 -104.6702
4727 10 230 5 82.19 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
432 1 NA 27 0.00 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
3337 2 22 29 83.20 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
347 5 116 30 91.24 SISTEMAS Victoria de Durango 24.02399 -104.6702
5897 6 140 29 92.37 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
4290 10 215 5 83.34 QUIMICA Victoria de Durango 24.02399 -104.6702
4563 9 204 26 81.71 QUIMICA Victoria de Durango 24.02399 -104.6702
3480 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702
3035 2 12 19 82.67 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5335 13 230 5 79.74 INFORMATICA Victoria de Durango 24.02399 -104.6702
4464 7 123 28 84.42 QUIMICA Las Curras 24.01172 -104.4686
1975 4 57 28 80.50 CIVIL Victoria de Durango 24.02399 -104.6702
12 10 179 23 82.69 SISTEMAS La Esperanza 23.92139 -105.2973
4305 2 11 25 91.67 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4917 3 49 33 89.36 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
2956 6 145 33 85.18 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519
3430 5 50 24 79.50 MECANICA Victoria de Durango 24.02399 -104.6702
440 3 13 29 84.00 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328
5455 7 187 29 90.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702

* El Muestreo Aleatorio Sistemático

  • Con el conjunto de datos personas, iniciar en un valor aleatorio e identificar los siguientes de 10 en 10 hasta tener diez personas.
N <- nrow(personas)
n = 10
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
#inicio
cuales <- seq(from = inicio, to =N, by= saltos)
kable(personas[cuales, ], caption = "La muestra sistematizada de personas")
La muestra sistematizada de personas
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
7 MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
17 JUAN CARLOS M SI NO NO NO NO NO SI NO SI NO NO NO
27 RAFAEL M NO NO NO NO NO NO NO SI NO NO NO NO
37 ENRIQUE F NO NO NO NO NO NO NO NO SI NO SI NO
47 ALICIA F NO SI NO NO NO SI NO NO NO SI NO NO
57 PATRICIA F NO NO NO NO NO NO NO NO NO NO NO NO
67 SILVIA F NO NO NO NO NO NO NO NO NO SI NO NO
77 PABLO M NO NO SI NO NO NO SI SI NO NO NO NO
87 JULIO CESAR M SI NO NO NO NO NO NO SI NO NO NO NO
97 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
  • Con el conjunto de datos alumnos, hay que encontrar a 100 alumnos, ¿A cuáles?, bajo el muestreo sistematizado
N <- nrow(alumnos)
n = 100
saltos <- round(N / n, 0)
inicio <- round(sample(N, 1) / n, 0)
cuales <- seq(from = inicio, to =N, by= saltos)
kable(alumnos[cuales, ], caption = "La muestra de alumnos")
La muestra de alumnos
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud
57 9 226 4 89.10 SISTEMAS Victoria de Durango 24.02399 -104.6702
116 7 165 34 93.67 SISTEMAS Victoria de Durango 24.02399 -104.6702
175 3 50 33 90.91 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
234 7 105 22 84.00 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482
293 4 83 33 86.28 SISTEMAS Victoria de Durango 24.02399 -104.6702
352 8 176 32 80.47 SISTEMAS Victoria de Durango 24.02399 -104.6702
411 7 165 34 82.78 SISTEMAS Victoria de Durango 24.02399 -104.6702
470 9 198 29 83.33 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
529 10 172 12 79.97 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
588 4 80 30 90.28 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
647 6 124 26 83.85 ARQUITECTURA Los Arroyos (Las Colonias) 23.69142 -105.0328
706 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
765 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
824 6 132 30 82.96 ARQUITECTURA La Esperanza 23.92139 -105.2973
883 6 91 30 85.53 ARQUITECTURA Las Curras 24.01172 -104.4686
942 5 88 30 83.32 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1001 3 52 24 90.50 ARQUITECTURA La Esperanza 23.92139 -105.2973
1060 1 NA 26 0.00 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482
1119 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702
1178 9 140 23 82.81 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1237 5 79 31 81.78 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482
1296 8 95 28 76.81 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1355 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1414 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1473 2 18 29 82.60 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1532 3 47 25 87.09 BIOQUIMICA Victoria de Durango 24.02399 -104.6702
1591 10 225 15 80.28 CIVIL La Criba (Don Toño) 24.18015 -104.5482
1650 9 235 10 91.00 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328
1709 5 67 8 82.71 CIVIL Victoria de Durango 24.02399 -104.6702
1768 6 139 30 85.21 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519
1827 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702
1886 4 51 31 78.83 CIVIL La Criba (Don Toño) 24.18015 -104.5482
1945 3 55 30 87.33 CIVIL La Esperanza 23.92139 -105.2973
2004 4 78 18 81.06 CIVIL Victoria de Durango 24.02399 -104.6702
2063 5 121 31 87.12 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519
2122 2 27 26 80.17 CIVIL Victoria de Durango 24.02399 -104.6702
2181 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702
2240 9 221 14 92.94 ELECTRICA Victoria de Durango 24.02399 -104.6702
2299 7 160 31 88.08 ELECTRICA La Esperanza 23.92139 -105.2973
2358 7 98 9 81.04 ELECTRICA Los Arroyos (Las Colonias) 23.69142 -105.0328
2417 3 56 26 92.00 ELECTRICA La Criba (Don Toño) 24.18015 -104.5482
2476 3 51 28 85.92 ELECTRICA Victoria de Durango 24.02399 -104.6702
2535 6 104 24 82.96 ELECTRONICA Victoria de Durango 24.02399 -104.6702
2594 1 NA 25 0.00 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
2653 5 105 28 95.17 ELECTRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
2712 11 235 10 80.68 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519
2771 4 75 32 80.59 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
2830 8 174 36 81.22 INDUSTRIAL Las Curras 24.01172 -104.4686
2889 5 112 30 90.72 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
2948 6 120 26 79.30 INDUSTRIAL Las Curras 24.01172 -104.4686
3007 6 142 25 83.56 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
3066 7 149 25 87.74 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3125 3 55 27 84.08 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
3184 6 139 28 84.48 INDUSTRIAL Victoria de Durango 24.02399 -104.6702
3243 3 51 29 86.83 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482
3302 5 95 27 81.18 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
3361 5 87 31 84.70 INDUSTRIAL La Esperanza 23.92139 -105.2973
3420 7 132 27 83.52 MECANICA Victoria de Durango 24.02399 -104.6702
3479 7 142 35 80.45 MECANICA Victoria de Durango 24.02399 -104.6702
3538 5 108 29 84.88 MECANICA Victoria de Durango 24.02399 -104.6702
3597 5 103 34 81.17 MECANICA La Criba (Don Toño) 24.18015 -104.5482
3656 6 113 29 79.72 MECANICA Los Arroyos (Las Colonias) 23.69142 -105.0328
3715 10 178 8 79.81 MECATRONICA Victoria de Durango 24.02399 -104.6702
3774 7 159 30 87.76 MECATRONICA Victoria de Durango 24.02399 -104.6702
3833 7 151 31 82.44 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328
3892 6 76 20 81.18 MECATRONICA Victoria de Durango 24.02399 -104.6702
3951 6 47 4 82.09 MECATRONICA Victoria de Durango 24.02399 -104.6702
4010 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702
4069 5 105 24 86.74 MECATRONICA Victoria de Durango 24.02399 -104.6702
4128 11 161 32 81.21 QUIMICA Victoria de Durango 24.02399 -104.6702
4187 5 109 25 87.22 QUIMICA Victoria de Durango 24.02399 -104.6702
4246 9 230 5 85.70 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
4305 2 11 25 91.67 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4364 4 86 28 88.50 QUIMICA Victoria de Durango 24.02399 -104.6702
4423 9 215 20 83.36 QUIMICA Victoria de Durango 24.02399 -104.6702
4482 2 25 30 82.00 QUIMICA Victoria de Durango 24.02399 -104.6702
4541 5 88 29 84.84 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328
4600 9 204 20 82.31 QUIMICA La Criba (Don Toño) 24.18015 -104.5482
4659 7 162 30 88.71 QUIMICA Los Caballos de Don Cruz 23.95737 -104.5519
4718 10 225 10 85.17 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4777 5 107 33 87.87 GESTION EMPRESARIAL La Criba (Don Toño) 24.18015 -104.5482
4836 1 NA 27 0.00 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
4895 3 53 29 87.92 GESTION EMPRESARIAL Los Caballos de Don Cruz 23.95737 -104.5519
4954 2 22 26 91.20 GESTION EMPRESARIAL La Esperanza 23.92139 -105.2973
5013 2 27 27 84.50 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5072 3 54 28 93.08 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702
5131 3 54 28 90.75 GESTION EMPRESARIAL Las Curras 24.01172 -104.4686
5190 3 45 33 85.10 GESTION EMPRESARIAL Los Arroyos (Las Colonias) 23.69142 -105.0328
5249 2 22 27 92.40 GESTION EMPRESARIAL Los Caballos de Don Cruz 23.95737 -104.5519
5308 1 NA 26 0.00 TIC Victoria de Durango 24.02399 -104.6702
5367 7 85 18 82.58 INFORMATICA Victoria de Durango 24.02399 -104.6702
5426 7 156 33 90.29 INFORMATICA Victoria de Durango 24.02399 -104.6702
5485 9 262 10 92.09 ADMINISTRACION La Criba (Don Toño) 24.18015 -104.5482
5544 5 89 28 85.63 ADMINISTRACION La Esperanza 23.92139 -105.2973
5603 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5662 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5721 8 180 34 85.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5780 4 84 33 89.94 ADMINISTRACION Victoria de Durango 24.02399 -104.6702
5839 6 140 28 91.93 ADMINISTRACION Los Caballos de Don Cruz 23.95737 -104.5519
5898 2 23 28 87.80 ADMINISTRACION La Esperanza 23.92139 -105.2973

* El Muestreo Aleatorio Estratificado

  • Con el conjunto de datos de personas se trata de encontrar 10 , pero que sea representativa de acuerdo y conforme al género femenino y masculino.
  • ¿Cuál es la frecuencia relativa del género femenino?
  • ¿Cuál es la frecuencia relativa del género masculino?
  • Ambas frecuencias multiplicar por el tamaño de la muestra para garantizar imparcialidad en la muestra.
N <- nrow(personas)
n <- 10
femeninos  <- filter(personas, generos=='F')
masculinos <- filter(personas, generos=='M')
frfem <- nrow(femeninos) / N
frmas <- nrow(masculinos) / N
frfem 
## [1] 0.43
frmas 
## [1] 0.57
muestraFem <- sample(femeninos, n * frfem)
kable(muestraFem, caption = "La muestra de personas Femenino")
La muestra de personas Femenino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
24 ROSA MARÍA F NO NO NO NO NO SI NO SI NO NO NO NO 24
42 ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO 42
18 MARÍA FERNANDA F NO SI SI NO NO NO SI SI NO SI NO NO 18
4 JUANA F NO NO NO NO SI NO NO SI NO NO NO NO 4
muestraMas <- sample(masculinos, n * frmas)
kable(muestraMas, caption = "La muestra de personas Masculino")
La muestra de personas Masculino
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima orig.id
40 GABRIEL M SI NO SI NO NO SI NO NO NO NO NO NO 40
36 JUAN MANUEL M NO NO NO NO NO NO NO SI NO SI SI NO 36
7 MIGUEL ÁNGEL M NO NO NO NO NO NO NO NO SI NO NO NO 7
17 RICARDO M NO NO NO NO SI NO NO NO NO SI NO NO 17
5 ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO 5
  • Simular muestreo estratificado por carreras de alumnos determinando las frecuencias relativas por medio de la función fdt_cat()
N <- nrow(alumnos)
n <- 100
alumnos
## # A tibble: 5,929 × 9
##    Alumno Semestre `Cr. Apr.` Carga Promedio Carrera  localidad  latitud longi…¹
##     <dbl>    <dbl>      <dbl> <dbl>    <dbl> <chr>    <chr>        <dbl>   <dbl>
##  1      1       11        198    19     80.2 SISTEMAS Victoria …    24.0   -105.
##  2      2       11        235    10     84.3 SISTEMAS Los Arroy…    23.7   -105.
##  3      3        9        235    10     95.2 SISTEMAS Victoria …    24.0   -105.
##  4      4        9        226    19     95   SISTEMAS Victoria …    24.0   -105.
##  5      5       10        231    14     82.3 SISTEMAS Victoria …    24.0   -105.
##  6      6        9        212    23     95.0 SISTEMAS Victoria …    24.0   -105.
##  7      7       12        221    10     79.1 SISTEMAS La Criba …    24.2   -105.
##  8      8        9        226     9     92.5 SISTEMAS Victoria …    24.0   -105.
##  9      9        9        231     4     91.1 SISTEMAS Los Arroy…    23.7   -105.
## 10     10       11        222    13     80.4 SISTEMAS Victoria …    24.0   -105.
## # … with 5,919 more rows, and abbreviated variable name ¹​longitud
tabla_frec <- data.frame(fdt_cat(alumnos$Carrera))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos")
Tabla de frecuencia de alumnos
Category f rf rf… cf cf… muestra
INDUSTRIAL 707 0.1192444 11.924439 707 11.92444 12
ARQUITECTURA 675 0.1138472 11.384719 1382 23.30916 11
CIVIL 648 0.1092933 10.929330 2030 34.23849 11
GESTION EMPRESARIAL 585 0.0986676 9.866757 2615 44.10525 10
QUIMICA 568 0.0958003 9.580030 3183 53.68528 10
ADMINISTRACION 497 0.0838253 8.382527 3680 62.06780 8
SISTEMAS 452 0.0762355 7.623545 4132 69.69135 8
BIOQUIMICA 441 0.0743802 7.438016 4573 77.12936 7
MECATRONICA 432 0.0728622 7.286220 5005 84.41558 7
MECANICA 301 0.0507674 5.076741 5306 89.49233 5
ELECTRICA 280 0.0472255 4.722550 5586 94.21488 5
ELECTRONICA 161 0.0271547 2.715466 5747 96.93034 3
INFORMATICA 101 0.0170349 1.703491 5848 98.63383 2
TIC 81 0.0136617 1.366166 5929 100.00000 1
  • ¿Cuáles alumnos?
  • Sólo simular carreras de SISTEMAS Y CIVIL
N <- nrow(alumnos)
n <- 100
sistemas  <- filter(alumnos, Carrera =='SISTEMAS')
civil <- filter(alumnos, Carrera == 'CIVIL')
frsistemas <- nrow(sistemas) / N
frcivil <- nrow(civil) / N
frsistemas
## [1] 0.07623545
frcivil 
## [1] 0.1092933
muestrasistemas <- sample(sistemas, round(n * frsistemas, 0))
kable(muestrasistemas, caption = "La muestra de alumnos de Sistemas.")
La muestra de alumnos de Sistemas.
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
12 10 179 23 82.69 SISTEMAS La Esperanza 23.92139 -105.2973 12
356 3 55 28 91.67 SISTEMAS La Esperanza 23.92139 -105.2973 356
336 3 45 33 82.80 SISTEMAS Victoria de Durango 24.02399 -104.6702 336
438 5 83 30 85.06 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328 438
31 11 226 9 86.88 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328 31
249 5 112 25 92.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 249
138 8 199 27 87.93 SISTEMAS La Criba (Don Toño) 24.18015 -104.5482 138
280 1 NA 27 0.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 280
muestracivil <- sample(civil, round(n * frcivil, 0))
kable(muestracivil, caption = "La muestra de alumnos de Civil")
La muestra de alumnos de Civil
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2150 6 143 30 86.57 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 582
2202 1 NA 27 0.00 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519 634
2189 2 23 25 78.80 CIVIL La Esperanza 23.92139 -105.2973 621
2206 7 165 35 87.00 CIVIL Los Caballos de Don Cruz 23.95737 -104.5519 638
1852 5 98 35 82.10 CIVIL Victoria de Durango 24.02399 -104.6702 284
1890 6 94 28 80.70 CIVIL Victoria de Durango 24.02399 -104.6702 322
2053 5 108 29 86.61 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 485
1703 4 71 28 86.47 CIVIL Las Curras 24.01172 -104.4686 135
1606 12 196 9 78.76 CIVIL Victoria de Durango 24.02399 -104.6702 38
1893 8 188 28 86.08 CIVIL Victoria de Durango 24.02399 -104.6702 325
1710 2 27 30 88.50 CIVIL La Criba (Don Toño) 24.18015 -104.5482 142

* El Muestreo Por Conglomerados

Mostrar los primeros diez y últimos diez alumnos verificando las tres columnas de localidad, latitud y longitud.

kable(head(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Los primeros diez registros de alumnos")
Los primeros diez registros de alumnos
Alumno localidad latitud longitud
1 Victoria de Durango 24.02399 -104.6702
2 Los Arroyos (Las Colonias) 23.69142 -105.0328
3 Victoria de Durango 24.02399 -104.6702
4 Victoria de Durango 24.02399 -104.6702
5 Victoria de Durango 24.02399 -104.6702
6 Victoria de Durango 24.02399 -104.6702
7 La Criba (Don Toño) 24.18015 -104.5482
8 Victoria de Durango 24.02399 -104.6702
9 Los Arroyos (Las Colonias) 23.69142 -105.0328
10 Victoria de Durango 24.02399 -104.6702
kable(tail(alumnos[, c('Alumno', 'localidad', 'latitud', 'longitud')], 10), caption = "Las útimos diez registros de alumnos")
Las útimos diez registros de alumnos
Alumno localidad latitud longitud
5920 Victoria de Durango 24.02399 -104.6702
5921 Victoria de Durango 24.02399 -104.6702
5922 Victoria de Durango 24.02399 -104.6702
5923 Los Arroyos (Las Colonias) 23.69142 -105.0328
5924 La Esperanza 23.92139 -105.2973
5925 Victoria de Durango 24.02399 -104.6702
5926 La Esperanza 23.92139 -105.2973
5927 Victoria de Durango 24.02399 -104.6702
5928 La Criba (Don Toño) 24.18015 -104.5482
5929 La Criba (Don Toño) 24.18015 -104.5482

Determinar la frecuencias por localidad

N <- nrow(alumnos)
n <- 100
tabla_frec <- data.frame(fdt_cat(alumnos$localidad))
tabla_frec$muestra <-  round(tabla_frec$rf * n, 0)
kable(tabla_frec, caption = "Tabla de frecuencia de alumnos por localidad")
Tabla de frecuencia de alumnos por localidad
Category f rf rf… cf cf… muestra
Victoria de Durango 3527 0.5948727 59.487266 3527 59.48727 59
La Criba (Don Toño) 750 0.1264969 12.649688 4277 72.13695 13
Los Arroyos (Las Colonias) 575 0.0969809 9.698094 4852 81.83505 10
La Esperanza 419 0.0706696 7.066959 5271 88.90201 7
Los Caballos de Don Cruz 355 0.0598752 5.987519 5626 94.88953 6
Las Curras 303 0.0511047 5.110474 5929 100.00000 5

Determinar el porcentaje que le corresponde a cada conglomerado conforme a la frecuencia relativa.

¿Cuáles alumnos?, de acuerdo al conglomerado o la localidad

Simular por las seis localidades

localidades <- tabla_frec$Category
localidades
## [1] "Victoria de Durango"        "La Criba (Don Toño)"       
## [3] "Los Arroyos (Las Colonias)" "La Esperanza"              
## [5] "Los Caballos de Don Cruz"   "Las Curras"
# Iniciando Datos
N <- nrow(alumnos)
n <- 100

# Determinar cada conglomerado
loc1 <- filter(alumnos, localidad == tabla_frec$Category[1])
loc2 <- filter(alumnos, localidad == tabla_frec$Category[2])
loc3 <- filter(alumnos, localidad == tabla_frec$Category[3])
loc4 <- filter(alumnos, localidad == tabla_frec$Category[4])
loc5 <- filter(alumnos, localidad == tabla_frec$Category[5])
loc6 <- filter(alumnos, localidad == tabla_frec$Category[6])

# Determinar frecuencias de cada conglomerado similiar a la tabla tabla_frec
frloc1 <- nrow(loc1) / N
frloc2 <- nrow(loc2) / N
frloc3 <- nrow(loc3) / N
frloc4 <- nrow(loc4) / N
frloc5 <- nrow(loc5) / N
frloc6 <- nrow(loc6) / N

# Crear muestras
muestraloc1 <- sample(x = loc1, size = round(n * frloc1, 0), replace = FALSE)
kable(muestraloc1, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[1] ))
La muestra de alumnos de Localidad Victoria de Durango
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
5476 11 166 29 80.11 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3235
1916 6 138 35 85.66 CIVIL Victoria de Durango 24.02399 -104.6702 1129
5100 8 185 30 84.59 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2996
3366 9 142 17 77.32 MECANICA Victoria de Durango 24.02399 -104.6702 1981
1344 2 23 29 84.67 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 793
3508 6 117 30 81.42 MECANICA Victoria de Durango 24.02399 -104.6702 2064
3236 2 21 24 87.60 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1908
2121 4 80 34 85.47 CIVIL Victoria de Durango 24.02399 -104.6702 1246
3410 9 177 28 79.97 MECANICA Victoria de Durango 24.02399 -104.6702 2005
568 5 106 36 89.87 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 322
3495 3 49 31 82.00 MECANICA Victoria de Durango 24.02399 -104.6702 2053
2539 5 85 25 87.89 ELECTRONICA Victoria de Durango 24.02399 -104.6702 1496
1550 4 82 28 86.44 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 911
1633 11 206 29 79.65 CIVIL Victoria de Durango 24.02399 -104.6702 963
2230 10 208 18 82.68 ELECTRICA Victoria de Durango 24.02399 -104.6702 1308
5318 1 NA 26 0.00 TIC Victoria de Durango 24.02399 -104.6702 3131
3074 2 32 28 91.71 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1806
5622 1 NA 27 0.00 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3320
1098 2 26 26 89.50 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 650
4711 10 173 25 83.05 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2778
4122 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2435
280 1 NA 27 0.00 SISTEMAS Victoria de Durango 24.02399 -104.6702 161
5477 9 238 19 91.34 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3236
4678 9 220 15 90.98 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2757
1978 5 109 34 86.52 CIVIL Victoria de Durango 24.02399 -104.6702 1163
2193 1 NA 27 0.00 CIVIL Victoria de Durango 24.02399 -104.6702 1288
5879 3 55 29 93.50 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3497
2705 14 216 19 80.39 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1591
4258 5 114 30 90.46 QUIMICA Victoria de Durango 24.02399 -104.6702 2527
414 6 137 28 84.87 SISTEMAS Victoria de Durango 24.02399 -104.6702 247
1013 1 NA 26 0.00 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 594
3607 8 186 28 83.66 MECANICA Victoria de Durango 24.02399 -104.6702 2130
4155 1 NA 25 0.00 QUIMICA Victoria de Durango 24.02399 -104.6702 2459
961 4 46 18 83.55 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 562
945 6 134 24 87.86 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 554
3114 2 27 24 92.50 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1833
3592 1 NA 26 0.00 MECANICA Victoria de Durango 24.02399 -104.6702 2123
5396 7 146 29 85.34 INFORMATICA Victoria de Durango 24.02399 -104.6702 3182
566 5 90 36 84.90 ARQUITECTURA Victoria de Durango 24.02399 -104.6702 320
5665 3 55 29 94.17 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3350
2085 3 48 29 83.70 CIVIL Victoria de Durango 24.02399 -104.6702 1219
3185 6 134 32 81.97 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1877
4583 7 150 22 86.16 QUIMICA Victoria de Durango 24.02399 -104.6702 2703
5061 5 87 36 88.11 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2972
1153 9 206 29 81.84 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 686
1372 4 71 34 81.50 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 813
3717 9 178 21 83.55 MECATRONICA Victoria de Durango 24.02399 -104.6702 2205
3862 1 NA 25 0.00 MECATRONICA Victoria de Durango 24.02399 -104.6702 2283
5716 6 125 33 88.07 ADMINISTRACION Victoria de Durango 24.02399 -104.6702 3385
2900 7 175 35 86.75 INDUSTRIAL Victoria de Durango 24.02399 -104.6702 1697
100 4 36 29 85.13 SISTEMAS Victoria de Durango 24.02399 -104.6702 61
4913 5 112 36 94.13 GESTION EMPRESARIAL Victoria de Durango 24.02399 -104.6702 2897
1354 7 167 34 86.40 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 800
2175 7 111 30 86.83 CIVIL Victoria de Durango 24.02399 -104.6702 1277
1610 9 166 26 81.14 CIVIL Victoria de Durango 24.02399 -104.6702 948
3742 3 58 28 84.38 MECATRONICA Victoria de Durango 24.02399 -104.6702 2217
1432 4 72 30 82.63 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 851
1342 1 NA 23 0.00 BIOQUIMICA Victoria de Durango 24.02399 -104.6702 792
1872 3 42 34 80.89 CIVIL Victoria de Durango 24.02399 -104.6702 1105
muestraloc2 <- sample(loc2, round(n * frloc2, 0))
kable(muestraloc2, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[2] ))
La muestra de alumnos de Localidad La Criba (Don Toño)
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
3130 5 77 22 84.67 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 421
536 11 174 17 82.68 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 72
844 4 80 30 89.72 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 119
807 3 48 32 89.82 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 113
3240 5 112 30 90.00 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 433
1256 6 92 33 81.19 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 189
3176 7 156 29 84.74 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 427
1359 4 69 30 82.81 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 205
3756 3 53 27 89.25 MECATRONICA La Criba (Don Toño) 24.18015 -104.5482 499
1216 5 89 27 86.45 BIOQUIMICA La Criba (Don Toño) 24.18015 -104.5482 180
2602 3 43 28 85.70 ELECTRONICA La Criba (Don Toño) 24.18015 -104.5482 358
881 4 80 30 90.72 ARQUITECTURA La Criba (Don Toño) 24.18015 -104.5482 125
2936 5 112 30 90.08 INDUSTRIAL La Criba (Don Toño) 24.18015 -104.5482 400
muestraloc3 <- sample(loc3, round(n * frloc3, 0))
kable(muestraloc3, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[3] ))
La muestra de alumnos de Localidad Los Arroyos (Las Colonias)
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2355 1 NA 24 0.00 ELECTRICA Los Arroyos (Las Colonias) 23.69142 -105.0328 228
9 9 231 4 91.08 SISTEMAS Los Arroyos (Las Colonias) 23.69142 -105.0328 2
1615 12 197 19 80.24 CIVIL Los Arroyos (Las Colonias) 23.69142 -105.0328 149
3802 5 79 24 87.78 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328 370
3980 5 109 24 89.83 MECATRONICA Los Arroyos (Las Colonias) 23.69142 -105.0328 390
1358 5 105 35 85.70 BIOQUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 116
5533 1 NA 27 0.00 ADMINISTRACION Los Arroyos (Las Colonias) 23.69142 -105.0328 543
4507 5 114 30 88.75 QUIMICA Los Arroyos (Las Colonias) 23.69142 -105.0328 446
3043 7 121 34 80.68 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328 304
2866 6 102 36 81.87 INDUSTRIAL Los Arroyos (Las Colonias) 23.69142 -105.0328 288
muestraloc4 <- sample(loc4, round(n * frloc4, 0))
kable(muestraloc4, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[4] ))
La muestra de alumnos de Localidad La Esperanza
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
4083 7 155 36 86.33 MECATRONICA La Esperanza 23.92139 -105.2973 288
351 3 54 29 85.92 SISTEMAS La Esperanza 23.92139 -105.2973 33
3470 5 78 30 80.67 MECANICA La Esperanza 23.92139 -105.2973 244
367 5 116 30 89.88 SISTEMAS La Esperanza 23.92139 -105.2973 36
1897 4 75 34 82.81 CIVIL La Esperanza 23.92139 -105.2973 138
1421 3 52 30 86.92 BIOQUIMICA La Esperanza 23.92139 -105.2973 104
112 5 112 25 86.83 SISTEMAS La Esperanza 23.92139 -105.2973 14
muestraloc5 <- sample(loc5, round(n * frloc5, 0))
kable(muestraloc5, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[5] ))
La muestra de alumnos de Localidad Los Caballos de Don Cruz
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2920 1 NA 27 0.00 INDUSTRIAL Los Caballos de Don Cruz 23.95737 -104.5519 179
4812 8 185 30 88.87 GESTION EMPRESARIAL Los Caballos de Don Cruz 23.95737 -104.5519 294
721 6 125 30 87.92 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 46
2429 1 NA 24 0.00 ELECTRICA Los Caballos de Don Cruz 23.95737 -104.5519 147
665 1 NA 26 0.00 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 44
615 4 60 12 82.62 ARQUITECTURA Los Caballos de Don Cruz 23.95737 -104.5519 39
muestraloc6 <- sample(loc6, round(n * frloc6, 0))
kable(muestraloc6, caption = paste("La muestra de alumnos de Localidad ",tabla_frec$Category[6] ))
La muestra de alumnos de Localidad Las Curras
Alumno Semestre Cr. Apr. Carga Promedio Carrera localidad latitud longitud orig.id
2788 8 182 33 80.43 INDUSTRIAL Las Curras 24.01172 -104.4686 128
5614 5 104 23 87.59 ADMINISTRACION Las Curras 24.01172 -104.4686 292
3933 7 128 33 83.67 MECATRONICA Las Curras 24.01172 -104.4686 194
3475 1 NA 26 0.00 MECANICA Las Curras 24.01172 -104.4686 171
1958 1 NA 27 0.00 CIVIL Las Curras 24.01172 -104.4686 91
* La Visialización Por Mapas (Conglomerados)
  • Cargar la librerías para mapas previamente
  • Usando los valores de latitud y longitud
map<-leaflet() %>%
  addTiles() %>%
  addMarkers(lat = unique(muestraloc1$latitud ), lng = unique(muestraloc1$longitud), popup = paste(unique(muestraloc1$localidad), "Muestra de:", nrow(muestraloc1), "alumnos"))  %>%
  addMarkers(lat = unique(muestraloc2$latitud ), lng = unique(muestraloc2$longitud), popup = paste(unique(muestraloc2$localidad), "Muestra de:", nrow(muestraloc2), "alumnos")) %>%
addMarkers(lat = unique(muestraloc3$latitud ), lng = unique(muestraloc3$longitud), popup = paste(unique(muestraloc3$localidad), "Muestra de:", nrow(muestraloc3), "alumnos")) %>% 
    addMarkers(lat = unique(muestraloc4$latitud ), lng = unique(muestraloc4$longitud), popup = paste(unique(muestraloc4$localidad), "Muestra de:", nrow(muestraloc4), "alumnos")) %>%
addMarkers(lat = unique(muestraloc5$latitud ), lng = unique(muestraloc5$longitud), popup = paste(unique(muestraloc5$localidad), "Muestra de:", nrow(muestraloc5), "alumnos")) %>%
  addMarkers(lat = unique(muestraloc6$latitud ), lng = unique(muestraloc6$longitud), popup = paste(unique(muestraloc6$localidad), "Muestra de:", nrow(muestraloc6), "alumnos"))

# Mostrar el mapa 
map

* Análisis Crítico De Los Datos Obtenidos

* Interpretación De La Práctica

En este caso se representó un histograma para una serie de datos simulados.

El muestreo estadístico es el proceso de seleccionar una muestra de una población para estimar las características de la población. El objetivo del muestreo estadístico es obtener una muestra representativa de la población que permita hacer inferencias precisas sobre la población en su conjunto.

Existen diferentes tipos de muestreos que se utilizan en estadística. El muestreo aleatorio simple es un método en el que cada elemento de la población tiene la misma probabilidad de ser seleccionado para la muestra. El muestreo estratificado es un método en el que la población se divide en subgrupos o estratos y se selecciona una muestra aleatoria simple de cada estrato.

El muestreo por conglomerados es un método en el que la población se divide en grupos o conglomerados y se selecciona una muestra aleatoria simple de cada conglomerado. El muestreo sistemático es un método en el que se selecciona un elemento al azar y luego se seleccionan los elementos restantes a intervalos regulares. El muestreo por cuotas es un método en el que se selecciona una muestra basada en características específicas, como edad, género o ingresos.

Es importante tener en cuenta que el tamaño de la muestra es un factor crítico en el proceso de muestreo estadístico. Una muestra más grande generalmente proporciona estimaciones más precisas de las características de la población.

* Referencias Bibliográficas

  • Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.

  • Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.

  • Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.

  • Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.