Objetivo

Determinar la media poblacional y media muestral de un conjunto de registros de alumnos con datos generados aleatoriamente.

Descripción

Se establece la semilla

set.seed(1234)

Generar las tres variables

no <- 1:7200000
promedios <- sample(70:100, 7200, replace = TRUE)
carreras <- c('ELECTRICA', 'ELECTRONICA', 'SISTEMAS', 'INFORMATICA', 'INDUSTRIAL', 'QUIMICA', 'ADMINISTRACION', 'CIVIL', 'ARQUITECTURA', 'BIOQUIMICA', 'MECANICA', 'MECATRONICA', 'TIC', 'GESTION')

Crear el conjunto de datos

carralumno <- sample(carreras, 7200000, replace = TRUE)
alumnos <- data.frame(no, promedios, carralumno)

# alumnos
head(alumnos)  # Los primeros seis registros
##   no promedios   carralumno
## 1  1        97   INDUSTRIAL
## 2  2        85   INDUSTRIAL
## 3  3        95 ARQUITECTURA
## 4  4        91 ARQUITECTURA
## 5  5        74     SISTEMAS
## 6  6        81        CIVIL
tail(alumnos)  # Lo últimos seis registros 
##              no promedios     carralumno
## 7199995 7199995        81    ELECTRONICA
## 7199996 7199996        89        QUIMICA
## 7199997 7199997        70     BIOQUIMICA
## 7199998 7199998        87     INDUSTRIAL
## 7199999 7199999        87       SISTEMAS
## 7200000 7200000        96 ADMINISTRACION
N <- nrow(alumnos) # Tamaño de población

Determinar el promedio general de todos los estudiantes o de toda la población

promedioPoblacion <- mean(alumnos$promedios)
promedioPoblacion # Promedio de todos los estudiantes
## [1] 85.06528

Generar una muestra del 10%

muestraRegs <- sample(1:N, N * 0.10, replace = FALSE) # Son 720. muetraRegs identifica los números de registros de la población que serán la muestra
head(muestraRegs) # Los primeros seis
## [1] 4293125 6061749 2148451 2526771 5044105 7198847
# Ahora los datos de la muestra
muestraAlumnos <- alumnos[muestraRegs,] # La muestra de alumnos son los datos de la muestra.
head(muestraAlumnos) # Los prmeros seis
##              no promedios   carralumno
## 4293125 4293125        87 ARQUITECTURA
## 6061749 6061749        96      QUIMICA
## 2148451 2148451        75  ELECTRONICA
## 2526771 2526771        70  ELECTRONICA
## 5044105 5044105        98     SISTEMAS
## 7198847 7198847        77   BIOQUIMICA
promedioMuestra <- mean(muestraAlumnos$promedios)

promedioMuestra
## [1] 85.07744
print("¿Los promedios de población y de muestra salen exactamente iguales o parecidos?")
## [1] "¿Los promedios de población y de muestra salen exactamente iguales o parecidos?"

Determinar muestra conforme a fórmula del enlace:

http://www.corporacionaem.com/tools/calc_muestras.php * Generar una muestra conforme a la fórmula * Utilizando calculadora para determinar la muestra * Son 365 casos es la muestra al 95% de confianza y 5% margen de error

n <- 16603 # Tamaño de la muestra
muestraRegs <- sample(1:N, n, replace = FALSE)
head(muestraRegs) # identifica los números de registros de la población que serán la muestra
## [1] 3606793 4957923  841470 6910218 6426272 3791989
muestraAlumnos <- alumnos[muestraRegs,] # La muestra de alumnos
head(muestraAlumnos) # Se ven los regisros de la muestra
##              no promedios     carralumno
## 3606793 3606793        81    INFORMATICA
## 4957923 4957923        83        QUIMICA
## 841470   841470        78       MECANICA
## 6910218 6910218        83       SISTEMAS
## 6426272 6426272        84 ADMINISTRACION
## 3791989 3791989        89    INFORMATICA
promedioMuestra <- mean(muestraAlumnos$promedios)
print("¿Los promedios de población y de muestra salen iguales o parecidos?, ¿cambia conforme a los valores anteriores de la muestra al 10%?")
## [1] "¿Los promedios de población y de muestra salen iguales o parecidos?, ¿cambia conforme a los valores anteriores de la muestra al 10%?"
print(promedioPoblacion)
## [1] 85.06528
print(promedioMuestra)
## [1] 84.95429

Resultados

Interpretación