Determinar la media poblacional y media muestral de un conjunto de registros de alumnos con datos generados aleatoriamente.
set.seed(1234)
no <- 1:7200000
promedios <- sample(70:100, 7200, replace = TRUE)
carreras <- c('ELECTRICA', 'ELECTRONICA', 'SISTEMAS', 'INFORMATICA', 'INDUSTRIAL', 'QUIMICA', 'ADMINISTRACION', 'CIVIL', 'ARQUITECTURA', 'BIOQUIMICA', 'MECANICA', 'MECATRONICA', 'TIC', 'GESTION')
carralumno <- sample(carreras, 7200000, replace = TRUE)
alumnos <- data.frame(no, promedios, carralumno)
# alumnos
head(alumnos) # Los primeros seis registros
## no promedios carralumno
## 1 1 97 INDUSTRIAL
## 2 2 85 INDUSTRIAL
## 3 3 95 ARQUITECTURA
## 4 4 91 ARQUITECTURA
## 5 5 74 SISTEMAS
## 6 6 81 CIVIL
tail(alumnos) # Lo últimos seis registros
## no promedios carralumno
## 7199995 7199995 81 ELECTRONICA
## 7199996 7199996 89 QUIMICA
## 7199997 7199997 70 BIOQUIMICA
## 7199998 7199998 87 INDUSTRIAL
## 7199999 7199999 87 SISTEMAS
## 7200000 7200000 96 ADMINISTRACION
N <- nrow(alumnos) # Tamaño de población
promedioPoblacion <- mean(alumnos$promedios)
promedioPoblacion # Promedio de todos los estudiantes
## [1] 85.06528
muestraRegs <- sample(1:N, N * 0.10, replace = FALSE) # Son 720. muetraRegs identifica los números de registros de la población que serán la muestra
head(muestraRegs) # Los primeros seis
## [1] 4293125 6061749 2148451 2526771 5044105 7198847
# Ahora los datos de la muestra
muestraAlumnos <- alumnos[muestraRegs,] # La muestra de alumnos son los datos de la muestra.
head(muestraAlumnos) # Los prmeros seis
## no promedios carralumno
## 4293125 4293125 87 ARQUITECTURA
## 6061749 6061749 96 QUIMICA
## 2148451 2148451 75 ELECTRONICA
## 2526771 2526771 70 ELECTRONICA
## 5044105 5044105 98 SISTEMAS
## 7198847 7198847 77 BIOQUIMICA
promedioMuestra <- mean(muestraAlumnos$promedios)
promedioMuestra
## [1] 85.07744
print("¿Los promedios de población y de muestra salen exactamente iguales o parecidos?")
## [1] "¿Los promedios de población y de muestra salen exactamente iguales o parecidos?"
http://www.corporacionaem.com/tools/calc_muestras.php * Generar una muestra conforme a la fórmula * Utilizando calculadora para determinar la muestra * Son 365 casos es la muestra al 95% de confianza y 5% margen de error
n <- 16603 # Tamaño de la muestra
muestraRegs <- sample(1:N, n, replace = FALSE)
head(muestraRegs) # identifica los números de registros de la población que serán la muestra
## [1] 3606793 4957923 841470 6910218 6426272 3791989
muestraAlumnos <- alumnos[muestraRegs,] # La muestra de alumnos
head(muestraAlumnos) # Se ven los regisros de la muestra
## no promedios carralumno
## 3606793 3606793 81 INFORMATICA
## 4957923 4957923 83 QUIMICA
## 841470 841470 78 MECANICA
## 6910218 6910218 83 SISTEMAS
## 6426272 6426272 84 ADMINISTRACION
## 3791989 3791989 89 INFORMATICA
promedioMuestra <- mean(muestraAlumnos$promedios)
print("¿Los promedios de población y de muestra salen iguales o parecidos?, ¿cambia conforme a los valores anteriores de la muestra al 10%?")
## [1] "¿Los promedios de población y de muestra salen iguales o parecidos?, ¿cambia conforme a los valores anteriores de la muestra al 10%?"
print(promedioPoblacion)
## [1] 85.06528
print(promedioMuestra)
## [1] 84.95429