Analizar un conjunto de datos académicos de alumnos para determinar tablas de frecuencias que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.
library(readr) # Cargar datos csv
library(fdth) # Tablas de frecuencias
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head(alumnos) # Los primeso seis registros
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 1 20190001 1 11 198 19 80.21 SISTEMAS
## 2 20190002 2 11 235 10 84.33 SISTEMAS
## 3 20190003 3 9 235 10 95.25 SISTEMAS
## 4 20190004 4 9 226 19 95.00 SISTEMAS
## 5 20190005 5 10 231 14 82.32 SISTEMAS
## 6 20190006 6 9 212 23 95.02 SISTEMAS
primer_semestre <- subset(alumnos, Semestre == 1)
tabla.frecuencia <- fdt_cat(primer_semestre$Carrera)
tabla.frecuencia
## Category f rf rf(%) cf cf(%)
## ARQUITECTURA 128 0.12 12.42 128 12.42
## GESTION EMPRESARIAL 89 0.09 8.63 217 21.05
## QUIMICA 89 0.09 8.63 306 29.68
## INDUSTRIAL 88 0.09 8.54 394 38.22
## CIVIL 86 0.08 8.34 480 46.56
## BIOQUIMICA 84 0.08 8.15 564 54.70
## ADMINISTRACION 83 0.08 8.05 647 62.75
## SISTEMAS 78 0.08 7.57 725 70.32
## ELECTRICA 77 0.07 7.47 802 77.79
## MECANICA 76 0.07 7.37 878 85.16
## MECATRONICA 70 0.07 6.79 948 91.95
## ELECTRONICA 36 0.03 3.49 984 95.44
## INFORMATICA 30 0.03 2.91 1014 98.35
## TIC 17 0.02 1.65 1031 100.00
barplot(height = tabla.frecuencia$f,
names.arg = tabla.frecuencia$Category,
main = "Frecuencia de Alumnos de Primer Semestre")
## 6. Generar tabla de distribución de frecuencias de todos los alumnos inscritos
tabla.frecuencia.todos <- fdt_cat(alumnos$Carrera)
tabla.frecuencia.todos
## Category f rf rf(%) cf cf(%)
## INDUSTRIAL 707 0.12 11.92 707 11.92
## ARQUITECTURA 675 0.11 11.38 1382 23.31
## CIVIL 648 0.11 10.93 2030 34.24
## GESTION EMPRESARIAL 585 0.10 9.87 2615 44.11
## QUIMICA 568 0.10 9.58 3183 53.69
## ADMINISTRACION 497 0.08 8.38 3680 62.07
## SISTEMAS 452 0.08 7.62 4132 69.69
## BIOQUIMICA 441 0.07 7.44 4573 77.13
## MECATRONICA 432 0.07 7.29 5005 84.42
## MECANICA 301 0.05 5.08 5306 89.49
## ELECTRICA 280 0.05 4.72 5586 94.21
## ELECTRONICA 161 0.03 2.72 5747 96.93
## INFORMATICA 101 0.02 1.70 5848 98.63
## TIC 81 0.01 1.37 5929 100.00
barplot(height = tabla.frecuencia.todos$f,
names.arg = tabla.frecuencia.todos$Category,
main = "Frecuencia de Alumnos inscritos por Carrera")
## 8. Generar tabla de distribución de frecuencias de alumnos inscritos por carreras por semestre (Una por cada carrera) * SISTEMAS
SISTEMAS <- subset(alumnos, Carrera == "SISTEMAS")
# cATEGORIZAR AL SEMESTRE, No hay operaciones artiméticas con Semestre
SISTEMAS$Semestre <- factor(SISTEMAS$Semestre)
tabla_frecuencia.SIS <- fdt_cat(SISTEMAS$Semestre)
tabla_frecuencia.SIS
## Category f rf rf(%) cf cf(%)
## 1 78 0.17 17.26 78 17.26
## 3 64 0.14 14.16 142 31.42
## 7 58 0.13 12.83 200 44.25
## 5 51 0.11 11.28 251 55.53
## 8 46 0.10 10.18 297 65.71
## 4 38 0.08 8.41 335 74.12
## 9 35 0.08 7.74 370 81.86
## 2 29 0.06 6.42 399 88.27
## 10 15 0.03 3.32 414 91.59
## 11 15 0.03 3.32 429 94.91
## 6 14 0.03 3.10 443 98.01
## 13 5 0.01 1.11 448 99.12
## 12 4 0.01 0.88 452 100.00
barplot(height = tabla_frecuencia.SIS$f,
names.arg = tabla_frecuencia.SIS$Category,
main = "Frecuencia de Alumnos SISTEMAS por Semestre")
* CIVIL * Crear variable CIVIL
CIVIL <- subset(alumnos, Carrera == "CIVIL")
# CATEGORIZAR AL SEMESTRE, No hay operaciones artiméticas con Semestre
CIVIL$Semestre <- factor(CIVIL$Semestre)
tabla_frecuencia.CIVIL <- fdt_cat(CIVIL$Semestre)
tabla_frecuencia.CIVIL
## Category f rf rf(%) cf cf(%)
## 1 86 0.13 13.27 86 13.27
## 2 74 0.11 11.42 160 24.69
## 6 72 0.11 11.11 232 35.80
## 5 71 0.11 10.96 303 46.76
## 3 66 0.10 10.19 369 56.94
## 4 66 0.10 10.19 435 67.13
## 7 58 0.09 8.95 493 76.08
## 8 57 0.09 8.80 550 84.88
## 9 44 0.07 6.79 594 91.67
## 10 30 0.05 4.63 624 96.30
## 12 15 0.02 2.31 639 98.61
## 11 8 0.01 1.23 647 99.85
## 15 1 0.00 0.15 648 100.00
barplot(height = tabla_frecuencia.CIVIL$f,
names.arg = tabla_frecuencia.CIVIL$Category,
main = "Frecuencia de Alumnos CIVIL por Semestre")
## 10. Generar una descripción del caso de manera descriptiva Describir el caso de 80 a 100 palabras Claras, en secuencia y lo que ustedes describan acerca del caso