Alumnos inscritos en periodo Septiembre 2020- Enero 2021 en escuela de educación superior

Objetivo: Analizar un conjunto de datos académicos de alumnos para determinar valores estadísticos que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.

Cargar librerías

library(readr)

Cargar los datos a Utilizar

alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

Visualizar Primeros Registros

head(alumnos)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS

Vizualizar Ultimos Registros

tail(alumnos)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
## 5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
## 5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
## 5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
## 5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
## 5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

De los alumnos de primer semestre: Determinar lo siguiente:

1.- Cuántos alumnos están en primer semestre por cada carrera. De todas las carreras hacer un resumen (una tabla) con las siguientes columnas con solo alumnos de primer semestre.

2.- Crear varias variables una por cada carrea para almacenar el número de alumnos de primer semestre de cada carrera

3.- Construir una tabla

Guardar en variable los alumnos que sean de sistemas y sean del semestre 1

Q.SISTEMAS <- nrow(subset(alumnos, Carrera == "SISTEMAS" & Semestre == 1))
Q.SISTEMAS
## [1] 78

Guardar en variable los alumnos que sean de informatica y sean del semestre 1

Q.INFORMATICA <- nrow(subset(alumnos, Carrera == "INFORMATICA" & Semestre == 1))
Q.INFORMATICA
## [1] 30

Guardar en variable los alumnos que sean de TiC y sean del semestre 1

Q.TIC <- nrow(subset(alumnos, Carrera == "TIC" & Semestre == 1))
Q.TIC
## [1] 17

Guardar en variable los alumnos que sean de industrial y sean del semestre 1

Q.INDUSTRIAL <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" & Semestre == 1))
Q.INDUSTRIAL
## [1] 88

Guardar en variable los alumnos que sean de arquitectura y sean del semestre 1

Q.Arquitectura <- nrow(subset(alumnos, Carrera == "ARQUITECTURA" & Semestre == 1))
Q.Arquitectura
## [1] 128

Guardar en variable los alumnos que sean de bioquimica y sean del semestre 1

Q.Bioquimica <- nrow(subset(alumnos, Carrera == "BIOQUIMICA" & Semestre == 1))
Q.Bioquimica
## [1] 84

Guardar en variable los alumnos que sean de civil y sean del semestre 1

Q.Civil <- nrow(subset(alumnos, Carrera == "CIVIL" & Semestre == 1))
Q.Civil
## [1] 86

Guardar en variable los alumnos que sean de electrica y sean del semestre 1

Q.Electrica <- nrow(subset(alumnos, Carrera == "ELECTRICA" & Semestre == 1))
Q.Electrica
## [1] 77

Guardar en variable los alumnos que sean de electronica y sean del semestre 1

Q.Electronica <- nrow(subset(alumnos, Carrera == "ELECTRONICA" & Semestre == 1))
Q.Electronica
## [1] 36

Guardar en variable los alumnos que sean de Gestion empresarial y sean del semestre 1

Q.Ges <- nrow(subset(alumnos, Carrera == "GESTION EMPRESARIAL" & Semestre == 1))
Q.Ges
## [1] 89

Guardar en variable los alumnos que sean de mecanica y sean del semestre 1

Q.mec <- nrow(subset(alumnos, Carrera == "MECANICA" & Semestre == 1))
Q.mec
## [1] 76

Guardar en variable los alumnos que sean de mecatronica y sean del semestre 1

Q.mecatronica <- nrow(subset(alumnos, Carrera == "MECATRONICA" & Semestre == 1))
Q.mecatronica
## [1] 70

Guardar en variable los alumnos que sean de quimica y sean del semestre 1

Q.quimica <- nrow(subset(alumnos, Carrera == "QUIMICA" & Semestre == 1))
Q.quimica
## [1] 89

Crear una tabla con las carreras y el num de inscritos

carreras <- c("SIS", "INF", "TIC", "IND","MEC","ARQ","MECT", "BIO", "QUI","ELE","ECA","GES", "CIV") 

tabla1 <- data.frame("Carreras" = carreras, "Inscritos 1er Semestre" = c(Q.SISTEMAS, Q.INFORMATICA, Q.TIC, Q.INDUSTRIAL, Q.mec, Q.Arquitectura, Q.mecatronica, Q.Bioquimica, Q.quimica, Q.Electrica, Q.Electronica, Q.Ges, Q.Civil) )

tabla1
##    Carreras Inscritos.1er.Semestre
## 1       SIS                     78
## 2       INF                     30
## 3       TIC                     17
## 4       IND                     88
## 5       MEC                     76
## 6       ARQ                    128
## 7      MECT                     70
## 8       BIO                     84
## 9       QUI                     89
## 10      ELE                     77
## 11      ECA                     36
## 12      GES                     89
## 13      CIV                     86

Generar una Grafica de Barra

barplot(height= tabla1$Inscritos, names.arg = tabla1$Carreras, main = "Numero de Alumnos Incritos por carrera", xlab = "Carreras", ylab = "Num de alumnos", col = c("red"))

Carreras

total_al <- sum(tabla1$Inscritos)
cat("Total alumnos de primer semestre ", total_al)
## Total alumnos de primer semestre  948

De todos los semestres y todas las carreras

Realizar una tabla que muestre el numero de alumnos por carrera

Guardar en variable los alumnos que sean de sistemas

Qt.SISTEMAS <- nrow(subset(alumnos, Carrera == "SISTEMAS" ))
Qt.SISTEMAS
## [1] 452

Guardar en variable los alumnos que sean de informatica

Qt.INFORMATICA <- nrow(subset(alumnos, Carrera == "INFORMATICA" ))
Qt.INFORMATICA
## [1] 101

Guardar en variable los alumnos que sean de TiC

Qt.TIC <- nrow(subset(alumnos, Carrera == "TIC"))
Qt.TIC
## [1] 81

Guardar en variable los alumnos que sean de industrial

Qt.INDUSTRIAL <- nrow(subset(alumnos, Carrera == "INDUSTRIAL"))
Qt.INDUSTRIAL
## [1] 707

Guardar en variable los alumnos que sean de arquitectura

Qt.Arquitectura <- nrow(subset(alumnos, Carrera == "ARQUITECTURA"))
Qt.Arquitectura
## [1] 675

Guardar en variable los alumnos que sean de bioquimica

Qt.Bioquimica <- nrow(subset(alumnos, Carrera == "BIOQUIMICA"))
Qt.Bioquimica
## [1] 441

Guardar en variable los alumnos que sean de civil

Qt.Civil <- nrow(subset(alumnos, Carrera == "CIVIL"))
Qt.Civil
## [1] 648

Guardar en variable los alumnos que sean de electrica

Qt.Electrica <- nrow(subset(alumnos, Carrera == "ELECTRICA" ))
Qt.Electrica
## [1] 280

Guardar en variable los alumnos que sean de electronica

Qt.Electronica <- nrow(subset(alumnos, Carrera == "ELECTRONICA" ))
Qt.Electronica
## [1] 161

Guardar en variable los alumnos que sean de Gestion empresarial

Qt.Ges <- nrow(subset(alumnos, Carrera == "GESTION EMPRESARIAL"))
Qt.Ges
## [1] 585

Guardar en variable los alumnos que sean de Gestion mecanica

Qt.mec <- nrow(subset(alumnos, Carrera == "MECANICA" ))
Qt.mec
## [1] 301

Guardar en variable los alumnos que sean de Gestion mecatronica

Qt.mecatronica <- nrow(subset(alumnos, Carrera == "MECATRONICA" ))
Qt.mecatronica
## [1] 432

Guardar en variable los alumnos que sean de Gestion quimica

Qt.quimica <- nrow(subset(alumnos, Carrera == "QUIMICA"))
Qt.quimica
## [1] 568

Crear una tabla con las carreras y el num de inscritos

carreras2 <- c("SISTEMAS", "INFORAMTICA", "TIC", "INDUSTRIAL","MECANICA","ARQUITECTURA","MECATRONICA", "BIOQUIMICA", "QUIMICA","ELECTRICA","ELECTRONICA","GESTION EMPRESARIAL", "CIVIL") 

tablaQT <- data.frame("Carreras" = carreras2, "Inscritos" = c(Qt.SISTEMAS, Qt.INFORMATICA, Qt.TIC, Qt.INDUSTRIAL, Qt.mec, Qt.Arquitectura, Qt.mecatronica, Qt.Bioquimica, Qt.quimica, Qt.Electrica, Qt.Electronica, Qt.Ges, Qt.Civil) )

#Modificar los nombres de las columnas a tabla1
names(tablaQT) <- c("Carreras","Inscritos")


tablaQT
##               Carreras Inscritos
## 1             SISTEMAS       452
## 2          INFORAMTICA       101
## 3                  TIC        81
## 4           INDUSTRIAL       707
## 5             MECANICA       301
## 6         ARQUITECTURA       675
## 7          MECATRONICA       432
## 8           BIOQUIMICA       441
## 9              QUIMICA       568
## 10           ELECTRICA       280
## 11         ELECTRONICA       161
## 12 GESTION EMPRESARIAL       585
## 13               CIVIL       648

Realizar un grafico de barra de las carreras en funcion de la cantidad de alumnos de todos los semestres para visualizar quien tiene mas o menos alumnos

Generar una Grafica de Barra

barplot(height= tablaQT$Inscritos, names.arg = tabla1$Carreras, main = "Alumnos Incritos ", xlab = "Carreras", ylab = "Cantidad", col = c("blue"))

total_alumnos <- sum(tablaQT$Inscritos)
cat("Total de alumnos de primer semestre",total_alumnos)
## Total de alumnos de primer semestre 5432

Determinar los promedios de los alumnos de todas las carreras unicamente de los estudiantes que si tienen historia

Los alumnos que estan inscritos a partir del segundo semestre en adelante

REalizar una tabla

Guardar en variable los datos de los alumnos de sistemas y sean de semestres superior a 1

Qh.SISTEMAS <- subset(alumnos, Carrera == "SISTEMAS" & Semestre > 1)

Guardar en variable los datos de los alumnos de informatica y sean de semestres superior a 1

Qh.INFORMATICA <- subset(alumnos, Carrera == "INFORMATICA" & Semestre > 1)

Guardar en variable los datos de los alumnos de TIC y sean de semestres superior a 1

Qh.TIC <- subset(alumnos, Carrera == "TIC" & Semestre > 1)

Guardar en variable los datos de los alumnos de Industrial y sean de semestres superior a 1

Qh.INDUSTRIAL <- subset(alumnos, Carrera == "INDUSTRIAL" & Semestre > 1)

Guardar en variable los datos de los alumnos de arquitectura y sean de semestres superior a 1

Qh.Arquitectura <- subset(alumnos, Carrera == "ARQUITECTURA" & Semestre > 1)

Guardar en variable los datos de los alumnos de Bioquimica y sean de semestres superior a 1

Qh.Bioquimica <- subset(alumnos, Carrera == "BIOQUIMICA" & Semestre > 1)

Guardar en variable los datos de los alumnos de civil y sean de semestres superior a 1

Qh.Civil <- subset(alumnos, Carrera == "CIVIL" & Semestre > 1)

Guardar en variable los datos de los alumnos de electrica y sean de semestres superior a 1

Qh.Electrica <- subset(alumnos, Carrera == "ELECTRICA" & Semestre > 1)

Guardar en variable los datos de los alumnos de electronica y sean de semestres superior a 1

Qh.Electronica <- subset(alumnos, Carrera == "ELECTRONICA" & Semestre > 1)

Guardar en variable los datos de los alumnos de gestion y sean de semestres superior a 1

Qh.Ges <- subset(alumnos, Carrera == "GESTION EMPRESARIAL" & Semestre > 1)

Guardar en variable los datos de los alumnos de Mecanica y sean de semestres superior a 1

Qh.mec <- subset(alumnos, Carrera == "MECANICA" & Semestre > 1)

Guardar en variable los datos de los alumnos de mecatronica y sean de semestres superior a 1

Qh.mecatronica <- subset(alumnos, Carrera == "MECATRONICA" & Semestre > 1)

Guardar en variable los datos de los alumnos de quimica y sean de semestres superior a 1

Qh.quimica <- subset(alumnos, Carrera == "QUIMICA" & Semestre > 1)
prom.SISTEMAS <- mean(Qh.SISTEMAS$Promedio)
prom.INFORMATICA <- mean(Qh.INFORMATICA$Promedio)
prom.TIC <- mean(Qh.TIC$Promedio)
prom.INDUSTRIAL <- mean(Qh.INDUSTRIAL$Promedio)
prom.mec <- mean(Qh.mec$Promedio)
prom.Arquitectura <- mean(Qh.Arquitectura$Promedio)
prom.mecatronica <- mean(Qh.mecatronica$Promedio)
prom.Bioquimica <- mean(Qh.Bioquimica$Promedio)
prom.quimica <- mean(Qh.quimica$Promedio)
prom.Electrica <- mean(Qh.Electrica$Promedio)
prom.Electronica <- mean(Qh.Electronica$Promedio)
prom.Ges <- mean(Qh.Ges$Promedio)
prom.Civil <- mean(Qh.Civil$Promedio)

Crear una tabla con las carreras y el num de inscritos

carreras3 <- c("SISTEMAS", "INFORAMTICA", "TIC", "INDUSTRIAL","MECANICA","ARQUITECTURA","MECATRONICA", "BIOQUIMICA", "QUIMICA","ELECTRICA","ELECTRONICA","GESTION EMPRESARIAL", "CIVIL") 

tablaPromedio <- data.frame("Carreras" = carreras3, "Promedios" = c(prom.SISTEMAS, prom.INFORMATICA, prom.TIC, prom.INDUSTRIAL, prom.mec, prom.Arquitectura, prom.mecatronica, prom.Bioquimica, prom.quimica, prom.Electrica, prom.Electronica, prom.Ges, prom.Civil) )


tablaPromedio
##               Carreras Promedios
## 1             SISTEMAS  85.67495
## 2          INFORAMTICA  86.26577
## 3                  TIC  84.31719
## 4           INDUSTRIAL  84.74268
## 5             MECANICA  82.58467
## 6         ARQUITECTURA  86.46481
## 7          MECATRONICA  84.45948
## 8           BIOQUIMICA  84.68143
## 9              QUIMICA  86.05215
## 10           ELECTRICA  83.77305
## 11         ELECTRONICA  86.65720
## 12 GESTION EMPRESARIAL  87.49290
## 13               CIVIL  84.28100

Realizar un diagrama boxplot() de los promedios de cada alumno en funcion de su carrera

Primero sola la tabla de promedios

Formula Promesio~ carreras

boxplot(Promedios ~ Carreras , tablaPromedio)

Segundo todos los promedios de todos los alumnos

Formula promedios ~ Carrera,

boxplot(Promedio ~ Carrera , subset(alumnos, Semestre>1), las=2)


Interpretacion

De acuerdo con la informacion de los datos podemos observar que tenemos 5929 observaciones y 7 variables, las vaiables de interes son el semestre, promedio y carrera,en la grafica de barra podemos interpretar de una manera comoda la informacion a travez de el eje x y y para poder hacer compraciones entre variables para eso se uso el comando boxplot, de los alumnos de primer semestre, la carrera con mas alumnos incritos es la de Industrial y la de menor cantidad es la de TICS, y en forma general la carrera que mas alumnos tiene es la de arquitectura y la de menor TICS en cuanto a los promedios de los alumnos que no son de primer semestre es decir que cuentan con historial academico, el mayor promedio lo tiene la carrera de arquitectura con una media de 86.46.