Nombre: Alumnos inscritos en periodo Septiembre 2020- Enero 2021 en escuela de educación superior.

Objetivo: Analizar un conjunto de datos académicos de alumnos para determinar valores estadísticos que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.

Cargar librerías

library(readr)

Cargar los datos

alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

head(alumnos)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS
tail(alumnos)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
## 5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
## 5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
## 5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
## 5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
## 5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

De los alumnos de primer semestre: Determinar lo siguiente:

  • Cuántos alumnos están en primer semestre por cada carrera. De todas las carreras hacer un resumen (una tabla) con las siguientes columnas con solo alumnos de primer semestre.

  • Crear varias variables una por cada carrea para almacenar el número de alumnos de primer semestre de cada carrera

  • Construir una tabla

Q.SISTEMAS <- nrow(subset(alumnos, Carrera == "SISTEMAS" & Semestre == 1))
Q.SISTEMAS
## [1] 78
Q.INFORMATICA <- nrow(subset(alumnos, Carrera == "INFORMATICA" & Semestre == 1))
Q.INFORMATICA
## [1] 30
Q.TIC <- nrow(subset(alumnos, Carrera == "TIC" & Semestre == 1))
Q.TIC
## [1] 17
Q.INDUSTRIAL <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" & Semestre == 1))
Q.INDUSTRIAL
## [1] 88
# carreras <- sort(unique(alumnos$Carrera))
carreras <- c("SISTEMAS", "INFORMATICA", "TIC", "INDUSTRIAL") 

tabla1 <- data.frame("Carreras" = carreras, "Inscritos 1er Semestre" = c(Q.SISTEMAS, Q.INFORMATICA, Q.TIC, Q.INDUSTRIAL) )

# Modificar los nobres de las colunas a tabla1
names(tabla1) <- c("Carreras","Inscritos")

tabla1
##      Carreras Inscritos
## 1    SISTEMAS        78
## 2 INFORMATICA        30
## 3         TIC        17
## 4  INDUSTRIAL        88
  • Generar una gráfica de barra
barplot(main = "Alumnos de primer semestre",
        xlab = "Carreras", ylab = "Cantidad",
  height = tabla1$Inscritos, names.arg = tabla1$Carreras)

total_alumnos <- sum(tabla1$Inscritos)
cat("Total de alumnos de primer semestre", total_alumnos)
## Total de alumnos de primer semestre 213
# barplot(tabla1$Inscritos, names.arg = tabla1$Carreras)

De todos los semestres y todas las carreras

  • Realizar una tabla que muestre el número de alumnos por carrera
QT.SISTEMAS <- nrow(subset(alumnos, Carrera == "SISTEMAS" ))
QT.SISTEMAS
## [1] 452
QT.INFORMATICA <- nrow(subset(alumnos, Carrera == "INFORMATICA" ))
QT.INFORMATICA
## [1] 101
QT.TIC <- nrow(subset(alumnos, Carrera == "TIC" ))
QT.TIC
## [1] 81
QT.INDUSTRIAL <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" ))
QT.INDUSTRIAL
## [1] 707
# carreras <- sort(unique(alumnos$Carrera))
carreras <- c("SISTEMAS", "INFORMATICA", "TIC", "INDUSTRIAL") 

tablaQT <- data.frame("Carreras" = carreras, "Inscritos" = c(QT.SISTEMAS, QT.INFORMATICA, QT.TIC, QT.INDUSTRIAL) )

# Modificar los nobres de las colunas a tabla1
names(tablaQT) <- c("Carreras","Inscritos")

tablaQT
##      Carreras Inscritos
## 1    SISTEMAS       452
## 2 INFORMATICA       101
## 3         TIC        81
## 4  INDUSTRIAL       707
  • Realizar un gráfico de barra de las carreras en función de la cantidad de alumnos de todos los semestres para visualizar quien tiene MÁS o MENOS alumnos.
barplot(main = "Alumnos inscritos",
        xlab = "Carreras", ylab = "Cantidad",
  height = tablaQT$Inscritos, names.arg = tabla1$Carreras)

total_alumnos <- sum(tablaQT$Inscritos)
cat("Total de alumnos de primer semestre", total_alumnos)
## Total de alumnos de primer semestre 1341
# barplot(tabla1$Inscritos, names.arg = tabla1$Carreras)

Determinar los promedios de los alumnos de todas las carreras únicamente de los estudiantes que SI tienen historia,

  • Los alumnos que están inscritos a partir del segundo semestre en adelante.
  • Realizar una tabla
SISTEMAS <- subset(alumnos, Carrera == "SISTEMAS" & Semestre > 1)
# SISTEMAS

INFORMATICA <- subset(alumnos, Carrera == "INFORMATICA" & Semestre > 1)
# INFORMATICA

TIC <- subset(alumnos, Carrera == "TIC" & Semestre > 1)
# TIC

INDUSTRIAL <- subset(alumnos, Carrera == "INDUSTRIAL" & Semestre > 1)
# INDUSTRIAL

prom.SISTEMAS <- mean(SISTEMAS$Promedio)
prom.INFORMATICA <- mean(INFORMATICA$Promedio)
prom.TIC <- mean(TIC$Promedio)
prom.INDUSTRIAL <- mean(INDUSTRIAL$Promedio)


# prom.SISTEMAS ; prom.INFORMATICA; prom.TIC; prom.INDUSTRIAL

carreras <- c("SISTEMAS", "INFORMATICA", "TIC", "INDUSTRIAL") 
tabla_promedios <- data.frame("Carreras" = carreras, "Promedios" = c(prom.SISTEMAS, prom.INFORMATICA, prom.TIC, prom.INDUSTRIAL))
tabla_promedios
##      Carreras Promedios
## 1    SISTEMAS  85.67495
## 2 INFORMATICA  86.26577
## 3         TIC  84.31719
## 4  INDUSTRIAL  84.74268

Realizar un diagrama boxplot() (diagrama de caja) de los promedios de cada alumno en función de su carrera.

  • Primero solo la tabla de promedios
  • Formula: Promedios ~ Carreras
boxplot(Promedios ~ Carreras, tabla_promedios)

  • Segundo Tods los promedios de todos los alumnos.
  • Formula: Promedios ~ Carreras
boxplot(Promedio ~ Carrera, 
        subset(alumnos, Semestre > 1),
        las=2)

Interpretación

Va texto libre 70 100 palabras