Nombre: Alumnos inscritos en periodo Septiembre 2020- Enero 2021 en escuela de educación superior.

Objetivo: Analizar un conjunto de datos académicos de alumnos para determinar valores estadísticos que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.

Cargar librerías

library(readr)

Cargar los datos desde GitHub

alumnosITD <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

head(alumnosITD)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS

Necesidades.

De los alumnos de primer semestre determinar lo siguiente:

Cuántos alumnos están en primer semestre por cada carrera. De todas las carreras hacer un resumen (una tabla) con las siguientes columnas con solo alumnos de primer semestre.

Crear varias variables una por cada carrea para almacenar el número de alumnos de primer semestre de cada carrera

Construir una tabla

Q.ADMINISTRACION <- nrow(subset(alumnosITD, Carrera == "ADMINISTRACION" & Semestre == 1))
Q.ARQUITECTURA <- nrow(subset(alumnosITD, Carrera == "ARQUITECTURA" & Semestre == 1))
Q.BIOQUIMICA <- nrow(subset(alumnosITD, Carrera == "BIOQUIMICA" & Semestre == 1))
Q.CIVIL <- nrow(subset(alumnosITD, Carrera == "CIVIL" & Semestre == 1))
Q.ELECTRICA <- nrow(subset(alumnosITD, Carrera == "ELECTRICA" & Semestre == 1))
Q.ELECTRONICA <- nrow(subset(alumnosITD, Carrera == "ELECTRONICA" & Semestre == 1))
Q.GESTION <- nrow(subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" & Semestre == 1))
Q.INDUSTRIAL <- nrow(subset(alumnosITD, Carrera == "INDUSTRIAL" & Semestre == 1))
Q.MECATRONICA <- nrow(subset(alumnosITD, Carrera == "MECATRONICA" & Semestre == 1))
Q.INFORMATICA <- nrow(subset(alumnosITD, Carrera == "INFORMATICA" & Semestre == 1))
Q.QUIMICA <- nrow(subset(alumnosITD, Carrera == "QUIMICA" & Semestre == 1))
Q.SISTEMAS <- nrow(subset(alumnosITD, Carrera == "SISTEMAS" & Semestre == 1))
Q.TIC <- nrow(subset(alumnosITD, Carrera == "TIC" & Semestre == 1))
Q.MECANICA <- nrow(subset(alumnosITD, Carrera == "MECANICA" & Semestre == 1))

Carreras <- c("ADMINISTRACION","ARQUITECTURA","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA",
              "GESTION EMPRESARIAL","INDUSTRIAL","MECATRONICA","INFORMATICA","QUIMICA","SISTEMAS","TIC","MECANICA")
Tabla_Semestre1 <- data.frame("Carreras" = Carreras, "Inscritos 1er Semestre" = c(Q.ADMINISTRACION,Q.ARQUITECTURA,Q.BIOQUIMICA,Q.CIVIL,Q.ELECTRICA,Q.ELECTRONICA,
                                                                                  Q.GESTION,Q.INDUSTRIAL,Q.MECATRONICA,Q.INFORMATICA,Q.QUIMICA,Q.SISTEMAS,Q.TIC,Q.MECANICA))
names(Tabla_Semestre1) <- c("Carrera","Inscritos")
Total_Semestre1 <- sum(Tabla_Semestre1$Inscritos)
Tabla1 <- data.frame("Carrera"="TOTAL", "Inscritos"=Total_Semestre1)
Tabla_Semestre1 <- rbind(Tabla_Semestre1,Tabla1)
Tabla_Semestre1
##                Carrera Inscritos
## 1       ADMINISTRACION        83
## 2         ARQUITECTURA       128
## 3           BIOQUIMICA        84
## 4                CIVIL        86
## 5            ELECTRICA        77
## 6          ELECTRONICA        36
## 7  GESTION EMPRESARIAL        89
## 8           INDUSTRIAL        88
## 9          MECATRONICA        70
## 10         INFORMATICA        30
## 11             QUIMICA        89
## 12            SISTEMAS        78
## 13                 TIC        17
## 14            MECANICA        76
## 15               TOTAL      1031

Grafica de Barras para alumnos de primer semestre

Tabla_Semestre1 <- Tabla_Semestre1[-15, ]
barplot(main = "Alumnos de primer semestre",ylab = "Cantidad",
  height = Tabla_Semestre1$Inscritos, names.arg = Tabla_Semestre1$Carrera, las=2)

De todos los semestres y todas las carreras

TQ.ADMINISTRACION <- nrow(subset(alumnosITD, Carrera == "ADMINISTRACION"))
TQ.ARQUITECTURA <- nrow(subset(alumnosITD, Carrera == "ARQUITECTURA" ))
TQ.BIOQUIMICA <- nrow(subset(alumnosITD, Carrera == "BIOQUIMICA" ))
TQ.CIVIL <- nrow(subset(alumnosITD, Carrera == "CIVIL" ))
TQ.ELECTRICA <- nrow(subset(alumnosITD, Carrera == "ELECTRICA" ))
TQ.ELECTRONICA <- nrow(subset(alumnosITD, Carrera == "ELECTRONICA" ))
TQ.GESTION <- nrow(subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" ))
TQ.INDUSTRIAL <- nrow(subset(alumnosITD, Carrera == "INDUSTRIAL" ))
TQ.MECATRONICA <- nrow(subset(alumnosITD, Carrera == "MECATRONICA" ))
TQ.INFORMATICA <- nrow(subset(alumnosITD, Carrera == "INFORMATICA" ))
TQ.QUIMICA <- nrow(subset(alumnosITD, Carrera == "QUIMICA" ))
TQ.SISTEMAS <- nrow(subset(alumnosITD, Carrera == "SISTEMAS" ))
TQ.TIC <- nrow(subset(alumnosITD, Carrera == "TIC" ))
TQ.MECANICA <- nrow(subset(alumnosITD, Carrera == "MECANICA" ))

Carreras <- c("ADMINISTRACION","ARQUITECTURA","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA",
              "GESTION EMPRESARIAL","INDUSTRIAL","MECATRONICA","INFORMATICA","QUIMICA","SISTEMAS","TIC","MECANICA")
Tabla_Semestres <- data.frame("Carreras" = Carreras, "Inscritos 1er Semestre" = c(TQ.ADMINISTRACION,TQ.ARQUITECTURA,TQ.BIOQUIMICA,TQ.CIVIL,TQ.ELECTRICA,TQ.ELECTRONICA,TQ.GESTION,TQ.INDUSTRIAL,
                                                                                  TQ.MECATRONICA,TQ.INFORMATICA,TQ.QUIMICA,TQ.SISTEMAS,TQ.TIC,TQ.MECANICA))
names(Tabla_Semestres) <- c("Carrera","Inscritos")
Total_Semestres <- sum(Tabla_Semestres$Inscritos)
Tabla2 <- data.frame("Carrera"="TOTAL", "Inscritos"=Total_Semestres)
Tabla_Semestres <- rbind(Tabla_Semestres,Tabla2)
Tabla_Semestres
##                Carrera Inscritos
## 1       ADMINISTRACION       497
## 2         ARQUITECTURA       675
## 3           BIOQUIMICA       441
## 4                CIVIL       648
## 5            ELECTRICA       280
## 6          ELECTRONICA       161
## 7  GESTION EMPRESARIAL       585
## 8           INDUSTRIAL       707
## 9          MECATRONICA       432
## 10         INFORMATICA       101
## 11             QUIMICA       568
## 12            SISTEMAS       452
## 13                 TIC        81
## 14            MECANICA       301
## 15               TOTAL      5929

Grafica de Barras para alumnos de todas las carreras y todos lo semestres

Tabla_Semestres <- Tabla_Semestres[-15, ]
barplot(main = "Alumnos de todos los semestres y todas las carreras",ylab = "Cantidad",
  height = Tabla_Semestres$Inscritos, names.arg = Tabla_Semestres$Carrera, las=2)

## Tabla de promedios de alumnos de todas las carreras. ### Solo de aquellos que tiene historial, es decir, segundo semestre en adelante.

ADMINISTRACION <- subset(alumnosITD, Carrera == "ADMINISTRACION" & Semestre > 1)
ARQUITECTURA <- subset(alumnosITD, Carrera == "ARQUITECTURA" & Semestre > 1)
BIOQUIMICA <- subset(alumnosITD, Carrera == "BIOQUIMICA" & Semestre > 1)
CIVIL <- subset(alumnosITD, Carrera == "CIVIL" & Semestre > 1)
ELECTRICA <- subset(alumnosITD, Carrera == "ELECTRICA" & Semestre>1)
ELECTRONICA <- subset(alumnosITD, Carrera == "ELECTRONICA" & Semestre>1)
GESTION <- subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" & Semestre>1)
INDUSTRIAL <- subset(alumnosITD, Carrera == "INDUSTRIAL" & Semestre>1)
MECATRONICA <- subset(alumnosITD, Carrera == "MECATRONICA" & Semestre>1)
INFORMATICA <- subset(alumnosITD, Carrera == "INFORMATICA" & Semestre>1)
QUIMICA <- subset(alumnosITD, Carrera == "QUIMICA" & Semestre>1)
SISTEMAS <- subset(alumnosITD, Carrera == "SISTEMAS" & Semestre>1)
TIC <- subset(alumnosITD, Carrera == "TIC" & Semestre>1)
MECANICA <- subset(alumnosITD, Carrera == "MECANICA" & Semestre>1)

P.ADMINISTRACION <- mean(ADMINISTRACION$Promedio)
P.ARQUITECTURA <- mean(ARQUITECTURA$Promedio)
P.BIOQUIMICA <- mean(BIOQUIMICA$Promedio)
P.CIVIL <- mean(CIVIL$Promedio)
P.ELECTRICA <- mean(ELECTRICA$Promedio)
P.ELECTRONICA <- mean(ELECTRONICA$Promedio)
P.GESTION <- mean(GESTION$Promedio)
P.INDUSTRIAL <- mean(INDUSTRIAL$Promedio)
P.MECATRONICA <- mean(MECATRONICA$Promedio)
P.INFORMATICA <- mean(INFORMATICA$Promedio)
P.QUIMICA <- mean(QUIMICA$Promedio)
P.SISTEMAS  <- mean(SISTEMAS$Promedio)
P.TIC  <- mean(TIC$Promedio)
P.MECANICA  <- mean(MECANICA$Promedio)

Carreras <- c("ADMINISTRACION","ARQUITECTURA","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA",
              "GESTION EMPRESARIAL","INDUSTRIAL","MECATRONICA","INFORMATICA","QUIMICA","SISTEMAS","TIC","MECANICA")
Tabla_Prom <- data.frame("Carreras" = Carreras, "Promedio General" = c(P.ADMINISTRACION,P.ARQUITECTURA,P.BIOQUIMICA,P.CIVIL,P.ELECTRICA,P.ELECTRONICA,
                                                                                  P.GESTION,P.INDUSTRIAL,P.MECATRONICA,P.INFORMATICA,P.QUIMICA,P.SISTEMAS,P.TIC,P.MECANICA))

Prom_Total <- sum(Tabla_Prom$Promedio.General)/14
Tabla3 <- data.frame("Carreras"="Promedio Total", "Promedio General"=Prom_Total)
Tabla_Prom <- rbind(Tabla_Prom,Tabla3)
Tabla_Prom
##               Carreras Promedio.General
## 1       ADMINISTRACION         89.44312
## 2         ARQUITECTURA         86.46481
## 3           BIOQUIMICA         84.68143
## 4                CIVIL         84.28100
## 5            ELECTRICA         83.77305
## 6          ELECTRONICA         86.65720
## 7  GESTION EMPRESARIAL         87.49290
## 8           INDUSTRIAL         84.74268
## 9          MECATRONICA         84.45948
## 10         INFORMATICA         86.26577
## 11             QUIMICA         86.05215
## 12            SISTEMAS         85.67495
## 13                 TIC         84.31719
## 14            MECANICA         82.58467
## 15      Promedio Total         85.49217

boxplot() de los promedios de cada alumno en función de su carrera.

Tabla_Prom <- Tabla_Prom[-15, ]
boxplot(Promedio.General ~ Carreras, Tabla_Prom, las=2)

boxplot(Promedio ~ Carrera, 
        subset(alumnosITD, Semestre > 1),
        las=2)

Promedio de los alumnos por semestre de cada una de las carreras

ADMINISTRACION

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_Administracion <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ADMINISTRACION <- subset(alumnosITD, Carrera == "ADMINISTRACION" & Semestre == x)
    P.ADMINISTRACION <- mean(ADMINISTRACION$Promedio)
    if(!is.nan(P.ADMINISTRACION)){
      
      Tabla_AdministracionTemp <- data.frame("Semestre"=x, "Promedio"= P.ADMINISTRACION)
      Tabla_Administracion <- rbind(Tabla_Administracion,Tabla_AdministracionTemp)
    }
  }
}
n <- nrow(Tabla_Administracion)
Prom_Total <- sum(Tabla_Administracion$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_Administracion <- rbind(Tabla_Administracion,Tabla3)
Tabla_Administracion
##          Semestre Promedio
## 1               2 90.46486
## 2               3 91.03355
## 3               4 88.55074
## 4               5 90.16712
## 5               6 88.33806
## 6               7 88.67369
## 7               8 88.46714
## 8               9 90.19174
## 9              10 88.48800
## 10             11 87.36417
## 11             12 83.65000
## 12 Promedio Total 88.67173

ARQUITECTURA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_ARQUITECTURA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ARQUITECTURA <- subset(alumnosITD, Carrera == "ARQUITECTURA" & Semestre == x)
    P.ARQUITECTURA <- mean(ARQUITECTURA$Promedio)
    if(!is.nan(P.ARQUITECTURA)){
      
      Tabla_ARQUITECTURATemp <- data.frame("Semestre"=x, "Promedio"= P.ARQUITECTURA)
      Tabla_ARQUITECTURA <- rbind(Tabla_ARQUITECTURA,Tabla_ARQUITECTURATemp)
    }
  }
}
n <- nrow(Tabla_ARQUITECTURA)
Prom_Total <- sum(Tabla_ARQUITECTURA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_ARQUITECTURA <- rbind(Tabla_ARQUITECTURA,Tabla3)
Tabla_ARQUITECTURA
##          Semestre Promedio
## 1               2 85.89126
## 2               3 87.53758
## 3               4 87.10419
## 4               5 88.17828
## 5               6 86.95047
## 6               7 85.93038
## 7               8 85.50350
## 8               9 87.24149
## 9              10 83.76613
## 10             11 83.31250
## 11             12 83.49818
## 12 Promedio Total 85.90127

BIOQUIMICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_BIOQUIMICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    BIOQUIMICA <- subset(alumnosITD, Carrera == "BIOQUIMICA" & Semestre == x)
    P.BIOQUIMICA <- mean(BIOQUIMICA$Promedio)
    if(!is.nan(P.BIOQUIMICA)){
      
      Tabla_BIOQUIMICATemp <- data.frame("Semestre"=x, "Promedio"= P.BIOQUIMICA)
      Tabla_BIOQUIMICA <- rbind(Tabla_BIOQUIMICA,Tabla_BIOQUIMICATemp)
    }
  }
}
n <- nrow(Tabla_BIOQUIMICA)
Prom_Total <- sum(Tabla_BIOQUIMICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_BIOQUIMICA <- rbind(Tabla_BIOQUIMICA,Tabla3)
Tabla_BIOQUIMICA
##          Semestre Promedio
## 1               2 87.03235
## 2               3 86.51385
## 3               4 83.66500
## 4               5 84.54766
## 5               6 83.74833
## 6               7 84.64236
## 7               8 81.83824
## 8               9 85.36368
## 9              10 82.16800
## 10             11 80.12091
## 11             12 79.35333
## 12             13 82.02000
## 13 Promedio Total 83.41781

CIVIL

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_CIVIL <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    CIVIL <- subset(alumnosITD, Carrera == "CIVIL" & Semestre == x)
    P.CIVIL <- mean(CIVIL$Promedio)
    if(!is.nan(P.CIVIL)){
      
      Tabla_CIVILTemp <- data.frame("Semestre"=x, "Promedio"= P.CIVIL)
      Tabla_CIVIL <- rbind(Tabla_CIVIL,Tabla_CIVILTemp)
    }
  }
}
n <- nrow(Tabla_CIVIL)
Prom_Total <- sum(Tabla_CIVIL$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_CIVIL <- rbind(Tabla_CIVIL,Tabla3)
Tabla_CIVIL
##          Semestre Promedio
## 1               2 87.26649
## 2               3 85.64424
## 3               4 83.32561
## 4               5 85.27732
## 5               6 83.75000
## 6               7 84.54276
## 7               8 83.67842
## 8               9 83.51045
## 9              10 80.51033
## 10             11 80.86375
## 11             12 79.01200
## 12             15 76.49000
## 13 Promedio Total 82.82261

ELECTRICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_ELECTRICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ELECTRICA <- subset(alumnosITD, Carrera == "ELECTRICA" & Semestre == x)
    P.ELECTRICA <- mean(ELECTRICA$Promedio)
    if(!is.nan(P.ELECTRICA)){
      
      Tabla_ELECTRICATemp <- data.frame("Semestre"=x, "Promedio"= P.ELECTRICA)
      Tabla_ELECTRICA <- rbind(Tabla_ELECTRICA,Tabla_ELECTRICATemp)
    }
  }
}
n <- nrow(Tabla_ELECTRICA)
Prom_Total <- sum(Tabla_ELECTRICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_AELECTRICA <- rbind(Tabla_ELECTRICA,Tabla3)
Tabla_ELECTRICA
##    Semestre Promedio
## 1         2 87.17000
## 2         3 84.17952
## 3         5 84.29556
## 4         6 82.05500
## 5         7 84.37370
## 6         8 84.07500
## 7         9 84.39714
## 8        10 82.55750
## 9        11 83.68933
## 10       12 80.41500
## 11       13 81.96000
## 12       14 80.70000
## 13       15 79.90333

ELECTRONICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_ELECTRONICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ELECTRONICA <- subset(alumnosITD, Carrera == "ELECTRONICA" & Semestre == x)
    P.ELECTRONICA <- mean(ELECTRONICA$Promedio)
    if(!is.nan(P.ELECTRONICA)){
      
      Tabla_ELECTRONICATemp <- data.frame("Semestre"=x, "Promedio"= P.ELECTRONICA)
      Tabla_ELECTRONICA <- rbind(Tabla_ELECTRONICA,Tabla_ELECTRONICATemp)
    }
  }
}
n <- nrow(Tabla_ELECTRONICA)
Prom_Total <- sum(Tabla_ELECTRONICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_ELECTRONICA <- rbind(Tabla_ELECTRONICA,Tabla3)
Tabla_ELECTRONICA
##         Semestre Promedio
## 1              3 88.69469
## 2              5 87.73692
## 3              6 81.65000
## 4              7 88.21667
## 5              8 86.33333
## 6              9 85.50591
## 7             10 80.62600
## 8             11 82.70500
## 9 Promedio Total 85.18356

GESTION EMPRESARIAL

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_GESTION <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    GESTION <- subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" & Semestre == x)
    P.GESTION <- mean(GESTION$Promedio)
    if(!is.nan(P.GESTION)){
      
      Tabla_GESTIONTemp <- data.frame("Semestre"=x, "Promedio"= P.GESTION)
      Tabla_GESTION <- rbind(Tabla_GESTION,Tabla_GESTIONTemp)
    }
  }
}
n <- nrow(Tabla_GESTION)
Prom_Total <- sum(Tabla_GESTION$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_GESTION <- rbind(Tabla_GESTION,Tabla3)
Tabla_GESTION
##          Semestre Promedio
## 1               2 89.59659
## 2               3 87.94932
## 3               4 85.48450
## 4               5 88.83075
## 5               6 86.37296
## 6               7 86.33448
## 7               8 87.84984
## 8               9 89.33187
## 9              10 85.33379
## 10             11 85.18188
## 11             12 85.91333
## 12             13 84.60000
## 13 Promedio Total 86.89828

INDUSTRIAL

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_INDUSTRIAL <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    INDUSTRIAL <- subset(alumnosITD, Carrera == "INDUSTRIAL" & Semestre == x)
    P.INDUSTRIAL <- mean(INDUSTRIAL$Promedio)
    if(!is.nan(P.INDUSTRIAL)){
      
      Tabla_INDUSTRIALTemp <- data.frame("Semestre"=x, "Promedio"= P.INDUSTRIAL)
      Tabla_INDUSTRIAL <- rbind(Tabla_INDUSTRIAL,Tabla_INDUSTRIALTemp)
    }
  }
}
n <- nrow(Tabla_INDUSTRIAL)
Prom_Total <- sum(Tabla_INDUSTRIAL$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_INDUSTRIAL <- rbind(Tabla_INDUSTRIAL,Tabla3)
Tabla_INDUSTRIAL
##          Semestre Promedio
## 1               2 86.37120
## 2               3 87.78000
## 3               4 83.03333
## 4               5 84.00878
## 5               6 83.18500
## 6               7 86.34286
## 7               8 83.60377
## 8               9 85.63237
## 9              10 81.20375
## 10             11 80.56125
## 11             12 83.10000
## 12             13 78.79000
## 13             14 80.30000
## 14 Promedio Total 83.37787

INFORMATICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_INFORMATICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    INFORMATICA <- subset(alumnosITD, Carrera == "INFORMATICA" & Semestre == x)
    P.INFORMATICA <- mean(INFORMATICA$Promedio)
    if(!is.nan(P.INFORMATICA)){
      
      Tabla_INFORMATICATemp <- data.frame("Semestre"=x, "Promedio"= P.INFORMATICA)
      Tabla_INFORMATICA <- rbind(Tabla_INFORMATICA,Tabla_INFORMATICATemp)
    }
  }
}
n <- nrow(Tabla_INFORMATICA)
Prom_Total <- sum(Tabla_INFORMATICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_INFORMATICA <- rbind(Tabla_INFORMATICA,Tabla3)
Tabla_INFORMATICA
##         Semestre Promedio
## 1              3 88.19261
## 2              4 89.56000
## 3              5 86.66357
## 4              7 84.97357
## 5              9 85.40077
## 6             11 82.80200
## 7             13 79.74000
## 8 Promedio Total 85.33322

MECANICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_MECANICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    MECANICA <- subset(alumnosITD, Carrera == "MECANICA" & Semestre == x)
    P.MECANICA <- mean(MECANICA$Promedio)
    if(!is.nan(P.MECANICA)){
      
      Tabla_MECANICATemp <- data.frame("Semestre"=x, "Promedio"= P.MECANICA)
      Tabla_MECANICA <- rbind(Tabla_MECANICA,Tabla_MECANICATemp)
    }
  }
}
n <- nrow(Tabla_MECANICA)
Prom_Total <- sum(Tabla_MECANICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_MECANICA <- rbind(Tabla_MECANICA,Tabla3)
Tabla_MECANICA
##          Semestre Promedio
## 1               3 83.43034
## 2               4 82.09500
## 3               5 82.09767
## 4               6 80.21667
## 5               7 83.28390
## 6               8 82.43929
## 7               9 84.68833
## 8              10 81.64182
## 9              11 81.19500
## 10             12 78.56000
## 11 Promedio Total 81.96480

MECATRONICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_MECATRONICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    MECATRONICA <- subset(alumnosITD, Carrera == "MECATRONICA" & Semestre == x)
    P.MECATRONICA <- mean(MECATRONICA$Promedio)
    if(!is.nan(P.MECATRONICA)){
      
      Tabla_MECATRONICATemp <- data.frame("Semestre"=x, "Promedio"= P.MECATRONICA)
      Tabla_MECATRONICA <- rbind(Tabla_MECATRONICA,Tabla_MECATRONICATemp)
    }
  }
}
n <- nrow(Tabla_MECATRONICA)
Prom_Total <- sum(Tabla_MECATRONICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_MECATRONICA<- rbind(Tabla_MECATRONICA,Tabla3)
Tabla_MECATRONICA
##          Semestre Promedio
## 1               2 84.82154
## 2               3 83.50672
## 3               4 84.74044
## 4               5 86.18594
## 5               6 84.06304
## 6               7 84.74018
## 7               8 82.37594
## 8               9 86.52357
## 9              10 82.12438
## 10             11 81.94750
## 11             12 79.56000
## 12 Promedio Total 83.68993

QUIMICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_QUIMICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    QUIMICA <- subset(alumnosITD, Carrera == "QUIMICA" & Semestre == x)
    P.QUIMICA <- mean(QUIMICA$Promedio)
    if(!is.nan(P.QUIMICA)){
      
      Tabla_QUIMICATemp <- data.frame("Semestre"=x, "Promedio"= P.QUIMICA)
      Tabla_QUIMICA <- rbind(Tabla_QUIMICA,Tabla_QUIMICATemp)
    }
  }
}
n <- nrow(Tabla_QUIMICA)
Prom_Total <- sum(Tabla_QUIMICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_QUIMICA <- rbind(Tabla_QUIMICA,Tabla3)
Tabla_QUIMICA
##          Semestre Promedio
## 1               2 88.84215
## 2               3 89.57727
## 3               4 82.30615
## 4               5 85.83877
## 5               6 83.26531
## 6               7 88.51397
## 7               8 83.11037
## 8               9 85.10316
## 9              10 82.12737
## 10             11 82.65250
## 11             12 79.89250
## 12             13 78.98000
## 13 Promedio Total 84.18413

SISTEMAS

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_SISTEMAS <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    SISTEMAS <- subset(alumnosITD, Carrera == "SISTEMAS" & Semestre == x)
    P.SISTEMAS <- mean(SISTEMAS$Promedio)
    if(!is.nan(P.SISTEMAS)){
      
      Tabla_SISTEMASTemp <- data.frame("Semestre"=x, "Promedio"= P.SISTEMAS)
      Tabla_SISTEMAS <- rbind(Tabla_SISTEMAS,Tabla_SISTEMASTemp)
    }
  }
}
n <- nrow(Tabla_SISTEMAS)
Prom_Total <- sum(Tabla_SISTEMAS$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_SISTEMAS <- rbind(Tabla_SISTEMAS,Tabla3)
Tabla_SISTEMAS
##          Semestre Promedio
## 1               2 82.65759
## 2               3 86.22266
## 3               4 84.42184
## 4               5 86.54863
## 5               6 85.75429
## 6               7 86.45397
## 7               8 85.21304
## 8               9 90.19143
## 9              10 82.57133
## 10             11 82.64200
## 11             12 81.41000
## 12             13 81.97400
## 13 Promedio Total 84.67173

TIC

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_TIC <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    TIC <- subset(alumnosITD, Carrera == "TIC" & Semestre == x)
    P.TIC <- mean(TIC$Promedio)
    if(!is.nan(P.TIC)){
      
      Tabla_TICTemp <- data.frame("Semestre"=x, "Promedio"= P.TIC)
      Tabla_TIC <- rbind(Tabla_TIC,Tabla_TICTemp)
    }
  }
}
n <- nrow(Tabla_TIC)
Prom_Total <- sum(Tabla_TIC$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_TIC <- rbind(Tabla_TIC,Tabla3)
Tabla_TIC
##         Semestre Promedio
## 1              3 84.17056
## 2              5 85.01500
## 3              7 82.29438
## 4              9 87.69000
## 5             11 83.79333
## 6 Promedio Total 84.59265

Realizar un diagrama boxplot() (diagrama de caja) (14 boxplots) de los

promedios de cada alumno en función de su carrera y de su semestre

ADMINISTRACION

Tabla_Administracion <- Tabla_Administracion[Tabla_Administracion$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_Administracion)

ARQUITECTURA

Tabla_ARQUITECTURA <- Tabla_ARQUITECTURA[Tabla_ARQUITECTURA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_ARQUITECTURA)

BIOQUIMICA

Tabla_BIOQUIMICA <- Tabla_BIOQUIMICA[Tabla_BIOQUIMICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_BIOQUIMICA)

CIVIL

Tabla_CIVIL <- Tabla_CIVIL[Tabla_CIVIL$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_CIVIL)

ELECTRICA

Tabla_ELECTRICA <- Tabla_ELECTRICA[Tabla_ELECTRICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_ELECTRICA)

ELECTRONICA

Tabla_ELECTRONICA <- Tabla_ELECTRONICA[Tabla_ELECTRONICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_ELECTRONICA)

GESTION EMPRESARIAL

Tabla_GESTION <- Tabla_GESTION[Tabla_GESTION$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_GESTION)

INDUSTRIAL

Tabla_INDUSTRIAL <- Tabla_INDUSTRIAL[Tabla_INDUSTRIAL$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_INDUSTRIAL)

INFORMATICA

Tabla_INFORMATICA <- Tabla_INFORMATICA[Tabla_INFORMATICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_INFORMATICA)

MECANICA

Tabla_MECANICA <- Tabla_MECANICA[Tabla_MECANICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_MECANICA)

MECATRONICA

Tabla_MECATRONICA<- Tabla_MECATRONICA[Tabla_MECATRONICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_MECATRONICA)

QUIMICA

Tabla_QUIMICA <- Tabla_QUIMICA[Tabla_QUIMICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_QUIMICA)

SISTEMAS

Tabla_SISTEMAS <- Tabla_SISTEMAS[Tabla_SISTEMAS$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_SISTEMAS)

TIC

Tabla_TIC <- Tabla_TIC[Tabla_TIC$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_TIC)

Interpretación del caso

En nuestro data frame tenemos un total de 5,929 observaciones y 7 variables de esas variables las más importantes para nuestro análisis son las de Semestre y Carrera, esto para poder distribuir y visualizar de una forma más cómoda la cantidad de alumnos que existen en cada una de las respectivas carreas y semestre.

Con la ayuda de las graficas de barra podemos interpretar a simple vista cual es la carrera que ocupa mas demanda o aloja a mas alumnos dentro del tecnológico, así también con los promedios, ver que carrera cuenta con un mejor promedio.

La carrera que tiene mayor cantidad de alumnos de primer semestre es Arquitectura y la de menor numero de estudiantes es TIC. En cuanto a todos los semestres Industrial tiene la mayor cantidad de estudiantes y TIC sigue siendo la menor.

En cuanto a un Top 3 de las carreras con mejor promedio general destacan las carreras de Administración, Gestión Empresarial y Electrónica.