Nombre: Alumnos inscritos en periodo Septiembre 2020- Enero 2021 en escuela de educación superior.

Objetivo: Analizar un conjunto de datos académicos de alumnos para determinar valores estadísticos que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.

Cargar librerías

library(readr)

Cargar los datos desde GitHub

alumnosITD <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

head(alumnosITD)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS

De los alumnos de primer semestre determinar lo siguiente:

Cuántos alumnos están en primer semestre por cada carrera. De todas las carreras hacer un resumen (una tabla) con las siguientes columnas con solo alumnos de primer semestre.

Crear varias variables una por cada carrea para almacenar el número de alumnos de primer semestre de cada carrera

Construir una tabla

Q.ADMINISTRACION <- nrow(subset(alumnosITD, Carrera == "ADMINISTRACION" & Semestre == 1))
Q.ARQUITECTURA <- nrow(subset(alumnosITD, Carrera == "ARQUITECTURA" & Semestre == 1))
Q.BIOQUIMICA <- nrow(subset(alumnosITD, Carrera == "BIOQUIMICA" & Semestre == 1))
Q.CIVIL <- nrow(subset(alumnosITD, Carrera == "CIVIL" & Semestre == 1))
Q.ELECTRICA <- nrow(subset(alumnosITD, Carrera == "ELECTRICA" & Semestre == 1))
Q.ELECTRONICA <- nrow(subset(alumnosITD, Carrera == "ELECTRONICA" & Semestre == 1))
Q.GESTION <- nrow(subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" & Semestre == 1))
Q.INDUSTRIAL <- nrow(subset(alumnosITD, Carrera == "INDUSTRIAL" & Semestre == 1))
Q.MECATRONICA <- nrow(subset(alumnosITD, Carrera == "MECATRONICA" & Semestre == 1))
Q.INFORMATICA <- nrow(subset(alumnosITD, Carrera == "INFORMATICA" & Semestre == 1))
Q.QUIMICA <- nrow(subset(alumnosITD, Carrera == "QUIMICA" & Semestre == 1))
Q.SISTEMAS <- nrow(subset(alumnosITD, Carrera == "SISTEMAS" & Semestre == 1))
Q.TIC <- nrow(subset(alumnosITD, Carrera == "TIC" & Semestre == 1))
Q.MECANICA <- nrow(subset(alumnosITD, Carrera == "MECANICA" & Semestre == 1))
Carreras <- c("ADMINISTRACION","ARQUITECTURA","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA", "GESTION EMPRESARIAL","INDUSTRIAL","MECATRONICA","INFORMATICA","QUIMICA","SISTEMAS","TIC","MECANICA")
Tabla_Semestre1 <- data.frame("Carreras" = Carreras, "Inscritos 1er Semestre" = c(Q.ADMINISTRACION,Q.ARQUITECTURA,Q.BIOQUIMICA,Q.CIVIL,Q.ELECTRICA,Q.ELECTRONICA,Q.GESTION,Q.INDUSTRIAL,Q.MECATRONICA,Q.INFORMATICA,Q.QUIMICA,Q.SISTEMAS,Q.TIC,Q.MECANICA))
names(Tabla_Semestre1) <- c("Carrera","Inscritos")
Total_Semestre1 <- sum(Tabla_Semestre1$Inscritos)
Tabla1 <- data.frame("Carrera"="TOTAL", "Inscritos"=Total_Semestre1)
Tabla_Semestre1 <- rbind(Tabla_Semestre1,Tabla1)
Tabla_Semestre1
##                Carrera Inscritos
## 1       ADMINISTRACION        83
## 2         ARQUITECTURA       128
## 3           BIOQUIMICA        84
## 4                CIVIL        86
## 5            ELECTRICA        77
## 6          ELECTRONICA        36
## 7  GESTION EMPRESARIAL        89
## 8           INDUSTRIAL        88
## 9          MECATRONICA        70
## 10         INFORMATICA        30
## 11             QUIMICA        89
## 12            SISTEMAS        78
## 13                 TIC        17
## 14            MECANICA        76
## 15               TOTAL      1031

Grafica de Barras para alumnos de primer semestre

Tabla_Semestre1 <- Tabla_Semestre1[-15, ]
barplot(main = "Alumnos de primer semestre",ylab = "Cantidad",
  height = Tabla_Semestre1$Inscritos, names.arg = Tabla_Semestre1$Carrera, las=2)

De todos los semestres y todas las carreras

TQ.ADMINISTRACION <- nrow(subset(alumnosITD, Carrera == "ADMINISTRACION"))
TQ.ARQUITECTURA <- nrow(subset(alumnosITD, Carrera == "ARQUITECTURA" ))
TQ.BIOQUIMICA <- nrow(subset(alumnosITD, Carrera == "BIOQUIMICA" ))
TQ.CIVIL <- nrow(subset(alumnosITD, Carrera == "CIVIL" ))
TQ.ELECTRICA <- nrow(subset(alumnosITD, Carrera == "ELECTRICA" ))
TQ.ELECTRONICA <- nrow(subset(alumnosITD, Carrera == "ELECTRONICA" ))
TQ.GESTION <- nrow(subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" ))
TQ.INDUSTRIAL <- nrow(subset(alumnosITD, Carrera == "INDUSTRIAL" ))
TQ.MECATRONICA <- nrow(subset(alumnosITD, Carrera == "MECATRONICA" ))
TQ.INFORMATICA <- nrow(subset(alumnosITD, Carrera == "INFORMATICA" ))
TQ.QUIMICA <- nrow(subset(alumnosITD, Carrera == "QUIMICA" ))
TQ.SISTEMAS <- nrow(subset(alumnosITD, Carrera == "SISTEMAS" ))
TQ.TIC <- nrow(subset(alumnosITD, Carrera == "TIC" ))
TQ.MECANICA <- nrow(subset(alumnosITD, Carrera == "MECANICA" ))
arreras <- c("ADMINISTRACION","ARQUITECTURA","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA",
              "GESTION EMPRESARIAL","INDUSTRIAL","MECATRONICA","INFORMATICA","QUIMICA","SISTEMAS","TIC","MECANICA")
Tabla_Semestres <- data.frame("Carreras" = Carreras, "Inscritos 1er Semestre" = c(TQ.ADMINISTRACION,TQ.ARQUITECTURA,TQ.BIOQUIMICA,TQ.CIVIL,TQ.ELECTRICA,TQ.ELECTRONICA,TQ.GESTION,TQ.INDUSTRIAL,TQ.MECATRONICA,TQ.INFORMATICA,TQ.QUIMICA,TQ.SISTEMAS,TQ.TIC,TQ.MECANICA))
names(Tabla_Semestres) <- c("Carrera","Inscritos")
Total_Semestres <- sum(Tabla_Semestres$Inscritos)
Tabla2 <- data.frame("Carrera"="TOTAL", "Inscritos"=Total_Semestres)
Tabla_Semestres <- rbind(Tabla_Semestres,Tabla2)
Tabla_Semestres
##                Carrera Inscritos
## 1       ADMINISTRACION       497
## 2         ARQUITECTURA       675
## 3           BIOQUIMICA       441
## 4                CIVIL       648
## 5            ELECTRICA       280
## 6          ELECTRONICA       161
## 7  GESTION EMPRESARIAL       585
## 8           INDUSTRIAL       707
## 9          MECATRONICA       432
## 10         INFORMATICA       101
## 11             QUIMICA       568
## 12            SISTEMAS       452
## 13                 TIC        81
## 14            MECANICA       301
## 15               TOTAL      5929

Grafica de Barras para alumnos de todas las carreras y todos lo semestres

Tabla_Semestres <- Tabla_Semestres[-15, ]
barplot(main = "Alumnos de todos los semestres y todas las carreras",ylab = "Cantidad",
  height = Tabla_Semestres$Inscritos, names.arg = Tabla_Semestres$Carrera, las=2)

### Tabla de promedios de alumnos de todas las carreras. ### Solo de aquellos que tiene historial, es decir, segundo semestre en adelante.

ADMINISTRACION <- subset(alumnosITD, Carrera == "ADMINISTRACION" & Semestre > 1)
ARQUITECTURA <- subset(alumnosITD, Carrera == "ARQUITECTURA" & Semestre > 1)
BIOQUIMICA <- subset(alumnosITD, Carrera == "BIOQUIMICA" & Semestre > 1)
CIVIL <- subset(alumnosITD, Carrera == "CIVIL" & Semestre > 1)
ELECTRICA <- subset(alumnosITD, Carrera == "ELECTRICA" & Semestre>1)
ELECTRONICA <- subset(alumnosITD, Carrera == "ELECTRONICA" & Semestre>1)
GESTION <- subset(alumnosITD, Carrera == "GESTION EMPRESARIAL" & Semestre>1)
INDUSTRIAL <- subset(alumnosITD, Carrera == "INDUSTRIAL" & Semestre>1)
MECATRONICA <- subset(alumnosITD, Carrera == "MECATRONICA" & Semestre>1)
INFORMATICA <- subset(alumnosITD, Carrera == "INFORMATICA" & Semestre>1)
QUIMICA <- subset(alumnosITD, Carrera == "QUIMICA" & Semestre>1)
SISTEMAS <- subset(alumnosITD, Carrera == "SISTEMAS" & Semestre>1)
TIC <- subset(alumnosITD, Carrera == "TIC" & Semestre>1)
MECANICA <- subset(alumnosITD, Carrera == "MECANICA" & Semestre>1)
P.ADMINISTRACION <- mean(ADMINISTRACION$Promedio)
P.ARQUITECTURA <- mean(ARQUITECTURA$Promedio)
P.BIOQUIMICA <- mean(BIOQUIMICA$Promedio)
P.CIVIL <- mean(CIVIL$Promedio)
P.ELECTRICA <- mean(ELECTRICA$Promedio)
P.ELECTRONICA <- mean(ELECTRONICA$Promedio)
P.GESTION <- mean(GESTION$Promedio)
P.INDUSTRIAL <- mean(INDUSTRIAL$Promedio)
P.MECATRONICA <- mean(MECATRONICA$Promedio)
P.INFORMATICA <- mean(INFORMATICA$Promedio)
P.QUIMICA <- mean(QUIMICA$Promedio)
P.SISTEMAS  <- mean(SISTEMAS$Promedio)
P.TIC  <- mean(TIC$Promedio)
P.MECANICA  <- mean(MECANICA$Promedio)
Carreras <- c("ADMINISTRACION","ARQUITECTURA","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA",
              "GESTION EMPRESARIAL","INDUSTRIAL","MECATRONICA","INFORMATICA","QUIMICA","SISTEMAS","TIC","MECANICA")
Tabla_Prom <- data.frame("Carreras" = Carreras, "Promedio General" = c(P.ADMINISTRACION,P.ARQUITECTURA,P.BIOQUIMICA,P.CIVIL,P.ELECTRICA,P.ELECTRONICA,
                                                                                  P.GESTION,P.INDUSTRIAL,P.MECATRONICA,P.INFORMATICA,P.QUIMICA,P.SISTEMAS,P.TIC,P.MECANICA))

Prom_Total <- sum(Tabla_Prom$Promedio.General)/14
Tabla3 <- data.frame("Carreras"="Promedio Total", "Promedio General"=Prom_Total)
Tabla_Prom <- rbind(Tabla_Prom,Tabla3)
Tabla_Prom
##               Carreras Promedio.General
## 1       ADMINISTRACION         89.44312
## 2         ARQUITECTURA         86.46481
## 3           BIOQUIMICA         84.68143
## 4                CIVIL         84.28100
## 5            ELECTRICA         83.77305
## 6          ELECTRONICA         86.65720
## 7  GESTION EMPRESARIAL         87.49290
## 8           INDUSTRIAL         84.74268
## 9          MECATRONICA         84.45948
## 10         INFORMATICA         86.26577
## 11             QUIMICA         86.05215
## 12            SISTEMAS         85.67495
## 13                 TIC         84.31719
## 14            MECANICA         82.58467
## 15      Promedio Total         85.49217

boxplot() de los promedios de cada alumno en función de su carrera.

Tabla_Prom <- Tabla_Prom[-15, ]
boxplot(Promedio.General ~ Carreras, Tabla_Prom, las=2)

boxplot(Promedio ~ Carrera, 
        subset(alumnosITD, Semestre > 1),
        las=2)

Promedio de los alumnos por semestre de cada una de las carreras

###ADMINISTRACION

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_Administracion <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ADMINISTRACION <- subset(alumnosITD, Carrera == "ADMINISTRACION" & Semestre == x)
    P.ADMINISTRACION <- mean(ADMINISTRACION$Promedio)
    if(!is.nan(P.ADMINISTRACION)){
      
      Tabla_AdministracionTemp <- data.frame("Semestre"=x, "Promedio"= P.ADMINISTRACION)
      Tabla_Administracion <- rbind(Tabla_Administracion,Tabla_AdministracionTemp)
    }
  }
}
n <- nrow(Tabla_Administracion)
Prom_Total <- sum(Tabla_Administracion$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_Administracion <- rbind(Tabla_Administracion,Tabla3)
Tabla_Administracion
##          Semestre Promedio
## 1               2 90.46486
## 2               3 91.03355
## 3               4 88.55074
## 4               5 90.16712
## 5               6 88.33806
## 6               7 88.67369
## 7               8 88.46714
## 8               9 90.19174
## 9              10 88.48800
## 10             11 87.36417
## 11             12 83.65000
## 12 Promedio Total 88.67173

BIOQUIMICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_BIOQUIMICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    BIOQUIMICA <- subset(alumnosITD, Carrera == "BIOQUIMICA" & Semestre == x)
    P.BIOQUIMICA <- mean(BIOQUIMICA$Promedio)
    if(!is.nan(P.BIOQUIMICA)){
      
      Tabla_BIOQUIMICATemp <- data.frame("Semestre"=x, "Promedio"= P.BIOQUIMICA)
      Tabla_BIOQUIMICA <- rbind(Tabla_BIOQUIMICA,Tabla_BIOQUIMICATemp)
    }
  }
}
n <- nrow(Tabla_BIOQUIMICA)
Prom_Total <- sum(Tabla_BIOQUIMICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_BIOQUIMICA <- rbind(Tabla_BIOQUIMICA,Tabla3)
Tabla_BIOQUIMICA
##          Semestre Promedio
## 1               2 87.03235
## 2               3 86.51385
## 3               4 83.66500
## 4               5 84.54766
## 5               6 83.74833
## 6               7 84.64236
## 7               8 81.83824
## 8               9 85.36368
## 9              10 82.16800
## 10             11 80.12091
## 11             12 79.35333
## 12             13 82.02000
## 13 Promedio Total 83.41781

ARQUITECTURA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_ARQUITECTURA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ARQUITECTURA <- subset(alumnosITD, Carrera == "ARQUITECTURA" & Semestre == x)
    P.ARQUITECTURA <- mean(ARQUITECTURA$Promedio)
    if(!is.nan(P.ARQUITECTURA)){
      
      Tabla_ARQUITECTURATemp <- data.frame("Semestre"=x, "Promedio"= P.ARQUITECTURA)
      Tabla_ARQUITECTURA <- rbind(Tabla_ARQUITECTURA,Tabla_ARQUITECTURATemp)
    }
  }
}
n <- nrow(Tabla_ARQUITECTURA)
Prom_Total <- sum(Tabla_ARQUITECTURA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_ARQUITECTURA <- rbind(Tabla_ARQUITECTURA,Tabla3)
Tabla_ARQUITECTURA
##          Semestre Promedio
## 1               2 85.89126
## 2               3 87.53758
## 3               4 87.10419
## 4               5 88.17828
## 5               6 86.95047
## 6               7 85.93038
## 7               8 85.50350
## 8               9 87.24149
## 9              10 83.76613
## 10             11 83.31250
## 11             12 83.49818
## 12 Promedio Total 85.90127

ELECTRICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_ELECTRICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ELECTRICA <- subset(alumnosITD, Carrera == "ELECTRICA" & Semestre == x)
    P.ELECTRICA <- mean(ELECTRICA$Promedio)
    if(!is.nan(P.ELECTRICA)){
      
      Tabla_ELECTRICATemp <- data.frame("Semestre"=x, "Promedio"= P.ELECTRICA)
      Tabla_ELECTRICA <- rbind(Tabla_ELECTRICA,Tabla_ELECTRICATemp)
    }
  }
}
n <- nrow(Tabla_ELECTRICA)
Prom_Total <- sum(Tabla_ELECTRICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_AELECTRICA <- rbind(Tabla_ELECTRICA,Tabla3)
Tabla_ELECTRICA
##    Semestre Promedio
## 1         2 87.17000
## 2         3 84.17952
## 3         5 84.29556
## 4         6 82.05500
## 5         7 84.37370
## 6         8 84.07500
## 7         9 84.39714
## 8        10 82.55750
## 9        11 83.68933
## 10       12 80.41500
## 11       13 81.96000
## 12       14 80.70000
## 13       15 79.90333

CIVIL

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_CIVIL <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    CIVIL <- subset(alumnosITD, Carrera == "CIVIL" & Semestre == x)
    P.CIVIL <- mean(CIVIL$Promedio)
    if(!is.nan(P.CIVIL)){
      
      Tabla_CIVILTemp <- data.frame("Semestre"=x, "Promedio"= P.CIVIL)
      Tabla_CIVIL <- rbind(Tabla_CIVIL,Tabla_CIVILTemp)
    }
  }
}
n <- nrow(Tabla_CIVIL)
Prom_Total <- sum(Tabla_CIVIL$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_CIVIL <- rbind(Tabla_CIVIL,Tabla3)
Tabla_CIVIL
##          Semestre Promedio
## 1               2 87.26649
## 2               3 85.64424
## 3               4 83.32561
## 4               5 85.27732
## 5               6 83.75000
## 6               7 84.54276
## 7               8 83.67842
## 8               9 83.51045
## 9              10 80.51033
## 10             11 80.86375
## 11             12 79.01200
## 12             15 76.49000
## 13 Promedio Total 82.82261

ELECTRONICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_ELECTRONICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    ELECTRONICA <- subset(alumnosITD, Carrera == "ELECTRONICA" & Semestre == x)
    P.ELECTRONICA <- mean(ELECTRONICA$Promedio)
    if(!is.nan(P.ELECTRONICA)){
      
      Tabla_ELECTRONICATemp <- data.frame("Semestre"=x, "Promedio"= P.ELECTRONICA)
      Tabla_ELECTRONICA <- rbind(Tabla_ELECTRONICA,Tabla_ELECTRONICATemp)
    }
  }
}
n <- nrow(Tabla_ELECTRONICA)
Prom_Total <- sum(Tabla_ELECTRONICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_ELECTRONICA <- rbind(Tabla_ELECTRONICA,Tabla3)
Tabla_ELECTRONICA
##         Semestre Promedio
## 1              3 88.69469
## 2              5 87.73692
## 3              6 81.65000
## 4              7 88.21667
## 5              8 86.33333
## 6              9 85.50591
## 7             10 80.62600
## 8             11 82.70500
## 9 Promedio Total 85.18356

INDUSTRIAL

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_INDUSTRIAL <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    INDUSTRIAL <- subset(alumnosITD, Carrera == "INDUSTRIAL" & Semestre == x)
    P.INDUSTRIAL <- mean(INDUSTRIAL$Promedio)
    if(!is.nan(P.INDUSTRIAL)){
      
      Tabla_INDUSTRIALTemp <- data.frame("Semestre"=x, "Promedio"= P.INDUSTRIAL)
      Tabla_INDUSTRIAL <- rbind(Tabla_INDUSTRIAL,Tabla_INDUSTRIALTemp)
    }
  }
}
n <- nrow(Tabla_INDUSTRIAL)
Prom_Total <- sum(Tabla_INDUSTRIAL$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_INDUSTRIAL <- rbind(Tabla_INDUSTRIAL,Tabla3)
Tabla_INDUSTRIAL
##          Semestre Promedio
## 1               2 86.37120
## 2               3 87.78000
## 3               4 83.03333
## 4               5 84.00878
## 5               6 83.18500
## 6               7 86.34286
## 7               8 83.60377
## 8               9 85.63237
## 9              10 81.20375
## 10             11 80.56125
## 11             12 83.10000
## 12             13 78.79000
## 13             14 80.30000
## 14 Promedio Total 83.37787

INFORMATICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_INFORMATICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    INFORMATICA <- subset(alumnosITD, Carrera == "INFORMATICA" & Semestre == x)
    P.INFORMATICA <- mean(INFORMATICA$Promedio)
    if(!is.nan(P.INFORMATICA)){
      
      Tabla_INFORMATICATemp <- data.frame("Semestre"=x, "Promedio"= P.INFORMATICA)
      Tabla_INFORMATICA <- rbind(Tabla_INFORMATICA,Tabla_INFORMATICATemp)
    }
  }
}
n <- nrow(Tabla_INFORMATICA)
Prom_Total <- sum(Tabla_INFORMATICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_INFORMATICA <- rbind(Tabla_INFORMATICA,Tabla3)
Tabla_INFORMATICA
##         Semestre Promedio
## 1              3 88.19261
## 2              4 89.56000
## 3              5 86.66357
## 4              7 84.97357
## 5              9 85.40077
## 6             11 82.80200
## 7             13 79.74000
## 8 Promedio Total 85.33322

MECATRONICA

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_MECATRONICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    MECATRONICA <- subset(alumnosITD, Carrera == "MECATRONICA" & Semestre == x)
    P.MECATRONICA <- mean(MECATRONICA$Promedio)
    if(!is.nan(P.MECATRONICA)){
      
      Tabla_MECATRONICATemp <- data.frame("Semestre"=x, "Promedio"= P.MECATRONICA)
      Tabla_MECATRONICA <- rbind(Tabla_MECATRONICA,Tabla_MECATRONICATemp)
    }
  }
}
n <- nrow(Tabla_MECATRONICA)
Prom_Total <- sum(Tabla_MECATRONICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_MECATRONICA<- rbind(Tabla_MECATRONICA,Tabla3)
Tabla_MECATRONICA
##          Semestre Promedio
## 1               2 84.82154
## 2               3 83.50672
## 3               4 84.74044
## 4               5 86.18594
## 5               6 84.06304
## 6               7 84.74018
## 7               8 82.37594
## 8               9 86.52357
## 9              10 82.12438
## 10             11 81.94750
## 11             12 79.56000
## 12 Promedio Total 83.68993

mecanica

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_MECANICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    MECANICA <- subset(alumnosITD, Carrera == "MECANICA" & Semestre == x)
    P.MECANICA <- mean(MECANICA$Promedio)
    if(!is.nan(P.MECANICA)){
      
      Tabla_MECANICATemp <- data.frame("Semestre"=x, "Promedio"= P.MECANICA)
      Tabla_MECANICA <- rbind(Tabla_MECANICA,Tabla_MECANICATemp)
    }
  }
}
n <- nrow(Tabla_MECANICA)
Prom_Total <- sum(Tabla_MECANICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_MECANICA <- rbind(Tabla_MECANICA,Tabla3)
Tabla_MECANICA
##          Semestre Promedio
## 1               3 83.43034
## 2               4 82.09500
## 3               5 82.09767
## 4               6 80.21667
## 5               7 83.28390
## 6               8 82.43929
## 7               9 84.68833
## 8              10 81.64182
## 9              11 81.19500
## 10             12 78.56000
## 11 Promedio Total 81.96480

Quimica

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_QUIMICA <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    QUIMICA <- subset(alumnosITD, Carrera == "QUIMICA" & Semestre == x)
    P.QUIMICA <- mean(QUIMICA$Promedio)
    if(!is.nan(P.QUIMICA)){
      
      Tabla_QUIMICATemp <- data.frame("Semestre"=x, "Promedio"= P.QUIMICA)
      Tabla_QUIMICA <- rbind(Tabla_QUIMICA,Tabla_QUIMICATemp)
    }
  }
}
n <- nrow(Tabla_QUIMICA)
Prom_Total <- sum(Tabla_QUIMICA$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_QUIMICA <- rbind(Tabla_QUIMICA,Tabla3)
Tabla_QUIMICA
##          Semestre Promedio
## 1               2 88.84215
## 2               3 89.57727
## 3               4 82.30615
## 4               5 85.83877
## 5               6 83.26531
## 6               7 88.51397
## 7               8 83.11037
## 8               9 85.10316
## 9              10 82.12737
## 10             11 82.65250
## 11             12 79.89250
## 12             13 78.98000
## 13 Promedio Total 84.18413

sistemas

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_SISTEMAS <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    SISTEMAS <- subset(alumnosITD, Carrera == "SISTEMAS" & Semestre == x)
    P.SISTEMAS <- mean(SISTEMAS$Promedio)
    if(!is.nan(P.SISTEMAS)){
      
      Tabla_SISTEMASTemp <- data.frame("Semestre"=x, "Promedio"= P.SISTEMAS)
      Tabla_SISTEMAS <- rbind(Tabla_SISTEMAS,Tabla_SISTEMASTemp)
    }
  }
}
n <- nrow(Tabla_SISTEMAS)
Prom_Total <- sum(Tabla_SISTEMAS$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_SISTEMAS <- rbind(Tabla_SISTEMAS,Tabla3)
Tabla_SISTEMAS
##          Semestre Promedio
## 1               2 82.65759
## 2               3 86.22266
## 3               4 84.42184
## 4               5 86.54863
## 5               6 85.75429
## 6               7 86.45397
## 7               8 85.21304
## 8               9 90.19143
## 9              10 82.57133
## 10             11 82.64200
## 11             12 81.41000
## 12             13 81.97400
## 13 Promedio Total 84.67173

TICS

Semestres <- sort(unique(alumnosITD$Semestre))
Tabla_TIC <- data.frame("Semestre"=NULL,"Promedio"=NULL)
for (x in Semestres) {
  if(x > 1){
    TIC <- subset(alumnosITD, Carrera == "TIC" & Semestre == x)
    P.TIC <- mean(TIC$Promedio)
    if(!is.nan(P.TIC)){
      
      Tabla_TICTemp <- data.frame("Semestre"=x, "Promedio"= P.TIC)
      Tabla_TIC <- rbind(Tabla_TIC,Tabla_TICTemp)
    }
  }
}
n <- nrow(Tabla_TIC)
Prom_Total <- sum(Tabla_TIC$Promedio)/n
Tabla3 <- data.frame("Semestre"="Promedio Total", "Promedio"=Prom_Total)
Tabla_TIC <- rbind(Tabla_TIC,Tabla3)
Tabla_TIC
##         Semestre Promedio
## 1              3 84.17056
## 2              5 85.01500
## 3              7 82.29438
## 4              9 87.69000
## 5             11 83.79333
## 6 Promedio Total 84.59265

Realizar un diagrama boxplot() (diagrama de caja) (14 boxplots) de los promedios de cada alumno en función de su carrera y de su semestre

ADMINISTRACION

Tabla_Administracion <- Tabla_Administracion[Tabla_Administracion$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_Administracion)

arquitectura

Tabla_ARQUITECTURA <- Tabla_ARQUITECTURA[Tabla_ARQUITECTURA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_ARQUITECTURA)

bioquimica

Tabla_BIOQUIMICA <- Tabla_BIOQUIMICA[Tabla_BIOQUIMICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_BIOQUIMICA)

civil

Tabla_CIVIL <- Tabla_CIVIL[Tabla_CIVIL$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_CIVIL)

electrica

Tabla_ELECTRICA<-Tabla_ELECTRICA[Tabla_ELECTRICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_ELECTRICA)

electronica

Tabla_ELECTRONICA<-Tabla_ELECTRONICA[Tabla_ELECTRONICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_ELECTRONICA)

MECATRONICA

Tabla_MECATRONICA<-Tabla_MECATRONICA[Tabla_MECATRONICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_MECATRONICA)

INDUSTRIAL

Tabla_INDUSTRIAL<-Tabla_INDUSTRIAL[Tabla_INDUSTRIAL$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_INDUSTRIAL)

MECANICA

abla_MECANICA <-Tabla_MECANICA[Tabla_MECANICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_MECANICA)

INFORMATICA

Tabla_INFORMATICA<-Tabla_INFORMATICA[Tabla_INFORMATICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_INFORMATICA)

QUIMICA

Tabla_QUIMICA <- Tabla_QUIMICA[Tabla_QUIMICA$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_QUIMICA)

tic

Tabla_TIC <- Tabla_TIC[Tabla_TIC$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_TIC)

SISTEMAS

Tabla_SISTEMAS<-Tabla_SISTEMAS[Tabla_SISTEMAS$Semestre != "Promedio Total",]
boxplot(Promedio ~ Semestre, Tabla_SISTEMAS)

conclucion

las observaciones de interes son que carrera tiene un mejor promedio contando desde su segundo semestre ya que el primero no vale por que no han recibido ninguna calificacion.

la tabla de distribucoin nos ayuda mucho en estos casos ya que nos ayuda a ordenar cada dato de cada semestre para que nos sea mas facil ver como esta conformada la tabla o los resultados como el promedio en total de cada tabla.

en la grafica vemos loa alumnos de cada carrera y gracias a ella nos damos cuenta en que carrera hay mas alumnos o hasta la que tiene menos canidad de alumnos.

de las todas las carreras la que mejor promedil tiene es la de administracion y la de peor promedio es la de mecanica tambien tiene que ver mucho que administracion no tiene muchos alumnos eso le ayuda a tener mejor promedio