Alumnos inscritos en el periodo Septiembre 2020 - Enero 2021 en una escuela de educación superior.

Objetivo:

Analizar un conjunto de datos académicos de alumnos para determinar valores estadísticos que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.

library(readr)
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(fdth)

Attaching package: 'fdth'
The following objects are masked from 'package:stats':

    sd, var
alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head(alumnos)
  No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
1    20190001      1       11      198    19    80.21 SISTEMAS
2    20190002      2       11      235    10    84.33 SISTEMAS
3    20190003      3        9      235    10    95.25 SISTEMAS
4    20190004      4        9      226    19    95.00 SISTEMAS
5    20190005      5       10      231    14    82.32 SISTEMAS
6    20190006      6        9      212    23    95.02 SISTEMAS
tail(alumnos)
     No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

Actividad A:

Tabla de alumnos de primer semestre en todas las carreras

alumnos_primero <- alumnos %>%
  group_by(Carrera) %>%
  filter(Semestre == 1) %>%
  summarise(Frecuencia = n())
`summarise()` ungrouping output (override with `.groups` argument)
tabla_alumnos_primero <- data.frame(alumnos_primero)

tabla_alumnos_primero
               Carrera Frecuencia
1       ADMINISTRACION         83
2         ARQUITECTURA        128
3           BIOQUIMICA         84
4                CIVIL         86
5            ELECTRICA         77
6          ELECTRONICA         36
7  GESTION EMPRESARIAL         89
8           INDUSTRIAL         88
9          INFORMATICA         30
10            MECANICA         76
11         MECATRONICA         70
12             QUIMICA         89
13            SISTEMAS         78
14                 TIC         17

Gráfica de barras

color_tabla <- colorRampPalette(c('#ecf4f3',
                                    '#68b0ab',
                                    '#e7dec8',
                                    '#cbaf87',
                                    '#006a71',
                                    '#7e8a97',
                                    '#ff7e67',
                                    '#30475e',
                                    '#faf3dd',
                                    '#64958f',
                                    '#065c6f',
                                    '#ffbb91',
                                    '#e0ece4',
                                    '#d6e0f0'))

barplot(main = "Alumnos de primer semestre", xlab = "Carrera", ylab = "Total inscritos" ,height = tabla_alumnos_primero$Frecuencia, names.arg = tabla_alumnos_primero$Carrera, col = color_tabla(14))

Total de alumnos en primer semestre en todas las carreras

sum(tabla_alumnos_primero$Frecuencia)
[1] 1031

Actividad B:

Tabla de total de alumnos en todas las carreras

alumnos_segundo_adelante <- alumnos %>%
  group_by(Carrera) %>%
  summarise(Frecuencia = n())
`summarise()` ungrouping output (override with `.groups` argument)
tabla_alumnos_seg <- data.frame(alumnos_segundo_adelante)

tabla_alumnos_seg
               Carrera Frecuencia
1       ADMINISTRACION        497
2         ARQUITECTURA        675
3           BIOQUIMICA        441
4                CIVIL        648
5            ELECTRICA        280
6          ELECTRONICA        161
7  GESTION EMPRESARIAL        585
8           INDUSTRIAL        707
9          INFORMATICA        101
10            MECANICA        301
11         MECATRONICA        432
12             QUIMICA        568
13            SISTEMAS        452
14                 TIC         81

Gráfica de barras

barplot(main = "Alumnos de semestre > 1", xlab = "Carrera", ylab = "Total inscritos" ,height = tabla_alumnos_seg$Frecuencia, names.arg = tabla_alumnos_seg$Carrera, col = color_tabla(14))

Total de alumnos en todas las carreras

sum(tabla_alumnos_seg$Frecuencia)
[1] 5929

Actividad C:

Tabla promedios de alumnos en todas las carreras a partir de segundo semestre

promedio_alumnos <- alumnos %>%
  group_by(Carrera) %>%
  filter(Semestre > 1) %>%
  summarise(Frecuencia = n(), media_promedio = mean(Promedio))
`summarise()` ungrouping output (override with `.groups` argument)
tabla_promedio <- data.frame(promedio_alumnos)

tabla_promedio
               Carrera Frecuencia media_promedio
1       ADMINISTRACION        414       89.44312
2         ARQUITECTURA        547       86.46481
3           BIOQUIMICA        357       84.68143
4                CIVIL        562       84.28100
5            ELECTRICA        203       83.77305
6          ELECTRONICA        125       86.65720
7  GESTION EMPRESARIAL        496       87.49290
8           INDUSTRIAL        619       84.74268
9          INFORMATICA         71       86.26577
10            MECANICA        225       82.58467
11         MECATRONICA        362       84.45948
12             QUIMICA        479       86.05215
13            SISTEMAS        374       85.67495
14                 TIC         64       84.31719

Gráfico de cajas

color_tabla_3 <- c('#e8505b',
                  '#f9d56e',
                  '#f3ecc2',
                  '#14b1ab',
                  '#ff9a76',
                  '#ffeadb',
                  '#f7c5a8',
                  '#30475e',
                  '#faf3dd',
                  '#64958f',
                  '#065c6f',
                  '#ffbb91',
                  '#e0ece4',
                  '#d6e0f0')

boxplot(Promedio~Carrera,subset(alumnos, Semestre > 1), col = color_tabla_3)

Promedio general de promedios de alumnos en todas las carreras a partir de segundo semestre

mean(promedio_alumnos$media_promedio)
[1] 85.49217

Actividad D:

datos_agrupados <- alumnos %>% 
  group_by(Carrera, Semestre) %>% 
  summarise(Frecuencia = n(), media_promedio = mean(Promedio))
## `summarise()` regrouping output by 'Carrera' (override with `.groups` argument)

Promedios por semestre -> ADMINISTRACIÓN

admin <- filter(datos_agrupados, Carrera == "ADMINISTRACION")
tabla_admin <- data.frame(admin)
tabla_admin
          Carrera Semestre Frecuencia media_promedio
1  ADMINISTRACION        1         83        0.00000
2  ADMINISTRACION        2         37       90.46486
3  ADMINISTRACION        3         62       91.03355
4  ADMINISTRACION        4         27       88.55074
5  ADMINISTRACION        5         66       90.16712
6  ADMINISTRACION        6         31       88.33806
7  ADMINISTRACION        7         65       88.67369
8  ADMINISTRACION        8         49       88.46714
9  ADMINISTRACION        9         46       90.19174
10 ADMINISTRACION       10         15       88.48800
11 ADMINISTRACION       11         12       87.36417
12 ADMINISTRACION       12          4       83.65000
boxplot(media_promedio~Semestre, tabla_admin)

Promedios por semestre -> ARQUITECTURA

arquitectura <- filter(datos_agrupados, Carrera == "ARQUITECTURA")
tabla_arquitectura <- data.frame(arquitectura)
tabla_arquitectura
        Carrera Semestre Frecuencia media_promedio
1  ARQUITECTURA        1        128        0.00000
2  ARQUITECTURA        2         87       85.89126
3  ARQUITECTURA        3         66       87.53758
4  ARQUITECTURA        4         62       87.10419
5  ARQUITECTURA        5         58       88.17828
6  ARQUITECTURA        6         64       86.95047
7  ARQUITECTURA        7         53       85.93038
8  ARQUITECTURA        8         60       85.50350
9  ARQUITECTURA        9         47       87.24149
10 ARQUITECTURA       10         31       83.76613
11 ARQUITECTURA       11          8       83.31250
12 ARQUITECTURA       12         11       83.49818
boxplot(media_promedio~Semestre, tabla_arquitectura)

Promedios por semestre -> BIOQUIMICA

bioquimica <- filter(datos_agrupados, Carrera == "BIOQUIMICA")
tabla_bioquimica <- data.frame(bioquimica)
tabla_bioquimica
      Carrera Semestre Frecuencia media_promedio
1  BIOQUIMICA        1         84        0.00000
2  BIOQUIMICA        2         34       87.03235
3  BIOQUIMICA        3         65       86.51385
4  BIOQUIMICA        4         40       83.66500
5  BIOQUIMICA        5         47       84.54766
6  BIOQUIMICA        6         36       83.74833
7  BIOQUIMICA        7         55       84.64236
8  BIOQUIMICA        8         17       81.83824
9  BIOQUIMICA        9         38       85.36368
10 BIOQUIMICA       10         10       82.16800
11 BIOQUIMICA       11         11       80.12091
12 BIOQUIMICA       12          3       79.35333
13 BIOQUIMICA       13          1       82.02000
boxplot(media_promedio~Semestre, tabla_bioquimica)

Promedios por semestre -> CIVIL

civil <- filter(datos_agrupados, Carrera == "CIVIL")
tabla_civil <- data.frame(civil)
tabla_civil
   Carrera Semestre Frecuencia media_promedio
1    CIVIL        1         86        0.00000
2    CIVIL        2         74       87.26649
3    CIVIL        3         66       85.64424
4    CIVIL        4         66       83.32561
5    CIVIL        5         71       85.27732
6    CIVIL        6         72       83.75000
7    CIVIL        7         58       84.54276
8    CIVIL        8         57       83.67842
9    CIVIL        9         44       83.51045
10   CIVIL       10         30       80.51033
11   CIVIL       11          8       80.86375
12   CIVIL       12         15       79.01200
13   CIVIL       15          1       76.49000
boxplot(media_promedio~Semestre, tabla_civil)

Promedios por semestre -> ELECTRICA

electrica <- filter(datos_agrupados, Carrera == "ELECTRICA")
tabla_electrica <- data.frame(electrica)
tabla_electrica
     Carrera Semestre Frecuencia media_promedio
1  ELECTRICA        1         77        0.00000
2  ELECTRICA        2          1       87.17000
3  ELECTRICA        3         42       84.17952
4  ELECTRICA        5         54       84.29556
5  ELECTRICA        6         12       82.05500
6  ELECTRICA        7         27       84.37370
7  ELECTRICA        8          6       84.07500
8  ELECTRICA        9         21       84.39714
9  ELECTRICA       10         12       82.55750
10 ELECTRICA       11         15       83.68933
11 ELECTRICA       12          8       80.41500
12 ELECTRICA       13          1       81.96000
13 ELECTRICA       14          1       80.70000
14 ELECTRICA       15          3       79.90333
boxplot(media_promedio~Semestre, tabla_electrica)

Promedios por semestre -> ELECTRONICA

electronica <- filter(datos_agrupados, Carrera == "ELECTRONICA")
tabla_electronica <- data.frame(electronica)
tabla_electronica
      Carrera Semestre Frecuencia media_promedio
1 ELECTRONICA        1         36        0.00000
2 ELECTRONICA        3         32       88.69469
3 ELECTRONICA        5         26       87.73692
4 ELECTRONICA        6          6       81.65000
5 ELECTRONICA        7         21       88.21667
6 ELECTRONICA        8          3       86.33333
7 ELECTRONICA        9         22       85.50591
8 ELECTRONICA       10          5       80.62600
9 ELECTRONICA       11         10       82.70500
boxplot(media_promedio~Semestre, tabla_electronica)

Promedios por semestre -> GESTION EMPRESARIAL

gestion <- filter(datos_agrupados, Carrera == "GESTION EMPRESARIAL")
tabla_gestion <- data.frame(gestion)
tabla_gestion
               Carrera Semestre Frecuencia media_promedio
1  GESTION EMPRESARIAL        1         89        0.00000
2  GESTION EMPRESARIAL        2         41       89.59659
3  GESTION EMPRESARIAL        3         73       87.94932
4  GESTION EMPRESARIAL        4         40       85.48450
5  GESTION EMPRESARIAL        5         67       88.83075
6  GESTION EMPRESARIAL        6         54       86.37296
7  GESTION EMPRESARIAL        7         58       86.33448
8  GESTION EMPRESARIAL        8         63       87.84984
9  GESTION EMPRESARIAL        9         48       89.33187
10 GESTION EMPRESARIAL       10         29       85.33379
11 GESTION EMPRESARIAL       11         16       85.18188
12 GESTION EMPRESARIAL       12          6       85.91333
13 GESTION EMPRESARIAL       13          1       84.60000
boxplot(media_promedio~Semestre, tabla_gestion)

Promedios por semestre -> INDUSTRIAL

industrial <- filter(datos_agrupados, Carrera == "INDUSTRIAL")
tabla_industrial <- data.frame(industrial)
tabla_industrial
      Carrera Semestre Frecuencia media_promedio
1  INDUSTRIAL        1         88        0.00000
2  INDUSTRIAL        2         75       86.37120
3  INDUSTRIAL        3         87       87.78000
4  INDUSTRIAL        4         69       83.03333
5  INDUSTRIAL        5         82       84.00878
6  INDUSTRIAL        6         76       83.18500
7  INDUSTRIAL        7         77       86.34286
8  INDUSTRIAL        8         69       83.60377
9  INDUSTRIAL        9         38       85.63237
10 INDUSTRIAL       10         24       81.20375
11 INDUSTRIAL       11          8       80.56125
12 INDUSTRIAL       12          6       83.10000
13 INDUSTRIAL       13          3       78.79000
14 INDUSTRIAL       14          5       80.30000
boxplot(media_promedio~Semestre, tabla_industrial)

Promedios por semestre -> INFORMATICA

informatica <- filter(datos_agrupados, Carrera == "INFORMATICA")
tabla_informatica <- data.frame(informatica)
tabla_informatica
      Carrera Semestre Frecuencia media_promedio
1 INFORMATICA        1         30        0.00000
2 INFORMATICA        3         23       88.19261
3 INFORMATICA        4          1       89.56000
4 INFORMATICA        5         14       86.66357
5 INFORMATICA        7         14       84.97357
6 INFORMATICA        9         13       85.40077
7 INFORMATICA       11          5       82.80200
8 INFORMATICA       13          1       79.74000
boxplot(media_promedio~Semestre, tabla_informatica)

Promedios por semestre -> MECANICA

mecanica <- filter(datos_agrupados, Carrera == "MECANICA")
tabla_mecanica <- data.frame(mecanica)
tabla_mecanica
    Carrera Semestre Frecuencia media_promedio
1  MECANICA        1         76        0.00000
2  MECANICA        3         58       83.43034
3  MECANICA        4          2       82.09500
4  MECANICA        5         43       82.09767
5  MECANICA        6         21       80.21667
6  MECANICA        7         41       83.28390
7  MECANICA        8         14       82.43929
8  MECANICA        9         18       84.68833
9  MECANICA       10         11       81.64182
10 MECANICA       11         14       81.19500
11 MECANICA       12          3       78.56000
boxplot(media_promedio~Semestre, tabla_mecanica)

Promedios por semestre -> MECATRONICA

mecatronica <- filter(datos_agrupados, Carrera == "MECATRONICA")
tabla_mecatronica <- data.frame(mecatronica)
tabla_mecatronica
       Carrera Semestre Frecuencia media_promedio
1  MECATRONICA        1         70        0.00000
2  MECATRONICA        2         26       84.82154
3  MECATRONICA        3         61       83.50672
4  MECATRONICA        4         45       84.74044
5  MECATRONICA        5         64       86.18594
6  MECATRONICA        6         23       84.06304
7  MECATRONICA        7         56       84.74018
8  MECATRONICA        8         32       82.37594
9  MECATRONICA        9         28       86.52357
10 MECATRONICA       10         16       82.12438
11 MECATRONICA       11          8       81.94750
12 MECATRONICA       12          3       79.56000
boxplot(media_promedio~Semestre, tabla_mecatronica)

Promedios por semestre -> QUIMICA

quimica <- filter(datos_agrupados, Carrera == "QUIMICA")
tabla_quimica <- data.frame(quimica)
tabla_quimica
   Carrera Semestre Frecuencia media_promedio
1  QUIMICA        1         89        0.00000
2  QUIMICA        2         65       88.84215
3  QUIMICA        3         77       89.57727
4  QUIMICA        4         39       82.30615
5  QUIMICA        5         65       85.83877
6  QUIMICA        6         32       83.26531
7  QUIMICA        7         58       88.51397
8  QUIMICA        8         54       83.11037
9  QUIMICA        9         57       85.10316
10 QUIMICA       10         19       82.12737
11 QUIMICA       11          8       82.65250
12 QUIMICA       12          4       79.89250
13 QUIMICA       13          1       78.98000
boxplot(media_promedio~Semestre, tabla_quimica)

Promedios por semestre -> SISTEMAS

sistemas <- filter(datos_agrupados, Carrera == "SISTEMAS")
tabla_sistemas <- data.frame(sistemas)
tabla_sistemas
    Carrera Semestre Frecuencia media_promedio
1  SISTEMAS        1         78        0.00000
2  SISTEMAS        2         29       82.65759
3  SISTEMAS        3         64       86.22266
4  SISTEMAS        4         38       84.42184
5  SISTEMAS        5         51       86.54863
6  SISTEMAS        6         14       85.75429
7  SISTEMAS        7         58       86.45397
8  SISTEMAS        8         46       85.21304
9  SISTEMAS        9         35       90.19143
10 SISTEMAS       10         15       82.57133
11 SISTEMAS       11         15       82.64200
12 SISTEMAS       12          4       81.41000
13 SISTEMAS       13          5       81.97400
boxplot(media_promedio~Semestre, tabla_sistemas)

Promedios por semestre -> TIC

tics <- filter(datos_agrupados, Carrera == "TIC")
tabla_tics <- data.frame(tics)
tabla_tics
  Carrera Semestre Frecuencia media_promedio
1     TIC        1         17        0.00000
2     TIC        3         18       84.17056
3     TIC        5         16       85.01500
4     TIC        7         16       82.29438
5     TIC        9          8       87.69000
6     TIC       11          6       83.79333
boxplot(media_promedio~Semestre, tabla_tics)

Promedio general de todas las carreras en todos los semestres:

promedios <- c(admin$media_promedio,arquitectura$media_promedio,bioquimica$media_promedio,civil$media_promedio,
               electrica$media_promedio,electronica$media_promedio,gestion$media_promedio,industrial$media_promedio,
               informatica$media_promedio,mecanica$media_promedio,mecatronica$media_promedio,quimica$media_promedio,
               sistemas$media_promedio, tics$media_promedio)

promedio_general_alumnos <- mean(promedios)

promedio_general_alumnos
## [1] 77.23879

Interpretación de resultados:

Del total de variables (7) se tomaron como principales: carrera, semestre y promedio. En cuanto a la carrera, en primer semestre la mayor concentración de alumnos se encuentra en arquitectura, mientras que TIC e informática son de las menos pobladas. A partir de una vista general de todos los semestres, la carrera con más alumnos es industrial, seguida de arquitectura y con menos alumnos es TIC, seguida de informática. En cuanto a promedios, el mejor por carrera lo tiene administración con 89.44, el segundo mejor promedio lo tiene gestión empresarial con 87.49 y el tercero electrónica con 86.65.