library(readr)
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(fdth)
Attaching package: 'fdth'
The following objects are masked from 'package:stats':
sd, var
alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head(alumnos)
No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
1 20190001 1 11 198 19 80.21 SISTEMAS
2 20190002 2 11 235 10 84.33 SISTEMAS
3 20190003 3 9 235 10 95.25 SISTEMAS
4 20190004 4 9 226 19 95.00 SISTEMAS
5 20190005 5 10 231 14 82.32 SISTEMAS
6 20190006 6 9 212 23 95.02 SISTEMAS
tail(alumnos)
No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
5924 20195924 5924 2 27 28 92.83 ADMINISTRACION
5925 20195925 5925 7 94 13 80.95 ADMINISTRACION
5926 20195926 5926 5 103 32 92.68 ADMINISTRACION
5927 20195927 5927 4 79 34 86.18 ADMINISTRACION
5928 20195928 5928 5 108 32 90.48 ADMINISTRACION
5929 20195929 5929 7 169 32 92.33 ADMINISTRACION
alumnos_primero <- alumnos %>%
group_by(Carrera) %>%
filter(Semestre == 1) %>%
summarise(Frecuencia = n())
`summarise()` ungrouping output (override with `.groups` argument)
tabla_alumnos_primero <- data.frame(alumnos_primero)
tabla_alumnos_primero
Carrera Frecuencia
1 ADMINISTRACION 83
2 ARQUITECTURA 128
3 BIOQUIMICA 84
4 CIVIL 86
5 ELECTRICA 77
6 ELECTRONICA 36
7 GESTION EMPRESARIAL 89
8 INDUSTRIAL 88
9 INFORMATICA 30
10 MECANICA 76
11 MECATRONICA 70
12 QUIMICA 89
13 SISTEMAS 78
14 TIC 17
color_tabla <- colorRampPalette(c('#ecf4f3',
'#68b0ab',
'#e7dec8',
'#cbaf87',
'#006a71',
'#7e8a97',
'#ff7e67',
'#30475e',
'#faf3dd',
'#64958f',
'#065c6f',
'#ffbb91',
'#e0ece4',
'#d6e0f0'))
barplot(main = "Alumnos de primer semestre", xlab = "Carrera", ylab = "Total inscritos" ,height = tabla_alumnos_primero$Frecuencia, names.arg = tabla_alumnos_primero$Carrera, col = color_tabla(14))
sum(tabla_alumnos_primero$Frecuencia)
[1] 1031
alumnos_segundo_adelante <- alumnos %>%
group_by(Carrera) %>%
summarise(Frecuencia = n())
`summarise()` ungrouping output (override with `.groups` argument)
tabla_alumnos_seg <- data.frame(alumnos_segundo_adelante)
tabla_alumnos_seg
Carrera Frecuencia
1 ADMINISTRACION 497
2 ARQUITECTURA 675
3 BIOQUIMICA 441
4 CIVIL 648
5 ELECTRICA 280
6 ELECTRONICA 161
7 GESTION EMPRESARIAL 585
8 INDUSTRIAL 707
9 INFORMATICA 101
10 MECANICA 301
11 MECATRONICA 432
12 QUIMICA 568
13 SISTEMAS 452
14 TIC 81
barplot(main = "Alumnos de semestre > 1", xlab = "Carrera", ylab = "Total inscritos" ,height = tabla_alumnos_seg$Frecuencia, names.arg = tabla_alumnos_seg$Carrera, col = color_tabla(14))
sum(tabla_alumnos_seg$Frecuencia)
[1] 5929
promedio_alumnos <- alumnos %>%
group_by(Carrera) %>%
filter(Semestre > 1) %>%
summarise(Frecuencia = n(), media_promedio = mean(Promedio))
`summarise()` ungrouping output (override with `.groups` argument)
tabla_promedio <- data.frame(promedio_alumnos)
tabla_promedio
Carrera Frecuencia media_promedio
1 ADMINISTRACION 414 89.44312
2 ARQUITECTURA 547 86.46481
3 BIOQUIMICA 357 84.68143
4 CIVIL 562 84.28100
5 ELECTRICA 203 83.77305
6 ELECTRONICA 125 86.65720
7 GESTION EMPRESARIAL 496 87.49290
8 INDUSTRIAL 619 84.74268
9 INFORMATICA 71 86.26577
10 MECANICA 225 82.58467
11 MECATRONICA 362 84.45948
12 QUIMICA 479 86.05215
13 SISTEMAS 374 85.67495
14 TIC 64 84.31719
color_tabla_3 <- c('#e8505b',
'#f9d56e',
'#f3ecc2',
'#14b1ab',
'#ff9a76',
'#ffeadb',
'#f7c5a8',
'#30475e',
'#faf3dd',
'#64958f',
'#065c6f',
'#ffbb91',
'#e0ece4',
'#d6e0f0')
boxplot(Promedio~Carrera,subset(alumnos, Semestre > 1), col = color_tabla_3)
mean(promedio_alumnos$media_promedio)
[1] 85.49217
datos_agrupados <- alumnos %>%
group_by(Carrera, Semestre) %>%
summarise(Frecuencia = n(), media_promedio = mean(Promedio))
## `summarise()` regrouping output by 'Carrera' (override with `.groups` argument)
admin <- filter(datos_agrupados, Carrera == "ADMINISTRACION")
tabla_admin <- data.frame(admin)
tabla_admin
Carrera Semestre Frecuencia media_promedio
1 ADMINISTRACION 1 83 0.00000
2 ADMINISTRACION 2 37 90.46486
3 ADMINISTRACION 3 62 91.03355
4 ADMINISTRACION 4 27 88.55074
5 ADMINISTRACION 5 66 90.16712
6 ADMINISTRACION 6 31 88.33806
7 ADMINISTRACION 7 65 88.67369
8 ADMINISTRACION 8 49 88.46714
9 ADMINISTRACION 9 46 90.19174
10 ADMINISTRACION 10 15 88.48800
11 ADMINISTRACION 11 12 87.36417
12 ADMINISTRACION 12 4 83.65000
boxplot(media_promedio~Semestre, tabla_admin)
arquitectura <- filter(datos_agrupados, Carrera == "ARQUITECTURA")
tabla_arquitectura <- data.frame(arquitectura)
tabla_arquitectura
Carrera Semestre Frecuencia media_promedio
1 ARQUITECTURA 1 128 0.00000
2 ARQUITECTURA 2 87 85.89126
3 ARQUITECTURA 3 66 87.53758
4 ARQUITECTURA 4 62 87.10419
5 ARQUITECTURA 5 58 88.17828
6 ARQUITECTURA 6 64 86.95047
7 ARQUITECTURA 7 53 85.93038
8 ARQUITECTURA 8 60 85.50350
9 ARQUITECTURA 9 47 87.24149
10 ARQUITECTURA 10 31 83.76613
11 ARQUITECTURA 11 8 83.31250
12 ARQUITECTURA 12 11 83.49818
boxplot(media_promedio~Semestre, tabla_arquitectura)
bioquimica <- filter(datos_agrupados, Carrera == "BIOQUIMICA")
tabla_bioquimica <- data.frame(bioquimica)
tabla_bioquimica
Carrera Semestre Frecuencia media_promedio
1 BIOQUIMICA 1 84 0.00000
2 BIOQUIMICA 2 34 87.03235
3 BIOQUIMICA 3 65 86.51385
4 BIOQUIMICA 4 40 83.66500
5 BIOQUIMICA 5 47 84.54766
6 BIOQUIMICA 6 36 83.74833
7 BIOQUIMICA 7 55 84.64236
8 BIOQUIMICA 8 17 81.83824
9 BIOQUIMICA 9 38 85.36368
10 BIOQUIMICA 10 10 82.16800
11 BIOQUIMICA 11 11 80.12091
12 BIOQUIMICA 12 3 79.35333
13 BIOQUIMICA 13 1 82.02000
boxplot(media_promedio~Semestre, tabla_bioquimica)
civil <- filter(datos_agrupados, Carrera == "CIVIL")
tabla_civil <- data.frame(civil)
tabla_civil
Carrera Semestre Frecuencia media_promedio
1 CIVIL 1 86 0.00000
2 CIVIL 2 74 87.26649
3 CIVIL 3 66 85.64424
4 CIVIL 4 66 83.32561
5 CIVIL 5 71 85.27732
6 CIVIL 6 72 83.75000
7 CIVIL 7 58 84.54276
8 CIVIL 8 57 83.67842
9 CIVIL 9 44 83.51045
10 CIVIL 10 30 80.51033
11 CIVIL 11 8 80.86375
12 CIVIL 12 15 79.01200
13 CIVIL 15 1 76.49000
boxplot(media_promedio~Semestre, tabla_civil)
electrica <- filter(datos_agrupados, Carrera == "ELECTRICA")
tabla_electrica <- data.frame(electrica)
tabla_electrica
Carrera Semestre Frecuencia media_promedio
1 ELECTRICA 1 77 0.00000
2 ELECTRICA 2 1 87.17000
3 ELECTRICA 3 42 84.17952
4 ELECTRICA 5 54 84.29556
5 ELECTRICA 6 12 82.05500
6 ELECTRICA 7 27 84.37370
7 ELECTRICA 8 6 84.07500
8 ELECTRICA 9 21 84.39714
9 ELECTRICA 10 12 82.55750
10 ELECTRICA 11 15 83.68933
11 ELECTRICA 12 8 80.41500
12 ELECTRICA 13 1 81.96000
13 ELECTRICA 14 1 80.70000
14 ELECTRICA 15 3 79.90333
boxplot(media_promedio~Semestre, tabla_electrica)
electronica <- filter(datos_agrupados, Carrera == "ELECTRONICA")
tabla_electronica <- data.frame(electronica)
tabla_electronica
Carrera Semestre Frecuencia media_promedio
1 ELECTRONICA 1 36 0.00000
2 ELECTRONICA 3 32 88.69469
3 ELECTRONICA 5 26 87.73692
4 ELECTRONICA 6 6 81.65000
5 ELECTRONICA 7 21 88.21667
6 ELECTRONICA 8 3 86.33333
7 ELECTRONICA 9 22 85.50591
8 ELECTRONICA 10 5 80.62600
9 ELECTRONICA 11 10 82.70500
boxplot(media_promedio~Semestre, tabla_electronica)
gestion <- filter(datos_agrupados, Carrera == "GESTION EMPRESARIAL")
tabla_gestion <- data.frame(gestion)
tabla_gestion
Carrera Semestre Frecuencia media_promedio
1 GESTION EMPRESARIAL 1 89 0.00000
2 GESTION EMPRESARIAL 2 41 89.59659
3 GESTION EMPRESARIAL 3 73 87.94932
4 GESTION EMPRESARIAL 4 40 85.48450
5 GESTION EMPRESARIAL 5 67 88.83075
6 GESTION EMPRESARIAL 6 54 86.37296
7 GESTION EMPRESARIAL 7 58 86.33448
8 GESTION EMPRESARIAL 8 63 87.84984
9 GESTION EMPRESARIAL 9 48 89.33187
10 GESTION EMPRESARIAL 10 29 85.33379
11 GESTION EMPRESARIAL 11 16 85.18188
12 GESTION EMPRESARIAL 12 6 85.91333
13 GESTION EMPRESARIAL 13 1 84.60000
boxplot(media_promedio~Semestre, tabla_gestion)
industrial <- filter(datos_agrupados, Carrera == "INDUSTRIAL")
tabla_industrial <- data.frame(industrial)
tabla_industrial
Carrera Semestre Frecuencia media_promedio
1 INDUSTRIAL 1 88 0.00000
2 INDUSTRIAL 2 75 86.37120
3 INDUSTRIAL 3 87 87.78000
4 INDUSTRIAL 4 69 83.03333
5 INDUSTRIAL 5 82 84.00878
6 INDUSTRIAL 6 76 83.18500
7 INDUSTRIAL 7 77 86.34286
8 INDUSTRIAL 8 69 83.60377
9 INDUSTRIAL 9 38 85.63237
10 INDUSTRIAL 10 24 81.20375
11 INDUSTRIAL 11 8 80.56125
12 INDUSTRIAL 12 6 83.10000
13 INDUSTRIAL 13 3 78.79000
14 INDUSTRIAL 14 5 80.30000
boxplot(media_promedio~Semestre, tabla_industrial)
informatica <- filter(datos_agrupados, Carrera == "INFORMATICA")
tabla_informatica <- data.frame(informatica)
tabla_informatica
Carrera Semestre Frecuencia media_promedio
1 INFORMATICA 1 30 0.00000
2 INFORMATICA 3 23 88.19261
3 INFORMATICA 4 1 89.56000
4 INFORMATICA 5 14 86.66357
5 INFORMATICA 7 14 84.97357
6 INFORMATICA 9 13 85.40077
7 INFORMATICA 11 5 82.80200
8 INFORMATICA 13 1 79.74000
boxplot(media_promedio~Semestre, tabla_informatica)
mecanica <- filter(datos_agrupados, Carrera == "MECANICA")
tabla_mecanica <- data.frame(mecanica)
tabla_mecanica
Carrera Semestre Frecuencia media_promedio
1 MECANICA 1 76 0.00000
2 MECANICA 3 58 83.43034
3 MECANICA 4 2 82.09500
4 MECANICA 5 43 82.09767
5 MECANICA 6 21 80.21667
6 MECANICA 7 41 83.28390
7 MECANICA 8 14 82.43929
8 MECANICA 9 18 84.68833
9 MECANICA 10 11 81.64182
10 MECANICA 11 14 81.19500
11 MECANICA 12 3 78.56000
boxplot(media_promedio~Semestre, tabla_mecanica)
mecatronica <- filter(datos_agrupados, Carrera == "MECATRONICA")
tabla_mecatronica <- data.frame(mecatronica)
tabla_mecatronica
Carrera Semestre Frecuencia media_promedio
1 MECATRONICA 1 70 0.00000
2 MECATRONICA 2 26 84.82154
3 MECATRONICA 3 61 83.50672
4 MECATRONICA 4 45 84.74044
5 MECATRONICA 5 64 86.18594
6 MECATRONICA 6 23 84.06304
7 MECATRONICA 7 56 84.74018
8 MECATRONICA 8 32 82.37594
9 MECATRONICA 9 28 86.52357
10 MECATRONICA 10 16 82.12438
11 MECATRONICA 11 8 81.94750
12 MECATRONICA 12 3 79.56000
boxplot(media_promedio~Semestre, tabla_mecatronica)
quimica <- filter(datos_agrupados, Carrera == "QUIMICA")
tabla_quimica <- data.frame(quimica)
tabla_quimica
Carrera Semestre Frecuencia media_promedio
1 QUIMICA 1 89 0.00000
2 QUIMICA 2 65 88.84215
3 QUIMICA 3 77 89.57727
4 QUIMICA 4 39 82.30615
5 QUIMICA 5 65 85.83877
6 QUIMICA 6 32 83.26531
7 QUIMICA 7 58 88.51397
8 QUIMICA 8 54 83.11037
9 QUIMICA 9 57 85.10316
10 QUIMICA 10 19 82.12737
11 QUIMICA 11 8 82.65250
12 QUIMICA 12 4 79.89250
13 QUIMICA 13 1 78.98000
boxplot(media_promedio~Semestre, tabla_quimica)
sistemas <- filter(datos_agrupados, Carrera == "SISTEMAS")
tabla_sistemas <- data.frame(sistemas)
tabla_sistemas
Carrera Semestre Frecuencia media_promedio
1 SISTEMAS 1 78 0.00000
2 SISTEMAS 2 29 82.65759
3 SISTEMAS 3 64 86.22266
4 SISTEMAS 4 38 84.42184
5 SISTEMAS 5 51 86.54863
6 SISTEMAS 6 14 85.75429
7 SISTEMAS 7 58 86.45397
8 SISTEMAS 8 46 85.21304
9 SISTEMAS 9 35 90.19143
10 SISTEMAS 10 15 82.57133
11 SISTEMAS 11 15 82.64200
12 SISTEMAS 12 4 81.41000
13 SISTEMAS 13 5 81.97400
boxplot(media_promedio~Semestre, tabla_sistemas)
tics <- filter(datos_agrupados, Carrera == "TIC")
tabla_tics <- data.frame(tics)
tabla_tics
Carrera Semestre Frecuencia media_promedio
1 TIC 1 17 0.00000
2 TIC 3 18 84.17056
3 TIC 5 16 85.01500
4 TIC 7 16 82.29438
5 TIC 9 8 87.69000
6 TIC 11 6 83.79333
boxplot(media_promedio~Semestre, tabla_tics)
promedios <- c(admin$media_promedio,arquitectura$media_promedio,bioquimica$media_promedio,civil$media_promedio,
electrica$media_promedio,electronica$media_promedio,gestion$media_promedio,industrial$media_promedio,
informatica$media_promedio,mecanica$media_promedio,mecatronica$media_promedio,quimica$media_promedio,
sistemas$media_promedio, tics$media_promedio)
promedio_general_alumnos <- mean(promedios)
promedio_general_alumnos
## [1] 77.23879
Del total de variables (7) se tomaron como principales: carrera, semestre y promedio. En cuanto a la carrera, en primer semestre la mayor concentración de alumnos se encuentra en arquitectura, mientras que TIC e informática son de las menos pobladas. A partir de una vista general de todos los semestres, la carrera con más alumnos es industrial, seguida de arquitectura y con menos alumnos es TIC, seguida de informática. En cuanto a promedios, el mejor por carrera lo tiene administración con 89.44, el segundo mejor promedio lo tiene gestión empresarial con 87.49 y el tercero electrónica con 86.65.