library(readr)
alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head(alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 1 20190001 1 11 198 19 80.21 SISTEMAS
## 2 20190002 2 11 235 10 84.33 SISTEMAS
## 3 20190003 3 9 235 10 95.25 SISTEMAS
## 4 20190004 4 9 226 19 95.00 SISTEMAS
## 5 20190005 5 10 231 14 82.32 SISTEMAS
## 6 20190006 6 9 212 23 95.02 SISTEMAS
tail(alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 5924 20195924 5924 2 27 28 92.83 ADMINISTRACION
## 5925 20195925 5925 7 94 13 80.95 ADMINISTRACION
## 5926 20195926 5926 5 103 32 92.68 ADMINISTRACION
## 5927 20195927 5927 4 79 34 86.18 ADMINISTRACION
## 5928 20195928 5928 5 108 32 90.48 ADMINISTRACION
## 5929 20195929 5929 7 169 32 92.33 ADMINISTRACION
Cuántos alumnos están en primer semestre por cada carrera. De todas las carreras hacer un resumen (una tabla) con las siguientes columnas con solo alumnos de primer semestre.
Crear varias variables una por cada carrea para almacenar el número de alumnos de primer semestre de cada carrera
Construir una tabla
Q.SISTEMAS <- nrow(subset(alumnos, Carrera == "SISTEMAS" & Semestre == 1))
Q.SISTEMAS
## [1] 78
Q.INFORMATICA <- nrow(subset(alumnos, Carrera == "INFORMATICA" & Semestre == 1))
Q.INFORMATICA
## [1] 30
Q.TIC <- nrow(subset(alumnos, Carrera == "TIC" & Semestre == 1))
Q.TIC
## [1] 17
Q.INDUSTRIAL <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" & Semestre == 1))
Q.INDUSTRIAL
## [1] 88
# carreras <- sort(unique(alumnos$Carrera))
carreras <- c("SISTEMAS", "INFORMATICA", "TIC", "INDUSTRIAL")
tabla1 <- data.frame("Carreras" = carreras, "Inscritos 1er Semestre" = c(Q.SISTEMAS, Q.INFORMATICA, Q.TIC, Q.INDUSTRIAL) )
# Modificar los nobres de las colunas a tabla1
names(tabla1) <- c("Carreras","Inscritos")
tabla1
## Carreras Inscritos
## 1 SISTEMAS 78
## 2 INFORMATICA 30
## 3 TIC 17
## 4 INDUSTRIAL 88
barplot(main = "Alumnos de primer semestre",
xlab = "Carreras", ylab = "Cantidad",
height = tabla1$Inscritos, names.arg = tabla1$Carreras)
total_alumnos <- sum(tabla1$Inscritos)
cat("Total de alumnos de primer semestre", total_alumnos)
## Total de alumnos de primer semestre 213
# barplot(tabla1$Inscritos, names.arg = tabla1$Carreras)
QT.SISTEMAS <- nrow(subset(alumnos, Carrera == "SISTEMAS" ))
QT.SISTEMAS
## [1] 452
QT.INFORMATICA <- nrow(subset(alumnos, Carrera == "INFORMATICA" ))
QT.INFORMATICA
## [1] 101
QT.TIC <- nrow(subset(alumnos, Carrera == "TIC" ))
QT.TIC
## [1] 81
QT.INDUSTRIAL <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" ))
QT.INDUSTRIAL
## [1] 707
# carreras <- sort(unique(alumnos$Carrera))
carreras <- c("SISTEMAS", "INFORMATICA", "TIC", "INDUSTRIAL")
tablaQT <- data.frame("Carreras" = carreras, "Inscritos" = c(QT.SISTEMAS, QT.INFORMATICA, QT.TIC, QT.INDUSTRIAL) )
# Modificar los nobres de las colunas a tabla1
names(tablaQT) <- c("Carreras","Inscritos")
tablaQT
## Carreras Inscritos
## 1 SISTEMAS 452
## 2 INFORMATICA 101
## 3 TIC 81
## 4 INDUSTRIAL 707
barplot(main = "Alumnos inscritos",
xlab = "Carreras", ylab = "Cantidad",
height = tablaQT$Inscritos, names.arg = tabla1$Carreras)
total_alumnos <- sum(tablaQT$Inscritos)
cat("Total de alumnos de primer semestre", total_alumnos)
## Total de alumnos de primer semestre 1341
# barplot(tabla1$Inscritos, names.arg = tabla1$Carreras)
SISTEMAS <- subset(alumnos, Carrera == "SISTEMAS" & Semestre > 1)
# SISTEMAS
INFORMATICA <- subset(alumnos, Carrera == "INFORMATICA" & Semestre > 1)
# INFORMATICA
TIC <- subset(alumnos, Carrera == "TIC" & Semestre > 1)
# TIC
INDUSTRIAL <- subset(alumnos, Carrera == "INDUSTRIAL" & Semestre > 1)
# INDUSTRIAL
prom.SISTEMAS <- mean(SISTEMAS$Promedio)
prom.INFORMATICA <- mean(INFORMATICA$Promedio)
prom.TIC <- mean(TIC$Promedio)
prom.INDUSTRIAL <- mean(INDUSTRIAL$Promedio)
# prom.SISTEMAS ; prom.INFORMATICA; prom.TIC; prom.INDUSTRIAL
carreras <- c("SISTEMAS", "INFORMATICA", "TIC", "INDUSTRIAL")
tabla_promedios <- data.frame("Carreras" = carreras, "Promedios" = c(prom.SISTEMAS, prom.INFORMATICA, prom.TIC, prom.INDUSTRIAL))
tabla_promedios
## Carreras Promedios
## 1 SISTEMAS 85.67495
## 2 INFORMATICA 86.26577
## 3 TIC 84.31719
## 4 INDUSTRIAL 84.74268
boxplot(Promedios ~ Carreras, tabla_promedios)
boxplot(Promedio ~ Carrera,
subset(alumnos, Semestre > 1),
las=2)
Va texto libre 70 100 palabras