Leer Datos:
library(readr)
alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head(alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 1 20190001 1 11 198 19 80.21 SISTEMAS
## 2 20190002 2 11 235 10 84.33 SISTEMAS
## 3 20190003 3 9 235 10 95.25 SISTEMAS
## 4 20190004 4 9 226 19 95.00 SISTEMAS
## 5 20190005 5 10 231 14 82.32 SISTEMAS
## 6 20190006 6 9 212 23 95.02 SISTEMAS
tail(alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 5924 20195924 5924 2 27 28 92.83 ADMINISTRACION
## 5925 20195925 5925 7 94 13 80.95 ADMINISTRACION
## 5926 20195926 5926 5 103 32 92.68 ADMINISTRACION
## 5927 20195927 5927 4 79 34 86.18 ADMINISTRACION
## 5928 20195928 5928 5 108 32 90.48 ADMINISTRACION
## 5929 20195929 5929 7 169 32 92.33 ADMINISTRACION
Q.administracion <- nrow(subset(alumnos, Carrera == "ADMINISTRACION" & Semestre))
Q.administracion
## [1] 497
Q.arquitectura <- nrow(subset(alumnos, Carrera == "ARQUITECTURA" & Semestre))
Q.arquitectura
## [1] 675
Q.bioquimica <- nrow(subset(alumnos, Carrera == "BIOQUIMICA" & Semestre))
Q.bioquimica
## [1] 441
Q.civil <- nrow(subset(alumnos, Carrera == "CIVIL" & Semestre))
Q.civil
## [1] 648
Q.electrica <- nrow(subset(alumnos, Carrera == "ELECTRICA" & Semestre))
Q.electrica
## [1] 280
Q.electronica<- nrow(subset(alumnos, Carrera == "ELECTRONICA" & Semestre))
Q.electronica
## [1] 161
Q.gestion <- nrow(subset(alumnos, Carrera == "GESTION EMPRESARIAL" & Semestre))
Q.gestion
## [1] 585
Q.industrial <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" & Semestre))
Q.industrial
## [1] 707
Q.informatica <- nrow(subset(alumnos, Carrera == "INFORMATICA" & Semestre))
Q.informatica
## [1] 101
Q.mecanica <- nrow(subset(alumnos, Carrera == "MECANICA" & Semestre))
Q.mecanica
## [1] 301
Q.mecatronica <- nrow(subset(alumnos, Carrera == "MECATRONICA" & Semestre))
Q.mecatronica
## [1] 432
Q.quimica <- nrow(subset(alumnos, Carrera == "QUIMICA" & Semestre))
Q.quimica
## [1] 568
Q.sistemas <- nrow(subset(alumnos, Carrera == "SISTEMAS" & Semestre))
Q.sistemas
## [1] 452
Q.tics <- nrow(subset(alumnos, Carrera == "TIC" & Semestre))
Q.tics
## [1] 81
carreras <-c("ARQUITECTURA","ADMINISTRACION","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA","GESTION EMPRESARIAL","INFORMATICA","INDUSTRIAL","MECANICA","MECATRONICA","QUIMICA","SISTEMAS","TIC")
tabla2 <- data.frame("Carreras" = carreras, "Inscritos en todos los Sem. " = c(Q.administracion,Q.arquitectura,Q.bioquimica,Q.civil,Q.electrica,Q.electronica,Q.gestion,Q.informatica,Q.industrial,Q.mecanica,Q.mecatronica,Q.quimica,Q.sistemas,Q.tics))
tabla2
## Carreras Inscritos.en.todos.los.Sem..
## 1 ARQUITECTURA 497
## 2 ADMINISTRACION 675
## 3 BIOQUIMICA 441
## 4 CIVIL 648
## 5 ELECTRICA 280
## 6 ELECTRONICA 161
## 7 GESTION EMPRESARIAL 585
## 8 INFORMATICA 101
## 9 INDUSTRIAL 707
## 10 MECANICA 301
## 11 MECATRONICA 432
## 12 QUIMICA 568
## 13 SISTEMAS 452
## 14 TIC 81
Q.administracion <- nrow(subset(alumnos, Carrera == "ADMINISTRACION" & Semestre == 1))
Q.administracion
## [1] 83
Q.arquitectura <- nrow(subset(alumnos, Carrera == "ARQUITECTURA" & Semestre == 1))
Q.arquitectura
## [1] 128
Q.bioquimica <- nrow(subset(alumnos, Carrera == "BIOQUIMICA" & Semestre == 1))
Q.bioquimica
## [1] 84
Q.civil <- nrow(subset(alumnos, Carrera == "CIVIL" & Semestre == 1))
Q.civil
## [1] 86
Q.electrica <- nrow(subset(alumnos, Carrera == "ELECTRICA" & Semestre == 1))
Q.electrica
## [1] 77
Q.electronica<- nrow(subset(alumnos, Carrera == "ELECTRONICA" & Semestre == 1))
Q.electronica
## [1] 36
Q.gestion <- nrow(subset(alumnos, Carrera == "GESTION EMPRESARIAL" & Semestre == 1))
Q.gestion
## [1] 89
Q.industrial <- nrow(subset(alumnos, Carrera == "INDUSTRIAL" & Semestre == 1))
Q.industrial
## [1] 88
Q.informatica <- nrow(subset(alumnos, Carrera == "INFORMATICA" & Semestre == 1))
Q.informatica
## [1] 30
Q.mecanica <- nrow(subset(alumnos, Carrera == "MECANICA" & Semestre == 1))
Q.mecanica
## [1] 76
Q.mecatronica <- nrow(subset(alumnos, Carrera == "MECATRONICA" & Semestre == 1))
Q.mecatronica
## [1] 70
Q.quimica <- nrow(subset(alumnos, Carrera == "QUIMICA" & Semestre == 1))
Q.quimica
## [1] 89
Q.sistemas <- nrow(subset(alumnos, Carrera == "SISTEMAS" & Semestre == 1))
Q.sistemas
## [1] 78
Q.tics <- nrow(subset(alumnos, Carrera == "TIC" & Semestre == 1))
Q.tics
## [1] 17
carreras <-c("ARQUITECTURA","ADMINISTRACION","BIOQUIMICA","CIVIL","ELECTRICA","ELECTRONICA","GESTION EMPRESARIAL","INFORMATICA","INDUSTRIAL","MECANICA","MECATRONICA","QUIMICA","SISTEMAS","TIC")
tabla1 <- data.frame("Carreras" = carreras, "Inscritos 1er Semestre " = c(Q.administracion,Q.arquitectura,Q.bioquimica,Q.civil,Q.electrica,Q.electronica,Q.gestion,Q.informatica,Q.industrial,Q.mecanica,Q.mecatronica,Q.quimica,Q.sistemas,Q.tics))
tabla1
## Carreras Inscritos.1er.Semestre.
## 1 ARQUITECTURA 83
## 2 ADMINISTRACION 128
## 3 BIOQUIMICA 84
## 4 CIVIL 86
## 5 ELECTRICA 77
## 6 ELECTRONICA 36
## 7 GESTION EMPRESARIAL 89
## 8 INFORMATICA 30
## 9 INDUSTRIAL 88
## 10 MECANICA 76
## 11 MECATRONICA 70
## 12 QUIMICA 89
## 13 SISTEMAS 78
## 14 TIC 17
El resultado es el numero total de alumnos en primer semestre por carrera.
barplot(height = tabla1$Inscritos.1er.Semestre., names.arg = tabla1$Carreras)
administracion <- subset(x = alumnos, Carrera == "ADMINISTRACION" & Semestre > 1)
mean(administracion$Promedio)
## [1] 89.44312
arquitectura <- subset(x = alumnos, Carrera == "ARQUITECTURA" & Semestre > 1)
mean(arquitectura$Promedio)
## [1] 86.46481
bioquimica <- subset(x = alumnos, Carrera == "BIOQUIMICA" & Semestre > 1)
mean(bioquimica$Promedio)
## [1] 84.68143
civil <- subset(x = alumnos, Carrera == "CIVIL" & Semestre > 1)
mean(civil$Promedio)
## [1] 84.281
electrica <- subset(x = alumnos, Carrera == "ELECTRICA" & Semestre > 1)
mean(electrica$Promedio)
## [1] 83.77305
electronica <- subset(x = alumnos, Carrera == "ELECTRONICA" & Semestre > 1)
mean(electronica$Promedio)
## [1] 86.6572
gestion <- subset(x = alumnos, Carrera == "GESTION EMPRESARIAL" & Semestre > 1)
mean(gestion$Promedio)
## [1] 87.4929
informatica <- subset(x = alumnos, Carrera == "INFORMATICA" & Semestre > 1)
mean(informatica$Promedio)
## [1] 86.26577
industrial <- subset(x = alumnos, Carrera == "INDUSTRIAL" & Semestre > 1)
mean(industrial$Promedio)
## [1] 84.74268
mecanica <- subset(x = alumnos, Carrera == "MECANICA" & Semestre > 1)
mean(mecanica$Promedio)
## [1] 82.58467
mecatronica <- subset(x = alumnos, Carrera == "MECATRONICA" & Semestre > 1)
mean(mecatronica$Promedio)
## [1] 84.45948
quimica <- subset(x = alumnos, Carrera == "QUIMICA" & Semestre > 1)
mean(quimica$Promedio)
## [1] 86.05215
sistemas <- subset(x = alumnos, Carrera == "SISTEMAS" & Semestre > 1)
mean(sistemas$Promedio)
## [1] 85.67495
tics <- subset(x = alumnos, Carrera == "TIC" & Semestre > 1)
mean(tics$Promedio)
## [1] 84.31719
boxplot(Promedio ~ Semestre, administracion )
boxplot(Promedio ~ Semestre, arquitectura)
boxplot(Promedio ~ Semestre, bioquimica)
boxplot(Promedio ~ Semestre, civil)
boxplot(Promedio ~ Semestre, electrica)
boxplot(Promedio ~ Semestre, electronica)
boxplot(Promedio ~ Semestre, gestion)
boxplot(Promedio ~ Semestre, informatica)
boxplot(Promedio ~ Semestre, industrial)
boxplot(Promedio ~ Semestre, mecanica)
boxplot(Promedio ~ Semestre, mecatronica)
boxplot(Promedio ~ Semestre, quimica)
boxplot(Promedio ~ Semestre, sistemas)
boxplot(Promedio ~ Semestre, tics)
Al checar los datos de la BD se puede dar la informacion principal de los alumnos del Instituto Tecnologico de Durango inscritos en la institucion. Los alumnos inscritos en el semestre en cuerdo es de 5929 de las 14 Carreras que el ITD ofrece para todos.
Al hacer algunas consultas se puede verificar que las carreras con mas demanda en la institucion son: +En Primer lugar la carrera de arquitectura con 128 alumnos de nuevo ingreso. +En Segundo lugar se encuentran las carreras de gestion y quimica con 89 alumnos de nuevo ingreso. *Tambien se puede observar que la carrera con menor demanda es la Carrera de Tecnologias de la Informacion y Comunicacion (TIC) con 17 alumnos de nuevo ingreso.
Al continuar con nuestro analisis te puede observar lo siguiente: +La carrera con mayor alumnos inscritos en la institucion es la carrera de Administracion con 675 alumnos en total. +La carrera con el menor numero de alumnos inscritos es la Carrera de TICs.
Tambien se analizo los promedios de todos los alumnos de cada carrera a partir del semestre 2 en el cual se pudo observar lo siguiente: +El mejor promedio acumulado de todos los semestres lo tiene la carrera de administracion. +El promedio mas bajo acumulado de todos los semestres lo tiene la carrera de mecanica.
Por medio de graficas se pudo observar este tipo de estadisticas poco comunes como son las siguientes: +La carrera de Quimica tiene una variacion de mayor a menor en el promedio de los alumnos. +Algo poco comun que se puede apreciar en la grafica de la carrera de TICS es que siempre cursan por lo general 1,3,5,7,9 semestre en agosto-dic. Lo cual da como referencia que en tics no hay alumnos que cursen semestre cero para ingresar a la carrera. +En todas las carreras aproximadamente el promedio acumulado a lo largo de la carrera esta entre los 75 y 90.