library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library(readr)
datos.alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head (datos.alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 1 20190001 1 11 198 19 80.21 SISTEMAS
## 2 20190002 2 11 235 10 84.33 SISTEMAS
## 3 20190003 3 9 235 10 95.25 SISTEMAS
## 4 20190004 4 9 226 19 95.00 SISTEMAS
## 5 20190005 5 10 231 14 82.32 SISTEMAS
## 6 20190006 6 9 212 23 95.02 SISTEMAS
tail(datos.alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 5924 20195924 5924 2 27 28 92.83 ADMINISTRACION
## 5925 20195925 5925 7 94 13 80.95 ADMINISTRACION
## 5926 20195926 5926 5 103 32 92.68 ADMINISTRACION
## 5927 20195927 5927 4 79 34 86.18 ADMINISTRACION
## 5928 20195928 5928 5 108 32 90.48 ADMINISTRACION
## 5929 20195929 5929 7 169 32 92.33 ADMINISTRACION
tabla_frecuencias <- data.frame(fdt_cat(datos.alumnos$Carrera))
names(tabla_frecuencias) <- c("Clase", "Freq", "FreqRel", "FrecPorc","FreqAcum", "FrecAcumPorc")
tabla_frecuencias
## Clase Freq FreqRel FrecPorc FreqAcum FrecAcumPorc
## 1 INDUSTRIAL 707 0.11924439 11.924439 707 11.92444
## 2 ARQUITECTURA 675 0.11384719 11.384719 1382 23.30916
## 3 CIVIL 648 0.10929330 10.929330 2030 34.23849
## 4 GESTION EMPRESARIAL 585 0.09866757 9.866757 2615 44.10525
## 5 QUIMICA 568 0.09580030 9.580030 3183 53.68528
## 6 ADMINISTRACION 497 0.08382527 8.382527 3680 62.06780
## 7 SISTEMAS 452 0.07623545 7.623545 4132 69.69135
## 8 BIOQUIMICA 441 0.07438017 7.438017 4573 77.12936
## 9 MECATRONICA 432 0.07286220 7.286220 5005 84.41558
## 10 MECANICA 301 0.05076741 5.076741 5306 89.49233
## 11 ELECTRICA 280 0.04722550 4.722550 5586 94.21488
## 12 ELECTRONICA 161 0.02715466 2.715466 5747 96.93034
## 13 INFORMATICA 101 0.01703491 1.703491 5848 98.63383
## 14 TIC 81 0.01366166 1.366166 5929 100.00000
barplot(main = "Alumnos por Carrera",
xlab = "Carreras", ylab = "Frecuencia Absoluta",
height = tabla_frecuencias$Freq,
names.arg = substr(tabla_frecuencias$Clase,1,3))
Son 8 filas en total y la variable mas importante para obtener frecuencia es el total de alumnos, y las carreras con mas alumnos son arquitectura y civil y las que tienen menos son informatica y TICS los alumnos que representan el 35% creo que serian (Mecanica, Tics y Electronica) y el 50% vendrian siendo (Industrial, Civil ,Quimica) y sistemas creeo que esta en un punto medio. Las tablas de distribucion sirven para ordenar los datos mediante sus frecuencias En las graficas se interpreta los valores que representan los numeros. La verdad estuvo medio complicado andar buscando y corrigiendo errores