Objetivo

Cargar Librerias

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(readr)

Cargar los datos

datos.alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

datos.alumnos

Mostrar los datos head() y tail()

head (datos.alumnos)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS
tail(datos.alumnos)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
## 5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
## 5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
## 5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
## 5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
## 5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

Generar tabla de frecuencias alumnos inscritos

tabla_frecuencias <- data.frame(fdt_cat(datos.alumnos$Carrera))
names(tabla_frecuencias) <- c("Clase", "Freq", "FreqRel", "FrecPorc","FreqAcum", "FrecAcumPorc")
tabla_frecuencias
##                  Clase Freq    FreqRel  FrecPorc FreqAcum FrecAcumPorc
## 1           INDUSTRIAL  707 0.11924439 11.924439      707     11.92444
## 2         ARQUITECTURA  675 0.11384719 11.384719     1382     23.30916
## 3                CIVIL  648 0.10929330 10.929330     2030     34.23849
## 4  GESTION EMPRESARIAL  585 0.09866757  9.866757     2615     44.10525
## 5              QUIMICA  568 0.09580030  9.580030     3183     53.68528
## 6       ADMINISTRACION  497 0.08382527  8.382527     3680     62.06780
## 7             SISTEMAS  452 0.07623545  7.623545     4132     69.69135
## 8           BIOQUIMICA  441 0.07438017  7.438017     4573     77.12936
## 9          MECATRONICA  432 0.07286220  7.286220     5005     84.41558
## 10            MECANICA  301 0.05076741  5.076741     5306     89.49233
## 11           ELECTRICA  280 0.04722550  4.722550     5586     94.21488
## 12         ELECTRONICA  161 0.02715466  2.715466     5747     96.93034
## 13         INFORMATICA  101 0.01703491  1.703491     5848     98.63383
## 14                 TIC   81 0.01366166  1.366166     5929    100.00000

Grafica de alumnos en total

barplot(main = "Alumnos por Carrera",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = tabla_frecuencias$Freq, 
        names.arg = substr(tabla_frecuencias$Clase,1,3))

Descripcion

Son 8 filas en total y la variable mas importante para obtener frecuencia es el total de alumnos, y las carreras con mas alumnos son arquitectura y civil y las que tienen menos son informatica y TICS los alumnos que representan el 35% creo que serian (Mecanica, Tics y Electronica) y el 50% vendrian siendo (Industrial, Civil ,Quimica) y sistemas creeo que esta en un punto medio. Las tablas de distribucion sirven para ordenar los datos mediante sus frecuencias En las graficas se interpreta los valores que representan los numeros. La verdad estuvo medio complicado andar buscando y corrigiendo errores