library(readr)
datos <- read_csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/practicas%20R/unidad%202/alumnos%20itd%20inscritos%20licenciatura%20presencial.csv")
## Parsed with column specification:
## cols(
## CARRERA = col_character(),
## Semestre = col_integer(),
## `Cr. Apr.` = col_integer(),
## Carga = col_integer(),
## Promedio = col_double()
## )
# Los primeros 6 y últimos 6 registros
head(datos)
## # A tibble: 6 x 5
## CARRERA Semestre `Cr. Apr.` Carga Promedio
## <chr> <int> <int> <int> <dbl>
## 1 ADMINISTRACION 1 NA 27 0
## 2 ADMINISTRACION 1 NA 27 0
## 3 ADMINISTRACION 1 NA 27 0
## 4 ADMINISTRACION 1 NA 27 0
## 5 ADMINISTRACION 1 NA 27 0
## 6 ADMINISTRACION 1 NA 27 0
tail(datos)
## # A tibble: 6 x 5
## CARRERA Semestre `Cr. Apr.` Carga Promedio
## <chr> <int> <int> <int> <dbl>
## 1 INDUSTRIAL 2 27 20 85.83
## 2 INDUSTRIAL 2 27 24 89.00
## 3 INDUSTRIAL 1 NA 27 0.00
## 4 INDUSTRIAL 1 NA 27 0.00
## 5 INDUSTRIAL 1 NA 27 0.00
## 6 INDUSTRIAL 1 NA 27 0.00
Generar las frecuencias y probabilidades de Alumnos X Carrera
n <- length(datos$CARRERA) # cantidad de alumnos POBLACIÓN
alumnoscarreras <- transform(table(datos$CARRERA))
alumnoscarreras <- data.frame(alumnoscarreras, Propor = round(alumnoscarreras$Freq / n ,4), Porc = round(alumnoscarreras$Freq / n * 100, 4))
alumnoscarreras
## Var1 Freq Propor Porc
## 1 ADMINISTRACION 493 0.0752 7.5198
## 2 ARQUITECTURA 700 0.1068 10.6772
## 3 BIOQUIMICA 388 0.0592 5.9182
## 4 CIVIL 796 0.1214 12.1415
## 5 ELECTRICA 278 0.0424 4.2404
## 6 ELECTRONICA 246 0.0375 3.7523
## 7 GESTION EMPRESARIAL 668 0.1019 10.1891
## 8 INDUSTRIAL 781 0.1191 11.9128
## 9 INFORMATICA 156 0.0238 2.3795
## 10 MECANICA 372 0.0567 5.6742
## 11 MECATRONICA 571 0.0871 8.7096
## 12 QUIMICA 484 0.0738 7.3826
## 13 SISTEMAS 523 0.0798 7.9774
## 14 TECNOLOGIAS DE INFORMACION Y COMUNICACIONES 100 0.0153 1.5253
totales <- data.frame(Var1 = "Totales", Freq = sum(alumnoscarreras$Freq), Propor = sum(alumnoscarreras$Propor), Porc = round(sum(alumnoscarreras$Porc)))
alumnoscarreras <- rbind(alumnoscarreras, totales)
alumnoscarreras
## Var1 Freq Propor Porc
## 1 ADMINISTRACION 493 0.0752 7.5198
## 2 ARQUITECTURA 700 0.1068 10.6772
## 3 BIOQUIMICA 388 0.0592 5.9182
## 4 CIVIL 796 0.1214 12.1415
## 5 ELECTRICA 278 0.0424 4.2404
## 6 ELECTRONICA 246 0.0375 3.7523
## 7 GESTION EMPRESARIAL 668 0.1019 10.1891
## 8 INDUSTRIAL 781 0.1191 11.9128
## 9 INFORMATICA 156 0.0238 2.3795
## 10 MECANICA 372 0.0567 5.6742
## 11 MECATRONICA 571 0.0871 8.7096
## 12 QUIMICA 484 0.0738 7.3826
## 13 SISTEMAS 523 0.0798 7.9774
## 14 TECNOLOGIAS DE INFORMACION Y COMUNICACIONES 100 0.0153 1.5253
## 15 Totales 6556 1.0000 100.0000
Generar las frecuencias y probabilidades de Alumnos X SEMESTRE
n <- length(datos$Semestre) # cantidad de alumnos POBLACIÓN
n
## [1] 6556
alumnossemestre <- transform(table(datos$Semestre))
alumnossemestre <- data.frame(alumnossemestre, Propor = round(alumnossemestre$Freq / n ,4), Porc = round(alumnossemestre$Freq / n * 100, 4))
totales <- data.frame(Var1 = "Totales", Freq = sum(alumnossemestre$Freq), Propor = round(sum(alumnossemestre$Propor)), Porc = round(sum(alumnossemestre$Porc)))
alumnossemestre <- rbind(alumnossemestre, totales)
alumnossemestre
## Var1 Freq Propor Porc
## 1 1 927 0.1414 14.1397
## 2 2 620 0.0946 9.4570
## 3 3 673 0.1027 10.2654
## 4 4 526 0.0802 8.0232
## 5 5 691 0.1054 10.5400
## 6 6 466 0.0711 7.1080
## 7 7 721 0.1100 10.9976
## 8 8 449 0.0685 6.8487
## 9 9 723 0.1103 11.0281
## 10 10 334 0.0509 5.0946
## 11 11 220 0.0336 3.3557
## 12 12 103 0.0157 1.5711
## 13 13 56 0.0085 0.8542
## 14 14 34 0.0052 0.5186
## 15 15 7 0.0011 0.1068
## 16 17 4 0.0006 0.0610
## 17 18 1 0.0002 0.0153
## 18 19 1 0.0002 0.0153
## 19 Totales 6556 1.0000 100.0000