Objetivo

Desarrolla tabla de frecuencia gráficos para identificar alumnos inscritos ## Descripción Cargar datos de los alumnos inscritos en el semestre Septiembre 2020-Enero 2021 y determinar frecuencias absolutas, relativas, porcentuales, acumuladas y generar gráficos de barras.

Datos

1.- Cargar librerias

library(fdth)
library(readr)
set.seed(2020)

2.- Cargar datos de la dirreccion

datos.alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

3.- Mostrar

head(datos.alumnos)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS
tail(datos.alumnos)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
## 5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
## 5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
## 5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
## 5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
## 5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

4.- Generar tabla

alumnosPrimero <- subset(datos.alumnos, Semestre == 1)
head(alumnosPrimero)
##    No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 75    20190075     75        1       NA    27        0 SISTEMAS
## 76    20190076     76        1       NA    27        0 SISTEMAS
## 77    20190077     77        1       NA    27        0 SISTEMAS
## 83    20190083     83        1       NA    27        0 SISTEMAS
## 85    20190085     85        1       NA    27        0 SISTEMAS
## 86    20190086     86        1       NA    27        0 SISTEMAS
tail(alumnosPrimero)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5885    20195885   5885        1       NA    27        0 ADMINISTRACION
## 5893    20195893   5893        1       NA    27        0 ADMINISTRACION
## 5894    20195894   5894        1       NA    27        0 ADMINISTRACION
## 5895    20195895   5895        1       NA    27        0 ADMINISTRACION
## 5914    20195914   5914        1       NA    27        0 ADMINISTRACION
## 5915    20195915   5915        1       NA    27        0 ADMINISTRACION
tabla.frec.Primero <- data.frame(fdt_cat(alumnosPrimero$Carrera))
tabla.frec.Primero
##               Category   f         rf     rf...   cf     cf...
## 1         ARQUITECTURA 128 0.12415131 12.415131  128  12.41513
## 2  GESTION EMPRESARIAL  89 0.08632396  8.632396  217  21.04753
## 3              QUIMICA  89 0.08632396  8.632396  306  29.67992
## 4           INDUSTRIAL  88 0.08535403  8.535403  394  38.21532
## 5                CIVIL  86 0.08341416  8.341416  480  46.55674
## 6           BIOQUIMICA  84 0.08147430  8.147430  564  54.70417
## 7       ADMINISTRACION  83 0.08050436  8.050436  647  62.75461
## 8             SISTEMAS  78 0.07565470  7.565470  725  70.32008
## 9            ELECTRICA  77 0.07468477  7.468477  802  77.78855
## 10            MECANICA  76 0.07371484  7.371484  878  85.16004
## 11         MECATRONICA  70 0.06789525  6.789525  948  91.94956
## 12         ELECTRONICA  36 0.03491756  3.491756  984  95.44132
## 13         INFORMATICA  30 0.02909796  2.909796 1014  98.35112
## 14                 TIC  17 0.01648885  1.648885 1031 100.00000
cat("Para mejor visualizacion podemos cambiar los nombres")
## Para mejor visualizacion podemos cambiar los nombres
names(tabla.frec.Primero) <- c("Carrera","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc")

tabla.frec.Primero
##                Carrera Frec.Absoluta Frec.Relativa Frec.Porc Frec.Acum
## 1         ARQUITECTURA           128    0.12415131 12.415131       128
## 2  GESTION EMPRESARIAL            89    0.08632396  8.632396       217
## 3              QUIMICA            89    0.08632396  8.632396       306
## 4           INDUSTRIAL            88    0.08535403  8.535403       394
## 5                CIVIL            86    0.08341416  8.341416       480
## 6           BIOQUIMICA            84    0.08147430  8.147430       564
## 7       ADMINISTRACION            83    0.08050436  8.050436       647
## 8             SISTEMAS            78    0.07565470  7.565470       725
## 9            ELECTRICA            77    0.07468477  7.468477       802
## 10            MECANICA            76    0.07371484  7.371484       878
## 11         MECATRONICA            70    0.06789525  6.789525       948
## 12         ELECTRONICA            36    0.03491756  3.491756       984
## 13         INFORMATICA            30    0.02909796  2.909796      1014
## 14                 TIC            17    0.01648885  1.648885      1031
##    Frec.Acum.Porc
## 1        12.41513
## 2        21.04753
## 3        29.67992
## 4        38.21532
## 5        46.55674
## 6        54.70417
## 7        62.75461
## 8        70.32008
## 9        77.78855
## 10       85.16004
## 11       91.94956
## 12       95.44132
## 13       98.35112
## 14      100.00000

5.- Genera gráfica

barplot(main = "Alumnos de Primer Semestre",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = tabla.frec.Primero$Frec.Absoluta, 
        names.arg = substr(tabla.frec.Primero$Carrera,1,3))

6.- Genera tabla

tabla.frec <- data.frame(fdt_cat(datos.alumnos$Carrera))
names(tabla.frec) <- c("Carrera","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc")

tabla.frec
##                Carrera Frec.Absoluta Frec.Relativa Frec.Porc Frec.Acum
## 1           INDUSTRIAL           707    0.11924439 11.924439       707
## 2         ARQUITECTURA           675    0.11384719 11.384719      1382
## 3                CIVIL           648    0.10929330 10.929330      2030
## 4  GESTION EMPRESARIAL           585    0.09866757  9.866757      2615
## 5              QUIMICA           568    0.09580030  9.580030      3183
## 6       ADMINISTRACION           497    0.08382527  8.382527      3680
## 7             SISTEMAS           452    0.07623545  7.623545      4132
## 8           BIOQUIMICA           441    0.07438017  7.438017      4573
## 9          MECATRONICA           432    0.07286220  7.286220      5005
## 10            MECANICA           301    0.05076741  5.076741      5306
## 11           ELECTRICA           280    0.04722550  4.722550      5586
## 12         ELECTRONICA           161    0.02715466  2.715466      5747
## 13         INFORMATICA           101    0.01703491  1.703491      5848
## 14                 TIC            81    0.01366166  1.366166      5929
##    Frec.Acum.Porc
## 1        11.92444
## 2        23.30916
## 3        34.23849
## 4        44.10525
## 5        53.68528
## 6        62.06780
## 7        69.69135
## 8        77.12936
## 9        84.41558
## 10       89.49233
## 11       94.21488
## 12       96.93034
## 13       98.63383
## 14      100.00000

7.- Genera grafica

barplot(main = "Alumnos de Todos los Semestre",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = tabla.frec$Frec.Absoluta, 
        names.arg = substr(tabla.frec$Carrera,1,3))

8.- Genera tabla

ARQUITECTURA <- subset(datos.alumnos, Carrera == "ARQUITECTURA")
ARQUITECTURA$Semestre <- factor(ARQUITECTURA$Semestre)

tabla.frec <- data.frame(fdt_cat(ARQUITECTURA$Semestre))
names(tabla.frec) <- c("Semestre","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc")

tabla.frec
##    Semestre Frec.Absoluta Frec.Relativa Frec.Porc Frec.Acum Frec.Acum.Porc
## 1         1           128    0.18962963 18.962963       128       18.96296
## 2         2            87    0.12888889 12.888889       215       31.85185
## 3         3            66    0.09777778  9.777778       281       41.62963
## 4         6            64    0.09481481  9.481481       345       51.11111
## 5         4            62    0.09185185  9.185185       407       60.29630
## 6         8            60    0.08888889  8.888889       467       69.18519
## 7         5            58    0.08592593  8.592593       525       77.77778
## 8         7            53    0.07851852  7.851852       578       85.62963
## 9         9            47    0.06962963  6.962963       625       92.59259
## 10       10            31    0.04592593  4.592593       656       97.18519
## 11       12            11    0.01629630  1.629630       667       98.81481
## 12       11             8    0.01185185  1.185185       675      100.00000

Quimica

QUIMICA <- subset(datos.alumnos, Carrera == "QUIMICA")
QUIMICA$Semestre <- factor(QUIMICA$Semestre)

tabla.frec2 <- data.frame(fdt_cat(QUIMICA$Semestre))
names(tabla.frec2) <- c("Semestre","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc")

tabla.frec2
##    Semestre Frec.Absoluta Frec.Relativa  Frec.Porc Frec.Acum Frec.Acum.Porc
## 1         1            89   0.156690141 15.6690141        89       15.66901
## 2         3            77   0.135563380 13.5563380       166       29.22535
## 3         2            65   0.114436620 11.4436620       231       40.66901
## 4         5            65   0.114436620 11.4436620       296       52.11268
## 5         7            58   0.102112676 10.2112676       354       62.32394
## 6         9            57   0.100352113 10.0352113       411       72.35915
## 7         8            54   0.095070423  9.5070423       465       81.86620
## 8         4            39   0.068661972  6.8661972       504       88.73239
## 9         6            32   0.056338028  5.6338028       536       94.36620
## 10       10            19   0.033450704  3.3450704       555       97.71127
## 11       11             8   0.014084507  1.4084507       563       99.11972
## 12       12             4   0.007042254  0.7042254       567       99.82394
## 13       13             1   0.001760563  0.1760563       568      100.00000

Electronica

ELECTRONICA <- subset(datos.alumnos, Carrera == "Electronica")
ELECTRONICA$Semestre <- factor(ELECTRONICA$Semestre)

tabla.frec3 <- data.frame(fdt_cat(ELECTRONICA$Semestre))
names(tabla.frec3) <- c("Semestre","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc")

tabla.frec3
## [1] Semestre       Frec.Absoluta  Frec.Relativa  Frec.Porc      Frec.Acum     
## [6] Frec.Acum.Porc
## <0 rows> (or 0-length row.names)

9.- Genera grafica

barplot(main = "Alumnos de ARQUITECTURA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = tabla.frec$Frec.Absoluta, 
        names.arg = tabla.frec$Semestre)

Quimica

  barplot(main = "Alumnos de QUIMICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = tabla.frec2$Frec.Absoluta, 
        names.arg = tabla.frec2$Semestre)

10.- Genera descripcion

*La variable de interes que se tiene en este caso es alumnos y carrera, que son las que mas se utilizan en el caso, podemos indentificar con los graficos los alumnos que estan inscritos en cada una de sus correspondientes carreras, podemos ver sus calificaciones en modo promediado, para completar podemos visualizar hay mas alumnos en la carrera de industrial que en las demas, y una de las carrera con menos demanda seria informatica, con respecto a los datos. tambien podemos checar que el promedio mas alto hasta el momento en de 92.8% en todo el tecnologico de durango.