Mi nombre es Myriam Velázquez Franco, con número de control c19041180. En la siguiente práctica se pondrá en uso lo aprendido en los últimos día en PyE.

OBJETIVO: Desarrollar tablas de frecuencia gráficas para identificar a los alumnos inscritos.

DESCRIPCIÓN: Cargar datos de los alumnos inscritos en el semestre Septiembre 2020- Enero 2021 y determinar frecuencias: frecuencia absoluta,porcentual, acumulada y generar gráficas.

PASO 1

Lo primero que haremos será cargar las librerías previamente instaladas.

library(readr)
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var

PASO 2:

Cargaremos los datos de la dirección URL que proporcionó el profesor NOTA: Le asignamos el nombre de ‘datos.alumnos’ a esta información.

datos.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

así podemos ver el conjunto de datos que acabamos de cargar:

-> datos.alumnos

pero no lo haremos porque la lista es muy larga.

También podemos usar la función View() para poder ver la variable:

-> View(datos.alumnos)

(de igual manera se puede entrar dandole click en nuestro Enviroment) aunque no lo haremos, es importante saberlo.

PASO 3:

Vamos a mostrar los primeros 6 y últimos 6 observaciones del conjunto de datos.

para ver los primeros 6 usaremos la función head()

head(datos.alumnos)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS

y para ver los últimos 6 usarelos la función

tail()

tail(datos.alumnos)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
## 5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
## 5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
## 5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
## 5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
## 5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

PASO 4:

Crearemos una tabla de distribución de los alumnos de primer semestre de cada carrera.

Primero filtraremos a los alumnos para quedarnos solo con los de primer semestre. Para eso usaremos subset()

AlumnosPrimer = subset(datos.alumnos, Semestre == 1)

ahora también podemos mostrar los primeros 6 y últimos 6 alumnos pero solamente de primer semestre.

head(AlumnosPrimer)
##    No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 75    20190075     75        1       NA    27        0 SISTEMAS
## 76    20190076     76        1       NA    27        0 SISTEMAS
## 77    20190077     77        1       NA    27        0 SISTEMAS
## 83    20190083     83        1       NA    27        0 SISTEMAS
## 85    20190085     85        1       NA    27        0 SISTEMAS
## 86    20190086     86        1       NA    27        0 SISTEMAS
tail(AlumnosPrimer)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5885    20195885   5885        1       NA    27        0 ADMINISTRACION
## 5893    20195893   5893        1       NA    27        0 ADMINISTRACION
## 5894    20195894   5894        1       NA    27        0 ADMINISTRACION
## 5895    20195895   5895        1       NA    27        0 ADMINISTRACION
## 5914    20195914   5914        1       NA    27        0 ADMINISTRACION
## 5915    20195915   5915        1       NA    27        0 ADMINISTRACION

Para crear la tabla de distribucion usaremos la función:

fdt_cat()

TablaDistribuPrimero = data.frame(fdt_cat(AlumnosPrimer$Carrera))

para tener un trabajo más organizado, le cambiaremos el nombre a los tílulos de nuestras columnas, para eso usaremos la función: names()

names(TablaDistribuPrimero) = c("Carrera", "Frecu. Absolut","Frecu. Relativa", 
                                "Frecu. Porcent", "Frecu. Acum.",
                                "Frecu. Acum. Porcent" )
TablaDistribuPrimero
##                Carrera Frecu. Absolut Frecu. Relativa Frecu. Porcent
## 1         ARQUITECTURA            128      0.12415131      12.415131
## 2  GESTION EMPRESARIAL             89      0.08632396       8.632396
## 3              QUIMICA             89      0.08632396       8.632396
## 4           INDUSTRIAL             88      0.08535403       8.535403
## 5                CIVIL             86      0.08341416       8.341416
## 6           BIOQUIMICA             84      0.08147430       8.147430
## 7       ADMINISTRACION             83      0.08050436       8.050436
## 8             SISTEMAS             78      0.07565470       7.565470
## 9            ELECTRICA             77      0.07468477       7.468477
## 10            MECANICA             76      0.07371484       7.371484
## 11         MECATRONICA             70      0.06789525       6.789525
## 12         ELECTRONICA             36      0.03491756       3.491756
## 13         INFORMATICA             30      0.02909796       2.909796
## 14                 TIC             17      0.01648885       1.648885
##    Frecu. Acum. Frecu. Acum. Porcent
## 1           128             12.41513
## 2           217             21.04753
## 3           306             29.67992
## 4           394             38.21532
## 5           480             46.55674
## 6           564             54.70417
## 7           647             62.75461
## 8           725             70.32008
## 9           802             77.78855
## 10          878             85.16004
## 11          948             91.94956
## 12          984             95.44132
## 13         1014             98.35112
## 14         1031            100.00000

PASO 5:

Hacer gráfica de barras de la frecuencia de alumnos de primer semestre por cada carrera.

Para eso necesitaremos la función:

barplot()

barplot(main = "Alumnos Primer Semestre",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = TablaDistribuPrimero$`Frecu. Absolut`, 
        names.arg = substr(TablaDistribuPrimero$Carrera,1,3))

PASO 6: Ahora tenemos que generar la tabla de distribucón de todos los alummos. Seguimos los mismos pasos del comienzo,con la función:

fdt_cat() pero ahora tomando en cuenta a todo el conjunto de datos, y del conjuto, tomamos la carrera.

TablaFrecTodos = data.frame(fdt_cat(datos.alumnos$Carrera))

Nuevamente cambiamos los nombres de las columnas.

names(TablaFrecTodos) = c("Carrera", "Frecu. Absolut","Frecu. Relativa", 
                                "Frecu. Porcent", "Frecu. Acum.",
                                "Frecu. Acum. Porcent" )

Vamos a ver nuestra tabla de frecuencias

TablaFrecTodos
##                Carrera Frecu. Absolut Frecu. Relativa Frecu. Porcent
## 1           INDUSTRIAL            707      0.11924439      11.924439
## 2         ARQUITECTURA            675      0.11384719      11.384719
## 3                CIVIL            648      0.10929330      10.929330
## 4  GESTION EMPRESARIAL            585      0.09866757       9.866757
## 5              QUIMICA            568      0.09580030       9.580030
## 6       ADMINISTRACION            497      0.08382527       8.382527
## 7             SISTEMAS            452      0.07623545       7.623545
## 8           BIOQUIMICA            441      0.07438017       7.438017
## 9          MECATRONICA            432      0.07286220       7.286220
## 10            MECANICA            301      0.05076741       5.076741
## 11           ELECTRICA            280      0.04722550       4.722550
## 12         ELECTRONICA            161      0.02715466       2.715466
## 13         INFORMATICA            101      0.01703491       1.703491
## 14                 TIC             81      0.01366166       1.366166
##    Frecu. Acum. Frecu. Acum. Porcent
## 1           707             11.92444
## 2          1382             23.30916
## 3          2030             34.23849
## 4          2615             44.10525
## 5          3183             53.68528
## 6          3680             62.06780
## 7          4132             69.69135
## 8          4573             77.12936
## 9          5005             84.41558
## 10         5306             89.49233
## 11         5586             94.21488
## 12         5747             96.93034
## 13         5848             98.63383
## 14         5929            100.00000

PASO 7:

Generar gráficas de barras de la frecuencia de los alumnos de todos los semestres.

Vamos a comenzar a crear la gráfica de barras de la FRECUENCIA ABSOLUTA de todos los semestres.

barplot(main = "Alumnos TODOS los Semestres",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = TablaFrecTodos$`Frecu. Absolut`, 
        names.arg = substr(TablaFrecTodos$Carrera,1,3))

seguimos con la gráfica de la FRECUENCIA RELATIVA

barplot(main = "Alumnos TODOS los Semestres",
        xlab = "Carreras", ylab = "Frecuencia Relativa",
        height = TablaFrecTodos$`Frecu. Relativa`, 
        names.arg = substr(TablaFrecTodos$Carrera,1,3))

y terminamos con nuestra FRECUENCIA PORCENTUAL.

barplot(main = "Alumnos TODOS los Semestres",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = TablaFrecTodos$`Frecu. Absolut`, 
        names.arg = substr(TablaFrecTodos$Carrera,1,3))

PASO 8:

Generar tabla de distribución de frecuencias de alumnos inscritos por carreras, por semestre. IMPORTANTE: Una tabla por cada carrera.

1.Empezamos con la carrera de INDUSTRIAL.

INDUSTRIAL = subset(datos.alumnos, Carrera == "INDUSTRIAL")
INDUSTRIAL$Semestre = factor(INDUSTRIAL$Semestre)

TablaFrecIndus = data.frame(fdt_cat(INDUSTRIAL$Semestre))
names(TablaFrecIndus) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecIndus
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            88   0.124469590    12.4469590              88
## 2         3            87   0.123055163    12.3055163             175
## 3         5            82   0.115983027    11.5983027             257
## 4         7            77   0.108910891    10.8910891             334
## 5         6            76   0.107496464    10.7496464             410
## 6         2            75   0.106082037    10.6082037             485
## 7         4            69   0.097595474     9.7595474             554
## 8         8            69   0.097595474     9.7595474             623
## 9         9            38   0.053748232     5.3748232             661
## 10       10            24   0.033946252     3.3946252             685
## 11       11             8   0.011315417     1.1315417             693
## 12       12             6   0.008486563     0.8486563             699
## 13       14             5   0.007072136     0.7072136             704
## 14       13             3   0.004243281     0.4243281             707
##    Frecu.Acum.Porcent
## 1            12.44696
## 2            24.75248
## 3            36.35078
## 4            47.24187
## 5            57.99151
## 6            68.59972
## 7            78.35926
## 8            88.11881
## 9            93.49364
## 10           96.88826
## 11           98.01980
## 12           98.86846
## 13           99.57567
## 14          100.00000

2.Seguimos con ARQUITECTURA.

ARQUITECTURA = subset(datos.alumnos, Carrera == "ARQUITECTURA")
ARQUITECTURA$Semestre = factor(ARQUITECTURA$Semestre)

TablaFrecArqui = data.frame(fdt_cat(ARQUITECTURA$Semestre))
names(TablaFrecArqui) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecArqui
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1           128    0.18962963     18.962963             128
## 2         2            87    0.12888889     12.888889             215
## 3         3            66    0.09777778      9.777778             281
## 4         6            64    0.09481481      9.481481             345
## 5         4            62    0.09185185      9.185185             407
## 6         8            60    0.08888889      8.888889             467
## 7         5            58    0.08592593      8.592593             525
## 8         7            53    0.07851852      7.851852             578
## 9         9            47    0.06962963      6.962963             625
## 10       10            31    0.04592593      4.592593             656
## 11       12            11    0.01629630      1.629630             667
## 12       11             8    0.01185185      1.185185             675
##    Frecu.Acum.Porcent
## 1            18.96296
## 2            31.85185
## 3            41.62963
## 4            51.11111
## 5            60.29630
## 6            69.18519
## 7            77.77778
## 8            85.62963
## 9            92.59259
## 10           97.18519
## 11           98.81481
## 12          100.00000

3.Ahora CIVIL.

CIVIL = subset(datos.alumnos, Carrera == "CIVIL")
CIVIL$Semestre = factor(CIVIL$Semestre)

TablaFrecCivil = data.frame(fdt_cat(CIVIL$Semestre))
names(TablaFrecCivil) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")

TablaFrecCivil
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            86    0.13271605     13.271605              86
## 2         2            74    0.11419753     11.419753             160
## 3         6            72    0.11111111     11.111111             232
## 4         5            71    0.10956790     10.956790             303
## 5         3            66    0.10185185     10.185185             369
## 6         4            66    0.10185185     10.185185             435
## 7         7            58    0.08950617      8.950617             493
## 8         8            57    0.08796296      8.796296             550
## 9         9            44    0.06790123      6.790123             594
## 10       10            30    0.04629630      4.629630             624
## 11       12            15    0.02314815      2.314815             639
## 12       11             8    0.01234568      1.234568             647
## 13       15             1    0.00154321      0.154321             648
##    Frecu.Acum.Porcent
## 1            13.27160
## 2            24.69136
## 3            35.80247
## 4            46.75926
## 5            56.94444
## 6            67.12963
## 7            76.08025
## 8            84.87654
## 9            91.66667
## 10           96.29630
## 11           98.61111
## 12           99.84568
## 13          100.00000

4.Ahora GESTIÓN EMPRESARIAL.

GESTION= subset(datos.alumnos, Carrera == "GESTION EMPRESARIAL")
GESTION$Semestre = factor(GESTION$Semestre)

TablaFrecGes = data.frame(fdt_cat(GESTION$Semestre))
names(TablaFrecGes) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecGes
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            89   0.152136752    15.2136752              89
## 2         3            73   0.124786325    12.4786325             162
## 3         5            67   0.114529915    11.4529915             229
## 4         8            63   0.107692308    10.7692308             292
## 5         7            58   0.099145299     9.9145299             350
## 6         6            54   0.092307692     9.2307692             404
## 7         9            48   0.082051282     8.2051282             452
## 8         2            41   0.070085470     7.0085470             493
## 9         4            40   0.068376068     6.8376068             533
## 10       10            29   0.049572650     4.9572650             562
## 11       11            16   0.027350427     2.7350427             578
## 12       12             6   0.010256410     1.0256410             584
## 13       13             1   0.001709402     0.1709402             585
##    Frecu.Acum.Porcent
## 1            15.21368
## 2            27.69231
## 3            39.14530
## 4            49.91453
## 5            59.82906
## 6            69.05983
## 7            77.26496
## 8            84.27350
## 9            91.11111
## 10           96.06838
## 11           98.80342
## 12           99.82906
## 13          100.00000

5.Ahora QUÍMICA.

QUIMICA = subset(datos.alumnos, Carrera == "QUIMICA")
QUIMICA$Semestre = factor(QUIMICA$Semestre)

TablaFrecQuim = data.frame(fdt_cat(QUIMICA$Semestre))
names(TablaFrecQuim) = c("Semestre","Frecu.Absolut",
                        "Frecu.Relativ","Frecu.Porcent",
                        "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecQuim
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            89   0.156690141    15.6690141              89
## 2         3            77   0.135563380    13.5563380             166
## 3         2            65   0.114436620    11.4436620             231
## 4         5            65   0.114436620    11.4436620             296
## 5         7            58   0.102112676    10.2112676             354
## 6         9            57   0.100352113    10.0352113             411
## 7         8            54   0.095070423     9.5070423             465
## 8         4            39   0.068661972     6.8661972             504
## 9         6            32   0.056338028     5.6338028             536
## 10       10            19   0.033450704     3.3450704             555
## 11       11             8   0.014084507     1.4084507             563
## 12       12             4   0.007042254     0.7042254             567
## 13       13             1   0.001760563     0.1760563             568
##    Frecu.Acum.Porcent
## 1            15.66901
## 2            29.22535
## 3            40.66901
## 4            52.11268
## 5            62.32394
## 6            72.35915
## 7            81.86620
## 8            88.73239
## 9            94.36620
## 10           97.71127
## 11           99.11972
## 12           99.82394
## 13          100.00000

6.Ahora ADMINISTRCIÓN.

ADMINISTRACION = subset(datos.alumnos, Carrera == "ADMINISTRACION")
ADMINISTRACION$Semestre = factor(ADMINISTRACION$Semestre)

TablaFrecAdmin = data.frame(fdt_cat(ADMINISTRACION$Semestre))
names(TablaFrecAdmin) = c("Semestre","Frecu.Absolut",
                         "Frecu.Relativ","Frecu.Porcent",
                         "Frecu.Acumulada","Frecu.Acum.Porcent")

TablaFrecAdmin
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            83    0.16700201     16.700201              83
## 2         5            66    0.13279678     13.279678             149
## 3         7            65    0.13078471     13.078471             214
## 4         3            62    0.12474849     12.474849             276
## 5         8            49    0.09859155      9.859155             325
## 6         9            46    0.09255533      9.255533             371
## 7         2            37    0.07444668      7.444668             408
## 8         6            31    0.06237425      6.237425             439
## 9         4            27    0.05432596      5.432596             466
## 10       10            15    0.03018109      3.018109             481
## 11       11            12    0.02414487      2.414487             493
## 12       12             4    0.00804829      0.804829             497
##    Frecu.Acum.Porcent
## 1            16.70020
## 2            29.97988
## 3            43.05835
## 4            55.53320
## 5            65.39235
## 6            74.64789
## 7            82.09256
## 8            88.32998
## 9            93.76258
## 10           96.78068
## 11           99.19517
## 12          100.00000

7.Ahora SISTEMAS.

SISTEMAS = subset(datos.alumnos, Carrera == "SISTEMAS")
SISTEMAS$Semestre = factor(SISTEMAS$Semestre)

TablaFrecSis = data.frame(fdt_cat(SISTEMAS$Semestre))
names(TablaFrecSis) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecSis
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            78   0.172566372    17.2566372              78
## 2         3            64   0.141592920    14.1592920             142
## 3         7            58   0.128318584    12.8318584             200
## 4         5            51   0.112831858    11.2831858             251
## 5         8            46   0.101769912    10.1769912             297
## 6         4            38   0.084070796     8.4070796             335
## 7         9            35   0.077433628     7.7433628             370
## 8         2            29   0.064159292     6.4159292             399
## 9        10            15   0.033185841     3.3185841             414
## 10       11            15   0.033185841     3.3185841             429
## 11        6            14   0.030973451     3.0973451             443
## 12       13             5   0.011061947     1.1061947             448
## 13       12             4   0.008849558     0.8849558             452
##    Frecu.Acum.Porcent
## 1            17.25664
## 2            31.41593
## 3            44.24779
## 4            55.53097
## 5            65.70796
## 6            74.11504
## 7            81.85841
## 8            88.27434
## 9            91.59292
## 10           94.91150
## 11           98.00885
## 12           99.11504
## 13          100.00000

8.Ahora BIOQUIMICA.

BIOQUIMICA = subset(datos.alumnos, Carrera == "BIOQUIMICA")
BIOQUIMICA$Semestre = factor(BIOQUIMICA$Semestre)

TablaFrecBio = data.frame(fdt_cat(BIOQUIMICA$Semestre))
names(TablaFrecBio) = c("Semestre","Frecu.Absolut",
                        "Frecu.Relativ","Frecu.Porcent",
                        "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecBio
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            84   0.190476190    19.0476190              84
## 2         3            65   0.147392290    14.7392290             149
## 3         7            55   0.124716553    12.4716553             204
## 4         5            47   0.106575964    10.6575964             251
## 5         4            40   0.090702948     9.0702948             291
## 6         9            38   0.086167800     8.6167800             329
## 7         6            36   0.081632653     8.1632653             365
## 8         2            34   0.077097506     7.7097506             399
## 9         8            17   0.038548753     3.8548753             416
## 10       11            11   0.024943311     2.4943311             427
## 11       10            10   0.022675737     2.2675737             437
## 12       12             3   0.006802721     0.6802721             440
## 13       13             1   0.002267574     0.2267574             441
##    Frecu.Acum.Porcent
## 1            19.04762
## 2            33.78685
## 3            46.25850
## 4            56.91610
## 5            65.98639
## 6            74.60317
## 7            82.76644
## 8            90.47619
## 9            94.33107
## 10           96.82540
## 11           99.09297
## 12           99.77324
## 13          100.00000

9.Ahora MECATRONICA.

MECATRONICA = subset(datos.alumnos, Carrera == "MECATRONICA")
MECATRONICA$Semestre = factor(MECATRONICA$Semestre)

TablaFrecMecat = data.frame(fdt_cat(MECATRONICA$Semestre))
names(TablaFrecMecat) = c("Semestre","Frecu.Absolut",
                        "Frecu.Relativ","Frecu.Porcent",
                        "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecMecat
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            70   0.162037037    16.2037037              70
## 2         5            64   0.148148148    14.8148148             134
## 3         3            61   0.141203704    14.1203704             195
## 4         7            56   0.129629630    12.9629630             251
## 5         4            45   0.104166667    10.4166667             296
## 6         8            32   0.074074074     7.4074074             328
## 7         9            28   0.064814815     6.4814815             356
## 8         2            26   0.060185185     6.0185185             382
## 9         6            23   0.053240741     5.3240741             405
## 10       10            16   0.037037037     3.7037037             421
## 11       11             8   0.018518519     1.8518519             429
## 12       12             3   0.006944444     0.6944444             432
##    Frecu.Acum.Porcent
## 1            16.20370
## 2            31.01852
## 3            45.13889
## 4            58.10185
## 5            68.51852
## 6            75.92593
## 7            82.40741
## 8            88.42593
## 9            93.75000
## 10           97.45370
## 11           99.30556
## 12          100.00000

10.Ahora MECANICA.

MECANICA = subset(datos.alumnos, Carrera == "MECANICA")
MECANICA$Semestre = factor(MECANICA$Semestre)

TablaFrecMecan = data.frame(fdt_cat(MECANICA$Semestre))
names(TablaFrecMecan) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")

TablaFrecMecan
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            76   0.252491694    25.2491694              76
## 2         3            58   0.192691030    19.2691030             134
## 3         5            43   0.142857143    14.2857143             177
## 4         7            41   0.136212625    13.6212625             218
## 5         6            21   0.069767442     6.9767442             239
## 6         9            18   0.059800664     5.9800664             257
## 7         8            14   0.046511628     4.6511628             271
## 8        11            14   0.046511628     4.6511628             285
## 9        10            11   0.036544850     3.6544850             296
## 10       12             3   0.009966777     0.9966777             299
## 11        4             2   0.006644518     0.6644518             301
##    Frecu.Acum.Porcent
## 1            25.24917
## 2            44.51827
## 3            58.80399
## 4            72.42525
## 5            79.40199
## 6            85.38206
## 7            90.03322
## 8            94.68439
## 9            98.33887
## 10           99.33555
## 11          100.00000

11.Ahora ELECTRICA.

ELECTRICA = subset(datos.alumnos, Carrera == "ELECTRICA")
ELECTRICA$Semestre = factor(ELECTRICA$Semestre)

TablaFrecElectrica = data.frame(fdt_cat(ELECTRICA$Semestre))
names(TablaFrecElectrica) = c("Semestre","Frecu.Absolut",
                          "Frecu.Relativ","Frecu.Porcent",
                          "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecElectrica
##    Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1         1            77   0.275000000    27.5000000              77
## 2         5            54   0.192857143    19.2857143             131
## 3         3            42   0.150000000    15.0000000             173
## 4         7            27   0.096428571     9.6428571             200
## 5         9            21   0.075000000     7.5000000             221
## 6        11            15   0.053571429     5.3571429             236
## 7         6            12   0.042857143     4.2857143             248
## 8        10            12   0.042857143     4.2857143             260
## 9        12             8   0.028571429     2.8571429             268
## 10        8             6   0.021428571     2.1428571             274
## 11       15             3   0.010714286     1.0714286             277
## 12        2             1   0.003571429     0.3571429             278
## 13       13             1   0.003571429     0.3571429             279
## 14       14             1   0.003571429     0.3571429             280
##    Frecu.Acum.Porcent
## 1            27.50000
## 2            46.78571
## 3            61.78571
## 4            71.42857
## 5            78.92857
## 6            84.28571
## 7            88.57143
## 8            92.85714
## 9            95.71429
## 10           97.85714
## 11           98.92857
## 12           99.28571
## 13           99.64286
## 14          100.00000

12.Ahora ELECTRÓNICA.

ELECTRONICA = subset(datos.alumnos, Carrera == "ELECTRONICA")
ELECTRONICA$Semestre = factor(ELECTRONICA$Semestre)

TablaFrecElectronica = data.frame(fdt_cat(ELECTRONICA$Semestre))
names(TablaFrecElectronica) = c("Semestre","Frecu.Absolut",
                              "Frecu.Relativ","Frecu.Porcent",
                              "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecElectronica
##   Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1        1            36    0.22360248     22.360248              36
## 2        3            32    0.19875776     19.875776              68
## 3        5            26    0.16149068     16.149068              94
## 4        9            22    0.13664596     13.664596             116
## 5        7            21    0.13043478     13.043478             137
## 6       11            10    0.06211180      6.211180             147
## 7        6             6    0.03726708      3.726708             153
## 8       10             5    0.03105590      3.105590             158
## 9        8             3    0.01863354      1.863354             161
##   Frecu.Acum.Porcent
## 1           22.36025
## 2           42.23602
## 3           58.38509
## 4           72.04969
## 5           85.09317
## 6           91.30435
## 7           95.03106
## 8           98.13665
## 9          100.00000

13.Ahora INFORMATICA.

INFORMATICA = subset(datos.alumnos, Carrera == "INFORMATICA")
INFORMATICA$Semestre = factor(INFORMATICA$Semestre)

TablaFrecInfor = data.frame(fdt_cat(INFORMATICA$Semestre))
names(TablaFrecInfor) = c("Semestre","Frecu.Absolut",
                                "Frecu.Relativ","Frecu.Porcent",
                                "Frecu.Acumulada","Frecu.Acum.Porcent")

TablaFrecInfor
##   Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1        1            30    0.29702970     29.702970              30
## 2        3            23    0.22772277     22.772277              53
## 3        5            14    0.13861386     13.861386              67
## 4        7            14    0.13861386     13.861386              81
## 5        9            13    0.12871287     12.871287              94
## 6       11             5    0.04950495      4.950495              99
## 7        4             1    0.00990099      0.990099             100
## 8       13             1    0.00990099      0.990099             101
##   Frecu.Acum.Porcent
## 1           29.70297
## 2           52.47525
## 3           66.33663
## 4           80.19802
## 5           93.06931
## 6           98.01980
## 7           99.00990
## 8          100.00000

14.Y para finalizar, TICs.

TIC = subset(datos.alumnos, Carrera == "TIC")
TIC$Semestre = factor(TIC$Semestre)

TablaFrecTics = data.frame(fdt_cat(TIC$Semestre))
names(TablaFrecTics) = c("Semestre","Frecu.Absolut",
                                "Frecu.Relativ","Frecu.Porcent",
                                "Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecTics
##   Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1        3            18    0.22222222     22.222222              18
## 2        1            17    0.20987654     20.987654              35
## 3        5            16    0.19753086     19.753086              51
## 4        7            16    0.19753086     19.753086              67
## 5        9             8    0.09876543      9.876543              75
## 6       11             6    0.07407407      7.407407              81
##   Frecu.Acum.Porcent
## 1           22.22222
## 2           43.20988
## 3           62.96296
## 4           82.71605
## 5           92.59259
## 6          100.00000

PASO 9:

Genera una gráfica de barra de alumnos inscritos por carreras por semestre.

NOTA: Una gráfica por cada carrera.

1. Comenzaremos nuevamente con la carrera de INDUSTRIAL.

barplot(main = "Alumnos de INDUSTRIAL por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecIndus$Frecu.Absolut, 
        names.arg = TablaFrecIndus$Semestre)

2. Seguimos con ARQUITECTURA

barplot(main = "Alumnos de ARQUITECTURA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecArqui$Frecu.Absolut, 
        names.arg = TablaFrecArqui$Semestre)

3.Seguimos con CIVIL

barplot(main = "Alumnos de CIVIL por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecCivil$Frecu.Absolut, 
        names.arg = TablaFrecCivil$Semestre)

4. Ahora con GESTIÓN EMPRESARIAL

barplot(main = "Alumnos de GESTIÓN EMPRESARIAL por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecGes$Frecu.Absolut, 
        names.arg = TablaFrecGes$Semestre)

5. Ahora con QUÍMICA

barplot(main = "Alumnos de QUÍMICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecQuim$Frecu.Absolut, 
        names.arg = TablaFrecQuim$Semestre)

6. Ahora con ADMINISTRACIÓN.

barplot(main = "Alumnos de ADMINISTRACIÓN por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecAdmin$Frecu.Absolut, 
        names.arg = TablaFrecAdmin$Semestre)

7.Seguimos con SISTEMAS.

barplot(main = "Alumnos de SISTEMAS por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecSis$Frecu.Absolut, 
        names.arg = TablaFrecSis$Semestre)

8.Ahora con BIOQUÍMICA.

barplot(main = "Alumnos de BIOQUÍMICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecBio$Frecu.Absolut, 
        names.arg = TablaFrecBio$Semestre)

9.Ahora con MECATRÓNICA.

barplot(main = "Alumnos de MECATRÓNICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecMecat$Frecu.Absolut, 
        names.arg = TablaFrecMecat$Semestre)

10.Ahora con MECÁNICA.

barplot(main = "Alumnos de MECÁNICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecMecan$Frecu.Absolut, 
        names.arg = TablaFrecMecan$Semestre)

11.Ahora con ELÉCTRICA.

barplot(main = "Alumnos de ELÉCTRICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecElectrica$Frecu.Absolut, 
        names.arg = TablaFrecElectrica$Semestre)

12.Ahora con ELECTRÓNICA

barplot(main = "Alumnos de ELECTRÓNICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecElectronica$Frecu.Absolut, 
        names.arg = TablaFrecElectronica$Semestre)

13. Ahora con INFORMÁTICA.

barplot(main = "Alumnos de INFORMÁTICA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecInfor$Frecu.Absolut, 
        names.arg = TablaFrecInfor$Semestre)

14. y para finalizar TICs.

barplot(main = "Alumnos de TICs por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = TablaFrecTics$Frecu.Absolut, 
        names.arg = TablaFrecTics$Semestre)

I N T E R P R E T A C I Ó N

La carrera con más alumnos es Industrial,con 707 alumnos.

La carrera con menos alumnos es TICs, con 81.

Industrial, Arquitectura y Civil representan casi el 35% de toda la población estudiantil.

La tabla de distribución nos sirve para identificar datos de forma rápida.

Gestión, Química, Administración, Sistemas, Bioquímica y Mecatrónica representan casi el 50% de la población estudiantil.

Las gráficas de barras son representaciones visual de los datos.

Las tablas facilitan extraordinariamente la vúsqueda y organización de datos..

La estadística es imprescindible en las ciencias exactas.

Y finalmente, después de 560 líneas, hemos terminado. Gracias <3