Mi nombre es Myriam Velázquez Franco, con número de control c19041180. En la siguiente práctica se pondrá en uso lo aprendido en los últimos día en PyE.
OBJETIVO: Desarrollar tablas de frecuencia gráficas para identificar a los alumnos inscritos.
DESCRIPCIÓN: Cargar datos de los alumnos inscritos en el semestre Septiembre 2020- Enero 2021 y determinar frecuencias: frecuencia absoluta,porcentual, acumulada y generar gráficas.
PASO 1
Lo primero que haremos será cargar las librerías previamente instaladas.
library(readr)
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
PASO 2:
Cargaremos los datos de la dirección URL que proporcionó el profesor NOTA: Le asignamos el nombre de ‘datos.alumnos’ a esta información.
datos.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
así podemos ver el conjunto de datos que acabamos de cargar:
-> datos.alumnos
pero no lo haremos porque la lista es muy larga.
También podemos usar la función View() para poder ver la variable:
-> View(datos.alumnos)
(de igual manera se puede entrar dandole click en nuestro Enviroment) aunque no lo haremos, es importante saberlo.
PASO 3:
Vamos a mostrar los primeros 6 y últimos 6 observaciones del conjunto de datos.
para ver los primeros 6 usaremos la función head()
head(datos.alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 1 20190001 1 11 198 19 80.21 SISTEMAS
## 2 20190002 2 11 235 10 84.33 SISTEMAS
## 3 20190003 3 9 235 10 95.25 SISTEMAS
## 4 20190004 4 9 226 19 95.00 SISTEMAS
## 5 20190005 5 10 231 14 82.32 SISTEMAS
## 6 20190006 6 9 212 23 95.02 SISTEMAS
y para ver los últimos 6 usarelos la función
tail()
tail(datos.alumnos)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 5924 20195924 5924 2 27 28 92.83 ADMINISTRACION
## 5925 20195925 5925 7 94 13 80.95 ADMINISTRACION
## 5926 20195926 5926 5 103 32 92.68 ADMINISTRACION
## 5927 20195927 5927 4 79 34 86.18 ADMINISTRACION
## 5928 20195928 5928 5 108 32 90.48 ADMINISTRACION
## 5929 20195929 5929 7 169 32 92.33 ADMINISTRACION
PASO 4:
Crearemos una tabla de distribución de los alumnos de primer semestre de cada carrera.
Primero filtraremos a los alumnos para quedarnos solo con los de primer semestre. Para eso usaremos subset()
AlumnosPrimer = subset(datos.alumnos, Semestre == 1)
ahora también podemos mostrar los primeros 6 y últimos 6 alumnos pero solamente de primer semestre.
head(AlumnosPrimer)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 75 20190075 75 1 NA 27 0 SISTEMAS
## 76 20190076 76 1 NA 27 0 SISTEMAS
## 77 20190077 77 1 NA 27 0 SISTEMAS
## 83 20190083 83 1 NA 27 0 SISTEMAS
## 85 20190085 85 1 NA 27 0 SISTEMAS
## 86 20190086 86 1 NA 27 0 SISTEMAS
tail(AlumnosPrimer)
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 5885 20195885 5885 1 NA 27 0 ADMINISTRACION
## 5893 20195893 5893 1 NA 27 0 ADMINISTRACION
## 5894 20195894 5894 1 NA 27 0 ADMINISTRACION
## 5895 20195895 5895 1 NA 27 0 ADMINISTRACION
## 5914 20195914 5914 1 NA 27 0 ADMINISTRACION
## 5915 20195915 5915 1 NA 27 0 ADMINISTRACION
Para crear la tabla de distribucion usaremos la función:
fdt_cat()
TablaDistribuPrimero = data.frame(fdt_cat(AlumnosPrimer$Carrera))
para tener un trabajo más organizado, le cambiaremos el nombre a los tílulos de nuestras columnas, para eso usaremos la función: names()
names(TablaDistribuPrimero) = c("Carrera", "Frecu. Absolut","Frecu. Relativa",
"Frecu. Porcent", "Frecu. Acum.",
"Frecu. Acum. Porcent" )
TablaDistribuPrimero
## Carrera Frecu. Absolut Frecu. Relativa Frecu. Porcent
## 1 ARQUITECTURA 128 0.12415131 12.415131
## 2 GESTION EMPRESARIAL 89 0.08632396 8.632396
## 3 QUIMICA 89 0.08632396 8.632396
## 4 INDUSTRIAL 88 0.08535403 8.535403
## 5 CIVIL 86 0.08341416 8.341416
## 6 BIOQUIMICA 84 0.08147430 8.147430
## 7 ADMINISTRACION 83 0.08050436 8.050436
## 8 SISTEMAS 78 0.07565470 7.565470
## 9 ELECTRICA 77 0.07468477 7.468477
## 10 MECANICA 76 0.07371484 7.371484
## 11 MECATRONICA 70 0.06789525 6.789525
## 12 ELECTRONICA 36 0.03491756 3.491756
## 13 INFORMATICA 30 0.02909796 2.909796
## 14 TIC 17 0.01648885 1.648885
## Frecu. Acum. Frecu. Acum. Porcent
## 1 128 12.41513
## 2 217 21.04753
## 3 306 29.67992
## 4 394 38.21532
## 5 480 46.55674
## 6 564 54.70417
## 7 647 62.75461
## 8 725 70.32008
## 9 802 77.78855
## 10 878 85.16004
## 11 948 91.94956
## 12 984 95.44132
## 13 1014 98.35112
## 14 1031 100.00000
PASO 5:
Hacer gráfica de barras de la frecuencia de alumnos de primer semestre por cada carrera.
Para eso necesitaremos la función:
barplot()
barplot(main = "Alumnos Primer Semestre",
xlab = "Carreras", ylab = "Frecuencia Absoluta",
height = TablaDistribuPrimero$`Frecu. Absolut`,
names.arg = substr(TablaDistribuPrimero$Carrera,1,3))
PASO 6: Ahora tenemos que generar la tabla de distribucón de todos los alummos. Seguimos los mismos pasos del comienzo,con la función:
fdt_cat() pero ahora tomando en cuenta a todo el conjunto de datos, y del conjuto, tomamos la carrera.
TablaFrecTodos = data.frame(fdt_cat(datos.alumnos$Carrera))
Nuevamente cambiamos los nombres de las columnas.
names(TablaFrecTodos) = c("Carrera", "Frecu. Absolut","Frecu. Relativa",
"Frecu. Porcent", "Frecu. Acum.",
"Frecu. Acum. Porcent" )
Vamos a ver nuestra tabla de frecuencias
TablaFrecTodos
## Carrera Frecu. Absolut Frecu. Relativa Frecu. Porcent
## 1 INDUSTRIAL 707 0.11924439 11.924439
## 2 ARQUITECTURA 675 0.11384719 11.384719
## 3 CIVIL 648 0.10929330 10.929330
## 4 GESTION EMPRESARIAL 585 0.09866757 9.866757
## 5 QUIMICA 568 0.09580030 9.580030
## 6 ADMINISTRACION 497 0.08382527 8.382527
## 7 SISTEMAS 452 0.07623545 7.623545
## 8 BIOQUIMICA 441 0.07438017 7.438017
## 9 MECATRONICA 432 0.07286220 7.286220
## 10 MECANICA 301 0.05076741 5.076741
## 11 ELECTRICA 280 0.04722550 4.722550
## 12 ELECTRONICA 161 0.02715466 2.715466
## 13 INFORMATICA 101 0.01703491 1.703491
## 14 TIC 81 0.01366166 1.366166
## Frecu. Acum. Frecu. Acum. Porcent
## 1 707 11.92444
## 2 1382 23.30916
## 3 2030 34.23849
## 4 2615 44.10525
## 5 3183 53.68528
## 6 3680 62.06780
## 7 4132 69.69135
## 8 4573 77.12936
## 9 5005 84.41558
## 10 5306 89.49233
## 11 5586 94.21488
## 12 5747 96.93034
## 13 5848 98.63383
## 14 5929 100.00000
PASO 7:
Generar gráficas de barras de la frecuencia de los alumnos de todos los semestres.
Vamos a comenzar a crear la gráfica de barras de la FRECUENCIA ABSOLUTA de todos los semestres.
barplot(main = "Alumnos TODOS los Semestres",
xlab = "Carreras", ylab = "Frecuencia Absoluta",
height = TablaFrecTodos$`Frecu. Absolut`,
names.arg = substr(TablaFrecTodos$Carrera,1,3))
seguimos con la gráfica de la FRECUENCIA RELATIVA
barplot(main = "Alumnos TODOS los Semestres",
xlab = "Carreras", ylab = "Frecuencia Relativa",
height = TablaFrecTodos$`Frecu. Relativa`,
names.arg = substr(TablaFrecTodos$Carrera,1,3))
y terminamos con nuestra FRECUENCIA PORCENTUAL.
barplot(main = "Alumnos TODOS los Semestres",
xlab = "Carreras", ylab = "Frecuencia Absoluta",
height = TablaFrecTodos$`Frecu. Absolut`,
names.arg = substr(TablaFrecTodos$Carrera,1,3))
PASO 8:
Generar tabla de distribución de frecuencias de alumnos inscritos por carreras, por semestre. IMPORTANTE: Una tabla por cada carrera.
1.Empezamos con la carrera de INDUSTRIAL.
INDUSTRIAL = subset(datos.alumnos, Carrera == "INDUSTRIAL")
INDUSTRIAL$Semestre = factor(INDUSTRIAL$Semestre)
TablaFrecIndus = data.frame(fdt_cat(INDUSTRIAL$Semestre))
names(TablaFrecIndus) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecIndus
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 88 0.124469590 12.4469590 88
## 2 3 87 0.123055163 12.3055163 175
## 3 5 82 0.115983027 11.5983027 257
## 4 7 77 0.108910891 10.8910891 334
## 5 6 76 0.107496464 10.7496464 410
## 6 2 75 0.106082037 10.6082037 485
## 7 4 69 0.097595474 9.7595474 554
## 8 8 69 0.097595474 9.7595474 623
## 9 9 38 0.053748232 5.3748232 661
## 10 10 24 0.033946252 3.3946252 685
## 11 11 8 0.011315417 1.1315417 693
## 12 12 6 0.008486563 0.8486563 699
## 13 14 5 0.007072136 0.7072136 704
## 14 13 3 0.004243281 0.4243281 707
## Frecu.Acum.Porcent
## 1 12.44696
## 2 24.75248
## 3 36.35078
## 4 47.24187
## 5 57.99151
## 6 68.59972
## 7 78.35926
## 8 88.11881
## 9 93.49364
## 10 96.88826
## 11 98.01980
## 12 98.86846
## 13 99.57567
## 14 100.00000
2.Seguimos con ARQUITECTURA.
ARQUITECTURA = subset(datos.alumnos, Carrera == "ARQUITECTURA")
ARQUITECTURA$Semestre = factor(ARQUITECTURA$Semestre)
TablaFrecArqui = data.frame(fdt_cat(ARQUITECTURA$Semestre))
names(TablaFrecArqui) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecArqui
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 128 0.18962963 18.962963 128
## 2 2 87 0.12888889 12.888889 215
## 3 3 66 0.09777778 9.777778 281
## 4 6 64 0.09481481 9.481481 345
## 5 4 62 0.09185185 9.185185 407
## 6 8 60 0.08888889 8.888889 467
## 7 5 58 0.08592593 8.592593 525
## 8 7 53 0.07851852 7.851852 578
## 9 9 47 0.06962963 6.962963 625
## 10 10 31 0.04592593 4.592593 656
## 11 12 11 0.01629630 1.629630 667
## 12 11 8 0.01185185 1.185185 675
## Frecu.Acum.Porcent
## 1 18.96296
## 2 31.85185
## 3 41.62963
## 4 51.11111
## 5 60.29630
## 6 69.18519
## 7 77.77778
## 8 85.62963
## 9 92.59259
## 10 97.18519
## 11 98.81481
## 12 100.00000
3.Ahora CIVIL.
CIVIL = subset(datos.alumnos, Carrera == "CIVIL")
CIVIL$Semestre = factor(CIVIL$Semestre)
TablaFrecCivil = data.frame(fdt_cat(CIVIL$Semestre))
names(TablaFrecCivil) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecCivil
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 86 0.13271605 13.271605 86
## 2 2 74 0.11419753 11.419753 160
## 3 6 72 0.11111111 11.111111 232
## 4 5 71 0.10956790 10.956790 303
## 5 3 66 0.10185185 10.185185 369
## 6 4 66 0.10185185 10.185185 435
## 7 7 58 0.08950617 8.950617 493
## 8 8 57 0.08796296 8.796296 550
## 9 9 44 0.06790123 6.790123 594
## 10 10 30 0.04629630 4.629630 624
## 11 12 15 0.02314815 2.314815 639
## 12 11 8 0.01234568 1.234568 647
## 13 15 1 0.00154321 0.154321 648
## Frecu.Acum.Porcent
## 1 13.27160
## 2 24.69136
## 3 35.80247
## 4 46.75926
## 5 56.94444
## 6 67.12963
## 7 76.08025
## 8 84.87654
## 9 91.66667
## 10 96.29630
## 11 98.61111
## 12 99.84568
## 13 100.00000
4.Ahora GESTIÓN EMPRESARIAL.
GESTION= subset(datos.alumnos, Carrera == "GESTION EMPRESARIAL")
GESTION$Semestre = factor(GESTION$Semestre)
TablaFrecGes = data.frame(fdt_cat(GESTION$Semestre))
names(TablaFrecGes) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecGes
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 89 0.152136752 15.2136752 89
## 2 3 73 0.124786325 12.4786325 162
## 3 5 67 0.114529915 11.4529915 229
## 4 8 63 0.107692308 10.7692308 292
## 5 7 58 0.099145299 9.9145299 350
## 6 6 54 0.092307692 9.2307692 404
## 7 9 48 0.082051282 8.2051282 452
## 8 2 41 0.070085470 7.0085470 493
## 9 4 40 0.068376068 6.8376068 533
## 10 10 29 0.049572650 4.9572650 562
## 11 11 16 0.027350427 2.7350427 578
## 12 12 6 0.010256410 1.0256410 584
## 13 13 1 0.001709402 0.1709402 585
## Frecu.Acum.Porcent
## 1 15.21368
## 2 27.69231
## 3 39.14530
## 4 49.91453
## 5 59.82906
## 6 69.05983
## 7 77.26496
## 8 84.27350
## 9 91.11111
## 10 96.06838
## 11 98.80342
## 12 99.82906
## 13 100.00000
5.Ahora QUÍMICA.
QUIMICA = subset(datos.alumnos, Carrera == "QUIMICA")
QUIMICA$Semestre = factor(QUIMICA$Semestre)
TablaFrecQuim = data.frame(fdt_cat(QUIMICA$Semestre))
names(TablaFrecQuim) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecQuim
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 89 0.156690141 15.6690141 89
## 2 3 77 0.135563380 13.5563380 166
## 3 2 65 0.114436620 11.4436620 231
## 4 5 65 0.114436620 11.4436620 296
## 5 7 58 0.102112676 10.2112676 354
## 6 9 57 0.100352113 10.0352113 411
## 7 8 54 0.095070423 9.5070423 465
## 8 4 39 0.068661972 6.8661972 504
## 9 6 32 0.056338028 5.6338028 536
## 10 10 19 0.033450704 3.3450704 555
## 11 11 8 0.014084507 1.4084507 563
## 12 12 4 0.007042254 0.7042254 567
## 13 13 1 0.001760563 0.1760563 568
## Frecu.Acum.Porcent
## 1 15.66901
## 2 29.22535
## 3 40.66901
## 4 52.11268
## 5 62.32394
## 6 72.35915
## 7 81.86620
## 8 88.73239
## 9 94.36620
## 10 97.71127
## 11 99.11972
## 12 99.82394
## 13 100.00000
6.Ahora ADMINISTRCIÓN.
ADMINISTRACION = subset(datos.alumnos, Carrera == "ADMINISTRACION")
ADMINISTRACION$Semestre = factor(ADMINISTRACION$Semestre)
TablaFrecAdmin = data.frame(fdt_cat(ADMINISTRACION$Semestre))
names(TablaFrecAdmin) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecAdmin
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 83 0.16700201 16.700201 83
## 2 5 66 0.13279678 13.279678 149
## 3 7 65 0.13078471 13.078471 214
## 4 3 62 0.12474849 12.474849 276
## 5 8 49 0.09859155 9.859155 325
## 6 9 46 0.09255533 9.255533 371
## 7 2 37 0.07444668 7.444668 408
## 8 6 31 0.06237425 6.237425 439
## 9 4 27 0.05432596 5.432596 466
## 10 10 15 0.03018109 3.018109 481
## 11 11 12 0.02414487 2.414487 493
## 12 12 4 0.00804829 0.804829 497
## Frecu.Acum.Porcent
## 1 16.70020
## 2 29.97988
## 3 43.05835
## 4 55.53320
## 5 65.39235
## 6 74.64789
## 7 82.09256
## 8 88.32998
## 9 93.76258
## 10 96.78068
## 11 99.19517
## 12 100.00000
7.Ahora SISTEMAS.
SISTEMAS = subset(datos.alumnos, Carrera == "SISTEMAS")
SISTEMAS$Semestre = factor(SISTEMAS$Semestre)
TablaFrecSis = data.frame(fdt_cat(SISTEMAS$Semestre))
names(TablaFrecSis) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecSis
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 78 0.172566372 17.2566372 78
## 2 3 64 0.141592920 14.1592920 142
## 3 7 58 0.128318584 12.8318584 200
## 4 5 51 0.112831858 11.2831858 251
## 5 8 46 0.101769912 10.1769912 297
## 6 4 38 0.084070796 8.4070796 335
## 7 9 35 0.077433628 7.7433628 370
## 8 2 29 0.064159292 6.4159292 399
## 9 10 15 0.033185841 3.3185841 414
## 10 11 15 0.033185841 3.3185841 429
## 11 6 14 0.030973451 3.0973451 443
## 12 13 5 0.011061947 1.1061947 448
## 13 12 4 0.008849558 0.8849558 452
## Frecu.Acum.Porcent
## 1 17.25664
## 2 31.41593
## 3 44.24779
## 4 55.53097
## 5 65.70796
## 6 74.11504
## 7 81.85841
## 8 88.27434
## 9 91.59292
## 10 94.91150
## 11 98.00885
## 12 99.11504
## 13 100.00000
8.Ahora BIOQUIMICA.
BIOQUIMICA = subset(datos.alumnos, Carrera == "BIOQUIMICA")
BIOQUIMICA$Semestre = factor(BIOQUIMICA$Semestre)
TablaFrecBio = data.frame(fdt_cat(BIOQUIMICA$Semestre))
names(TablaFrecBio) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecBio
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 84 0.190476190 19.0476190 84
## 2 3 65 0.147392290 14.7392290 149
## 3 7 55 0.124716553 12.4716553 204
## 4 5 47 0.106575964 10.6575964 251
## 5 4 40 0.090702948 9.0702948 291
## 6 9 38 0.086167800 8.6167800 329
## 7 6 36 0.081632653 8.1632653 365
## 8 2 34 0.077097506 7.7097506 399
## 9 8 17 0.038548753 3.8548753 416
## 10 11 11 0.024943311 2.4943311 427
## 11 10 10 0.022675737 2.2675737 437
## 12 12 3 0.006802721 0.6802721 440
## 13 13 1 0.002267574 0.2267574 441
## Frecu.Acum.Porcent
## 1 19.04762
## 2 33.78685
## 3 46.25850
## 4 56.91610
## 5 65.98639
## 6 74.60317
## 7 82.76644
## 8 90.47619
## 9 94.33107
## 10 96.82540
## 11 99.09297
## 12 99.77324
## 13 100.00000
9.Ahora MECATRONICA.
MECATRONICA = subset(datos.alumnos, Carrera == "MECATRONICA")
MECATRONICA$Semestre = factor(MECATRONICA$Semestre)
TablaFrecMecat = data.frame(fdt_cat(MECATRONICA$Semestre))
names(TablaFrecMecat) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecMecat
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 70 0.162037037 16.2037037 70
## 2 5 64 0.148148148 14.8148148 134
## 3 3 61 0.141203704 14.1203704 195
## 4 7 56 0.129629630 12.9629630 251
## 5 4 45 0.104166667 10.4166667 296
## 6 8 32 0.074074074 7.4074074 328
## 7 9 28 0.064814815 6.4814815 356
## 8 2 26 0.060185185 6.0185185 382
## 9 6 23 0.053240741 5.3240741 405
## 10 10 16 0.037037037 3.7037037 421
## 11 11 8 0.018518519 1.8518519 429
## 12 12 3 0.006944444 0.6944444 432
## Frecu.Acum.Porcent
## 1 16.20370
## 2 31.01852
## 3 45.13889
## 4 58.10185
## 5 68.51852
## 6 75.92593
## 7 82.40741
## 8 88.42593
## 9 93.75000
## 10 97.45370
## 11 99.30556
## 12 100.00000
10.Ahora MECANICA.
MECANICA = subset(datos.alumnos, Carrera == "MECANICA")
MECANICA$Semestre = factor(MECANICA$Semestre)
TablaFrecMecan = data.frame(fdt_cat(MECANICA$Semestre))
names(TablaFrecMecan) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecMecan
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 76 0.252491694 25.2491694 76
## 2 3 58 0.192691030 19.2691030 134
## 3 5 43 0.142857143 14.2857143 177
## 4 7 41 0.136212625 13.6212625 218
## 5 6 21 0.069767442 6.9767442 239
## 6 9 18 0.059800664 5.9800664 257
## 7 8 14 0.046511628 4.6511628 271
## 8 11 14 0.046511628 4.6511628 285
## 9 10 11 0.036544850 3.6544850 296
## 10 12 3 0.009966777 0.9966777 299
## 11 4 2 0.006644518 0.6644518 301
## Frecu.Acum.Porcent
## 1 25.24917
## 2 44.51827
## 3 58.80399
## 4 72.42525
## 5 79.40199
## 6 85.38206
## 7 90.03322
## 8 94.68439
## 9 98.33887
## 10 99.33555
## 11 100.00000
11.Ahora ELECTRICA.
ELECTRICA = subset(datos.alumnos, Carrera == "ELECTRICA")
ELECTRICA$Semestre = factor(ELECTRICA$Semestre)
TablaFrecElectrica = data.frame(fdt_cat(ELECTRICA$Semestre))
names(TablaFrecElectrica) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecElectrica
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 77 0.275000000 27.5000000 77
## 2 5 54 0.192857143 19.2857143 131
## 3 3 42 0.150000000 15.0000000 173
## 4 7 27 0.096428571 9.6428571 200
## 5 9 21 0.075000000 7.5000000 221
## 6 11 15 0.053571429 5.3571429 236
## 7 6 12 0.042857143 4.2857143 248
## 8 10 12 0.042857143 4.2857143 260
## 9 12 8 0.028571429 2.8571429 268
## 10 8 6 0.021428571 2.1428571 274
## 11 15 3 0.010714286 1.0714286 277
## 12 2 1 0.003571429 0.3571429 278
## 13 13 1 0.003571429 0.3571429 279
## 14 14 1 0.003571429 0.3571429 280
## Frecu.Acum.Porcent
## 1 27.50000
## 2 46.78571
## 3 61.78571
## 4 71.42857
## 5 78.92857
## 6 84.28571
## 7 88.57143
## 8 92.85714
## 9 95.71429
## 10 97.85714
## 11 98.92857
## 12 99.28571
## 13 99.64286
## 14 100.00000
12.Ahora ELECTRÓNICA.
ELECTRONICA = subset(datos.alumnos, Carrera == "ELECTRONICA")
ELECTRONICA$Semestre = factor(ELECTRONICA$Semestre)
TablaFrecElectronica = data.frame(fdt_cat(ELECTRONICA$Semestre))
names(TablaFrecElectronica) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecElectronica
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 36 0.22360248 22.360248 36
## 2 3 32 0.19875776 19.875776 68
## 3 5 26 0.16149068 16.149068 94
## 4 9 22 0.13664596 13.664596 116
## 5 7 21 0.13043478 13.043478 137
## 6 11 10 0.06211180 6.211180 147
## 7 6 6 0.03726708 3.726708 153
## 8 10 5 0.03105590 3.105590 158
## 9 8 3 0.01863354 1.863354 161
## Frecu.Acum.Porcent
## 1 22.36025
## 2 42.23602
## 3 58.38509
## 4 72.04969
## 5 85.09317
## 6 91.30435
## 7 95.03106
## 8 98.13665
## 9 100.00000
13.Ahora INFORMATICA.
INFORMATICA = subset(datos.alumnos, Carrera == "INFORMATICA")
INFORMATICA$Semestre = factor(INFORMATICA$Semestre)
TablaFrecInfor = data.frame(fdt_cat(INFORMATICA$Semestre))
names(TablaFrecInfor) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecInfor
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 1 30 0.29702970 29.702970 30
## 2 3 23 0.22772277 22.772277 53
## 3 5 14 0.13861386 13.861386 67
## 4 7 14 0.13861386 13.861386 81
## 5 9 13 0.12871287 12.871287 94
## 6 11 5 0.04950495 4.950495 99
## 7 4 1 0.00990099 0.990099 100
## 8 13 1 0.00990099 0.990099 101
## Frecu.Acum.Porcent
## 1 29.70297
## 2 52.47525
## 3 66.33663
## 4 80.19802
## 5 93.06931
## 6 98.01980
## 7 99.00990
## 8 100.00000
14.Y para finalizar, TICs.
TIC = subset(datos.alumnos, Carrera == "TIC")
TIC$Semestre = factor(TIC$Semestre)
TablaFrecTics = data.frame(fdt_cat(TIC$Semestre))
names(TablaFrecTics) = c("Semestre","Frecu.Absolut",
"Frecu.Relativ","Frecu.Porcent",
"Frecu.Acumulada","Frecu.Acum.Porcent")
TablaFrecTics
## Semestre Frecu.Absolut Frecu.Relativ Frecu.Porcent Frecu.Acumulada
## 1 3 18 0.22222222 22.222222 18
## 2 1 17 0.20987654 20.987654 35
## 3 5 16 0.19753086 19.753086 51
## 4 7 16 0.19753086 19.753086 67
## 5 9 8 0.09876543 9.876543 75
## 6 11 6 0.07407407 7.407407 81
## Frecu.Acum.Porcent
## 1 22.22222
## 2 43.20988
## 3 62.96296
## 4 82.71605
## 5 92.59259
## 6 100.00000
PASO 9:
Genera una gráfica de barra de alumnos inscritos por carreras por semestre.
NOTA: Una gráfica por cada carrera.
1. Comenzaremos nuevamente con la carrera de INDUSTRIAL.
barplot(main = "Alumnos de INDUSTRIAL por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecIndus$Frecu.Absolut,
names.arg = TablaFrecIndus$Semestre)
2. Seguimos con ARQUITECTURA
barplot(main = "Alumnos de ARQUITECTURA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecArqui$Frecu.Absolut,
names.arg = TablaFrecArqui$Semestre)
3.Seguimos con CIVIL
barplot(main = "Alumnos de CIVIL por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecCivil$Frecu.Absolut,
names.arg = TablaFrecCivil$Semestre)
4. Ahora con GESTIÓN EMPRESARIAL
barplot(main = "Alumnos de GESTIÓN EMPRESARIAL por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecGes$Frecu.Absolut,
names.arg = TablaFrecGes$Semestre)
5. Ahora con QUÍMICA
barplot(main = "Alumnos de QUÍMICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecQuim$Frecu.Absolut,
names.arg = TablaFrecQuim$Semestre)
6. Ahora con ADMINISTRACIÓN.
barplot(main = "Alumnos de ADMINISTRACIÓN por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecAdmin$Frecu.Absolut,
names.arg = TablaFrecAdmin$Semestre)
7.Seguimos con SISTEMAS.
barplot(main = "Alumnos de SISTEMAS por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecSis$Frecu.Absolut,
names.arg = TablaFrecSis$Semestre)
8.Ahora con BIOQUÍMICA.
barplot(main = "Alumnos de BIOQUÍMICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecBio$Frecu.Absolut,
names.arg = TablaFrecBio$Semestre)
9.Ahora con MECATRÓNICA.
barplot(main = "Alumnos de MECATRÓNICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecMecat$Frecu.Absolut,
names.arg = TablaFrecMecat$Semestre)
10.Ahora con MECÁNICA.
barplot(main = "Alumnos de MECÁNICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecMecan$Frecu.Absolut,
names.arg = TablaFrecMecan$Semestre)
11.Ahora con ELÉCTRICA.
barplot(main = "Alumnos de ELÉCTRICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecElectrica$Frecu.Absolut,
names.arg = TablaFrecElectrica$Semestre)
12.Ahora con ELECTRÓNICA
barplot(main = "Alumnos de ELECTRÓNICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecElectronica$Frecu.Absolut,
names.arg = TablaFrecElectronica$Semestre)
13. Ahora con INFORMÁTICA.
barplot(main = "Alumnos de INFORMÁTICA por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecInfor$Frecu.Absolut,
names.arg = TablaFrecInfor$Semestre)
14. y para finalizar TICs.
barplot(main = "Alumnos de TICs por Semestres",
xlab = "Semestres", ylab = "Frecuencia Absoluta",
height = TablaFrecTics$Frecu.Absolut,
names.arg = TablaFrecTics$Semestre)
I N T E R P R E T A C I Ó N
La carrera con más alumnos es Industrial,con 707 alumnos.
La carrera con menos alumnos es TICs, con 81.
Industrial, Arquitectura y Civil representan casi el 35% de toda la población estudiantil.
La tabla de distribución nos sirve para identificar datos de forma rápida.
Gestión, Química, Administración, Sistemas, Bioquímica y Mecatrónica representan casi el 50% de la población estudiantil.
Las gráficas de barras son representaciones visual de los datos.
Las tablas facilitan extraordinariamente la vúsqueda y organización de datos..
La estadística es imprescindible en las ciencias exactas.
Y finalmente, después de 560 líneas, hemos terminado. Gracias <3