Objetivo

  1. Cargar librerías library (readr) y (ftdh). ºreadr Permite cargar un archvo csv. ºfdth Habilita usar funciones como fdt() y fdt_cat() para generar tablas de distribución.
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(readr)

2. Cargar los datos de la dirección citada.

ºread.csv(). ºCargando datos de una dirección URL de internet de github.

datos.alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")

3. Mostrar los primeros seis y últimos seis observaciones del conjunto de datos.

ºMostrar los datos head() y tail().

head(datos.alumnos)
##   No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 1    20190001      1       11      198    19    80.21 SISTEMAS
## 2    20190002      2       11      235    10    84.33 SISTEMAS
## 3    20190003      3        9      235    10    95.25 SISTEMAS
## 4    20190004      4        9      226    19    95.00 SISTEMAS
## 5    20190005      5       10      231    14    82.32 SISTEMAS
## 6    20190006      6        9      212    23    95.02 SISTEMAS
tail(datos.alumnos)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5924    20195924   5924        2       27    28    92.83 ADMINISTRACION
## 5925    20195925   5925        7       94    13    80.95 ADMINISTRACION
## 5926    20195926   5926        5      103    32    92.68 ADMINISTRACION
## 5927    20195927   5927        4       79    34    86.18 ADMINISTRACION
## 5928    20195928   5928        5      108    32    90.48 ADMINISTRACION
## 5929    20195929   5929        7      169    32    92.33 ADMINISTRACION

4. Tabla de distribución de frecuencias de los alumnos inscritos de primer semestre de cada carrera

ºsubset() Filtra solo los alumnos de primer semestre. head() y tail() para mostrar los primeros seis y últimos seis registros de este subconjunto de datos.

alumnosPrimero <- subset(datos.alumnos, Semestre == 1)
head(alumnosPrimero)
##    No..Control Alumno Semestre Cr..Apr. Carga Promedio  Carrera
## 75    20190075     75        1       NA    27        0 SISTEMAS
## 76    20190076     76        1       NA    27        0 SISTEMAS
## 77    20190077     77        1       NA    27        0 SISTEMAS
## 83    20190083     83        1       NA    27        0 SISTEMAS
## 85    20190085     85        1       NA    27        0 SISTEMAS
## 86    20190086     86        1       NA    27        0 SISTEMAS
tail(alumnosPrimero)
##      No..Control Alumno Semestre Cr..Apr. Carga Promedio        Carrera
## 5885    20195885   5885        1       NA    27        0 ADMINISTRACION
## 5893    20195893   5893        1       NA    27        0 ADMINISTRACION
## 5894    20195894   5894        1       NA    27        0 ADMINISTRACION
## 5895    20195895   5895        1       NA    27        0 ADMINISTRACION
## 5914    20195914   5914        1       NA    27        0 ADMINISTRACION
## 5915    20195915   5915        1       NA    27        0 ADMINISTRACION

ºfdt_cat() Genera tabla de distribución. ºdata.frame() Convierte a conjunto de datos data.frame. ºLa función fdt_cat() ordena la tabla de distribucón de mayor a menor lo que repercute en la gráfica de barras de mayor a menor.

tabla.frec.Primero <- data.frame(fdt_cat(alumnosPrimero$Carrera))
tabla.frec.Primero
##               Category   f         rf     rf...   cf     cf...
## 1         ARQUITECTURA 128 0.12415131 12.415131  128  12.41513
## 2  GESTION EMPRESARIAL  89 0.08632396  8.632396  217  21.04753
## 3              QUIMICA  89 0.08632396  8.632396  306  29.67992
## 4           INDUSTRIAL  88 0.08535403  8.535403  394  38.21532
## 5                CIVIL  86 0.08341416  8.341416  480  46.55674
## 6           BIOQUIMICA  84 0.08147430  8.147430  564  54.70417
## 7       ADMINISTRACION  83 0.08050436  8.050436  647  62.75461
## 8             SISTEMAS  78 0.07565470  7.565470  725  70.32008
## 9            ELECTRICA  77 0.07468477  7.468477  802  77.78855
## 10            MECANICA  76 0.07371484  7.371484  878  85.16004
## 11         MECATRONICA  70 0.06789525  6.789525  948  91.94956
## 12         ELECTRONICA  36 0.03491756  3.491756  984  95.44132
## 13         INFORMATICA  30 0.02909796  2.909796 1014  98.35112
## 14                 TIC  17 0.01648885  1.648885 1031 100.00000

ºCambiar nombres a las columnas del conjunto de datos tabla.frec.Primero ºse usa la función names().

names(tabla.frec.Primero) <- c("Carrera","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc") # Cambiar nombre a tabla.frec.Primero

tabla.frec.Primero
##                Carrera Frec.Absoluta Frec.Relativa Frec.Porc Frec.Acum
## 1         ARQUITECTURA           128    0.12415131 12.415131       128
## 2  GESTION EMPRESARIAL            89    0.08632396  8.632396       217
## 3              QUIMICA            89    0.08632396  8.632396       306
## 4           INDUSTRIAL            88    0.08535403  8.535403       394
## 5                CIVIL            86    0.08341416  8.341416       480
## 6           BIOQUIMICA            84    0.08147430  8.147430       564
## 7       ADMINISTRACION            83    0.08050436  8.050436       647
## 8             SISTEMAS            78    0.07565470  7.565470       725
## 9            ELECTRICA            77    0.07468477  7.468477       802
## 10            MECANICA            76    0.07371484  7.371484       878
## 11         MECATRONICA            70    0.06789525  6.789525       948
## 12         ELECTRONICA            36    0.03491756  3.491756       984
## 13         INFORMATICA            30    0.02909796  2.909796      1014
## 14                 TIC            17    0.01648885  1.648885      1031
##    Frec.Acum.Porc
## 1        12.41513
## 2        21.04753
## 3        29.67992
## 4        38.21532
## 5        46.55674
## 6        54.70417
## 7        62.75461
## 8        70.32008
## 9        77.78855
## 10       85.16004
## 11       91.94956
## 12       95.44132
## 13       98.35112
## 14      100.00000

5. Genera gráfica de barra de la frecuencia de alumnos de primer semestre por cada carrera.

ºbarplot(tabla.frecuencias.Primero). ºBarra de Frecuencias Absolutas.

barplot(main = "Alumnos de Primer Semestre",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = tabla.frec.Primero$Frec.Absoluta, 
        names.arg = substr(tabla.frec.Primero$Carrera,1,3))

6. Generar tabla de distribución de frecuencias de todos los alumnos inscritos

ºGenerar tabla. ºCambiar nombres a columnas. ºPresentar tabla de frecuecias. ºAutomáticamente se ordena de mayor a menor ….

tabla.frec <- data.frame(fdt_cat(datos.alumnos$Carrera))
names(tabla.frec) <- c("Carrera","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc") # Cambiar nombre a tabla.frec

tabla.frec
##                Carrera Frec.Absoluta Frec.Relativa Frec.Porc Frec.Acum
## 1           INDUSTRIAL           707    0.11924439 11.924439       707
## 2         ARQUITECTURA           675    0.11384719 11.384719      1382
## 3                CIVIL           648    0.10929330 10.929330      2030
## 4  GESTION EMPRESARIAL           585    0.09866757  9.866757      2615
## 5              QUIMICA           568    0.09580030  9.580030      3183
## 6       ADMINISTRACION           497    0.08382527  8.382527      3680
## 7             SISTEMAS           452    0.07623545  7.623545      4132
## 8           BIOQUIMICA           441    0.07438017  7.438017      4573
## 9          MECATRONICA           432    0.07286220  7.286220      5005
## 10            MECANICA           301    0.05076741  5.076741      5306
## 11           ELECTRICA           280    0.04722550  4.722550      5586
## 12         ELECTRONICA           161    0.02715466  2.715466      5747
## 13         INFORMATICA           101    0.01703491  1.703491      5848
## 14                 TIC            81    0.01366166  1.366166      5929
##    Frec.Acum.Porc
## 1        11.92444
## 2        23.30916
## 3        34.23849
## 4        44.10525
## 5        53.68528
## 6        62.06780
## 7        69.69135
## 8        77.12936
## 9        84.41558
## 10       89.49233
## 11       94.21488
## 12       96.93034
## 13       98.63383
## 14      100.00000

7. Genera gráfica de barra de la frecuencia de alumnos de todos los semestres por carrera

ºFrecuenci Absoluta

barplot(main = "Alumnos de Todos los Semestre",
        xlab = "Carreras", ylab = "Frecuencia Absoluta",
        height = tabla.frec$Frec.Absoluta, 
        names.arg = substr(tabla.frec$Carrera,1,3))

ºFrecuencia Relativa

barplot(main = "Alumnos de Todos los Semestre",
        xlab = "Carreras", ylab = "Frecuencia Relativa",
        height = tabla.frec$Frec.Relativa, 
        names.arg = substr(tabla.frec$Carrera,1,3))

ºFrecuencia Porcentual

barplot(main = "Alumnos de Todos los Semestre",
        xlab = "Carreras", ylab = "Frecuencia Porcentual %",
        height = tabla.frec$Frec.Porc, 
        names.arg = substr(tabla.frec$Carrera,1,3))

8. Generar tabla de distribución de frecuencias de alumnos inscritos por carreras por semestre (Una por cada carrera)

ºCarrera de ARQUITECTURA. ºConvertir a factor (variable categórica ) el Semestre. ºsubset() para filtrar datos.

ARQUITECTURA <- subset(datos.alumnos, Carrera == "ARQUITECTURA")
ARQUITECTURA$Semestre <- factor(ARQUITECTURA$Semestre)

tabla.frec <- data.frame(fdt_cat(ARQUITECTURA$Semestre))
names(tabla.frec) <- c("Semestre","Frec.Absoluta","Frec.Relativa","Frec.Porc","Frec.Acum","Frec.Acum.Porc") # Cambiar nombre a tabla.frec

tabla.frec
##    Semestre Frec.Absoluta Frec.Relativa Frec.Porc Frec.Acum Frec.Acum.Porc
## 1         1           128    0.18962963 18.962963       128       18.96296
## 2         2            87    0.12888889 12.888889       215       31.85185
## 3         3            66    0.09777778  9.777778       281       41.62963
## 4         6            64    0.09481481  9.481481       345       51.11111
## 5         4            62    0.09185185  9.185185       407       60.29630
## 6         8            60    0.08888889  8.888889       467       69.18519
## 7         5            58    0.08592593  8.592593       525       77.77778
## 8         7            53    0.07851852  7.851852       578       85.62963
## 9         9            47    0.06962963  6.962963       625       92.59259
## 10       10            31    0.04592593  4.592593       656       97.18519
## 11       12            11    0.01629630  1.629630       667       98.81481
## 12       11             8    0.01185185  1.185185       675      100.00000

9. Genera una gráfica de barra de alumnos inscritos por carreras por semestre (Una por cada carrera)

ºARQUITECTURA ºFrecuenci Absoluta

barplot(main = "Alumnos de ARQUITECTURA por Semestres",
        xlab = "Semestres", ylab = "Frecuencia Absoluta",
        height = tabla.frec$Frec.Absoluta, 
        names.arg = tabla.frec$Semestre)

PENDIENTES LAS SIGUIENTES CARRERAS

Interpretación(Mi descripcion)

Es el inicio de clase de probabilidad y estadistica y consigo la primera unidad y nuevos temas, el fin de los primeros trabajos es que el estudiante se familiarize con el programa rstudio ya que sera la herramienta principal que se vera durante todo el semestre, veremos como cargar libretas, conjunto de datos, tablas y demas en este y proximos casos de esta primera unidad.