Informe Taller Corto 1

1. Establecer el diretorio de trabajo y un nuevo proyeto

Para comenzar a resolver el taller, debemos crear un nuevo proyecto en el que se asigne un directorio para poder tener los archivos con los que vamos a trabajar, como lo es el archivo salaries.txt.

wd="F:/Electiva R/Data Salaries-20220505/Taller #1"
setwd(wd)

2. Importar librerías

Dado que vamos a trabajar con gráficas, importaremos la librería (paletteer) que nos permita trabajar con varias paletas de colores para potenciar visualmente las figuras.

library(paletteer)

#Paleta de colores de la libreria paletteer
color=paletteer_d("ggsci::default_jama")

3.Lectura de datos

Partiendo del directorio asignado anteriormente, con la función read.table() importamos el archivo salaries.txt y los almacenamos en la variable salaries.

salaries <- read.table("salaries.txt", header=TRUE, dec=".")

4. Visualización general de las variables

Ya en este punto podemos generar los gráficos que nos solicitan.

  • Bloxplot

    Visualizaremos la variable “Salaries” en función de “rank”, para ello usaremos la función boxplot() y en él establecemos algunos parámetros como el título, las etiquetas de los ejes, la orientación de la gráfica, el color y el tamaño de las cajas, el símbolo y el color de los datos outliers.
boxplot(formula=salary~rank, 
        data=salaries, 
        ylab="Tipo de vinculación",
        xlab="Salario", 
        col=color, 
        main="Salarios según la vinculación", 
        horizontal = TRUE, 
        boxwex=0.5,
        outpch = 25,       # Símbolo para los datos outliers
        outbg = "green")   # Color de los datos outliers

Ahora asignamos en la variable tabla la tabla de frecuencias de la variable rank de nuestra base de datos, la cual será útil para hacer otra figura.

tabla <- table(salaries$rank)
print(tabla)
## 
## AssocProf  AsstProf      Prof 
##        64        67       266
  • Barplot

    Para esta gráfica, observaremos la frecuencia de las categorías de la variable rank en una gráfica de barras, por lo que usaremos la función barplot() y vamos a establecer un parámetro adicional, el cual es xlim, ya que es necesario ampliar el intervalo del gráfico para ver las etiquetas numéricas de cada una de las barras sin problemas, este se deja en un intervalo de (0,300).
coor<-barplot(tabla, 
              main="Número de docentes por tipo de vinculación", 
              ylab="Tipo de vinculación",
              xlab="Frecuencia",
              xlim=c(0,300),
              col=color,
              horiz=TRUE)
text(tabla,coor,labels=tabla, pos=4)

Análisis

Por último, al poner de forma paralela los gráficos se pueden realizar ciertos análisis. Se evidencia que la gran mayoría de docentes están vinculados como profesores Prof, y este grupo presenta un amplio intervalo de salarios que devengan dichos docentes, también, en el gráfico se evidencian 3 datos atípicos de profesores con salarios extremadamente altos. Sin embargo, los profesores asistentes AsstProf son los que tienen los salarios más parecidos entre sí, aunque, los profesores asociados AssocProf son el grupo más reducido de estas tres categorías, estos alcanzan a tener mejores salarios que los profesores asistentes.