A partir de la base de datos de “salaries”, la cual incorpora variables relacionados con temas de rangos y funciones de las vinculaciones profesionales de los docentes, considerando el ingreso y desagrando el sexo de los individuos de la muestra, se pretende realizar una construcción gráfica a través del Software RStudio, para posteriormente realizar una descripción gráfica del comportamiento de las variables según el tipo de gráfico a utilizar, los cuales son:
Diagrama de caja para el salario en función al rango de vinculación de los docentes.
Diagrama de barras para el rango de vinculación.
A partir de una serie de comandos que permiten modificar elementos del gráfico como títulos de los ejes, título del gráfico, colores, entre otras, se realiza el gráfico Boxplot para los datos de Salarios en función de los rangos de vinculación para los docentes de la muestra.
boxplot(BD$salary~BD$rank,
xlab="Salario",
ylab = "Rango",
col=color,
main="BOXPLOT SALARIOS EN FUNCIÓN DEL RANGO",
boxwex = 0.7,
border="BLACK",
outpch=1,
outtbg="BLUE",
horizontal = TRUE)
Esta gráfica resulta a partir de la construcción del comando en RStudio, más adelante se realizará una descripción de los principales hallazgos que se pueden describir.
A partir de la construcción de una tabla, en la cual se considera únicamente la variable “Rank”, extraída de la base de datos inicial, se obtenen los valores de la frecuencia absoluta para esta variable, con lo cual se puede construir un barplot para los rangos de la muestra.
tabla <- table(BD$rank)
print(tabla)
##
## AssocProf AsstProf Prof
## 64 67 266
coor <- barplot(tabla,
main="DIAGRAMA DE BARRAS - RANGO",
ylab="Rango", boxwex = 0.5 ,
xlab="FRECUENCIA ABSOLUTA",
xlim=c(0,300),
col=color,
horiz=TRUE)
text(tabla,coor,labels=tabla,pos=4)
windows(height=10,width=20)
par(mfrow=c(1,2))
boxplot(BD$salary~BD$rank,
xlab="Salario",
ylab = "Tipo de vinculacion",
col=color,
main="Salarios vinculacion",
boxwex = 0.5,
border="black",
outpch=25,
outtbg="blue",
horizontal = TRUE)
tabla <- table(BD$rank)
coor <- barplot(tabla,
main="numero de docentes por tipo de vinculacion",
ylab="tipo de vinculacion",
xlab="frecuencia",
xlim=c(0,300),
col=color,
horiz=TRUE)
text(tabla,coor,labels=tabla,pos=4)
En el gráfico de la derecha, correpondiente al Diagrama de caja de los salarios en función al rango de vinculación profesional o laboral, si consideramos que el rango que se encuentra relativamente en una mejor posición es el Prof, seguido de AssocProf y AsstProf, podemos identicar que asimismo se ven reflejados sus salarios. Para el caso de los Prof, podemos ver que la mediana se encuentra aproximadamente en 120.000 unidades monetarias, mientras que para AssocProf y AsstProf la mediana se encuentra aproximadamente entre 90.000 y 60.000 respectivamente. Los datos del salario para AsstProf son relativamente más homogéneos en la muestra, mientras que si lo contrastamos con los datos de los Prof, estos presentan una mayor dispersión, lo cual se puede también reflejar en el comportamiento de los cuartiles, además, resulta interesante que para el caso de los Prof, podemos observar 3 outliers, donde se presentan unos ingresos superiores a los 200.000 unidades monetarias.Resultaría intesante en trabajos posteriores, realizar el análisis de estos salarios en función de los ingresos desagregando el sexo, para identificar si dentro de esta muestra de mercado laboral existen algún tipo de sezgos salariales respecto al género de los individuos
Para este análisis descriptivo también resulta interesante observar la frecuencia absoluta del rango los individios de la muestra, lo cual se puede evidenciar en el gráfico de la izquierda, en donde AssocProf y AsstProf tiene una cantidad de observaciones bastante similar, mostrando 64 y 67 observaciones dentro de la muestra respectivamente. Pero nuevamente es necesario resaltar el comportamiento del rango Prof, en el cual se presentan 266 observaciones, y que a su vez, son la categoria que contempla los ingresos más altos de la muestra. En términos de frecuencias relativas, observamos que para los AssocProf, representan el 16,12% aproximandamente, el rango AsstProf el 16,88% y el rango Prof representa el 67% de la muestra.
De la realización de este taller corto, podemos reconocer ciertas funciones del software RStudio, que resultan bastante interesantes a la hora realizar análisis y trabajos de estadística descriptiva, para además acompañarlos de elementos matemáticos y de teoría economómica a la hora realizar modelaciones Econométricas. Resaltar además las múltiples funciones gráficas que tienen las librerías como Ggplot y Ggplot2, con las cuales se pueden realizar distintas modificaciones en su interfaz para tener una gráficas más precisas dentro de la investigación.