Taller corto N°1

En el siguiente trabajo se analizarán los datos “salarios”a traves de graficos simples, como el diagrama de cajas y de frecuencia.

##Para esto primeramente creamos nuestro directorio de trabajo.

wd="C:/Users/usuario/Desktop/RSTUDIO"

##Despues de esto subimos la base de datos y seleccionamos las variables a trabajar.

BD <- read.table("C:/Users/usuario/Desktop/R STUDIO/Salaries.txt", header=TRUE, dec=".")
newdata <- dplyr::select(BD, salary, rank)
names(newdata)
## [1] "salary" "rank"

Diagrama de caja para el salario en función del rango

Boxplot

boxplot(newdata$salary ~ newdata$rank, data = newdata, ylab = "Rango", xlab="Salario", main="Diagrama de caja para cada nivel de Salario", horizontal = TRUE, col= c ("#5F9EA0", "#C1CDCD", "#8EE5EE"))

Este diagrama de cajas nos permite analizar de una manera visual la manera en que se encuentran distribuidos los datos, la mediana y los distintos cuartiles, además de identificar valores atípicos.

Analizando los niveles mínimos de cada boxplot para cada nivel de rango, se puede decir que los valores mínimos para profesionales asociados y asistentes es el mismo, aproximadamente 60.000 mientras que para el rango profesional el valor mínimo es menor que los otros dos rangos asociados. Lo que quiere decir que el salario inicial de los profesionales es menor que para los otros rangos.

En cuanto a la simetría de las cajas podemos ver que para el rango de los profesionales asociados esta presenta asimetría negativa, para el rango de profesionales asistentes presenta asimetría positiva y el rango de profesionales es el que presenta una distribución más normal aunque igual sigue presentando asimetría positiva. En este sentido se tiene que 50% de los profesionales tienen un salario de aldedor de 125.000,el 50% de los asitentes profesionales tienen un salario de alrededor de 75.000 y los profesionales asociados un salario cercanos a los 90.00

Para el rango de profesionales asociados y asistentes no se presentan valores atípicos, mientras que para el rango de profesionales hay valores que se encuentran por encima del límite superior.

Se puede concluir entonces que los profesionales son el rango con un salario más alto, seguido de los profesionales asociados y por ultimo los profesionales asitentes.

Grafica de barras para el salario.

Barplot

En esta tabla podemos ver la frecuencia de cada nivel de salario, que se interpreta en este caso multiplicandola por 100 y leyendola en porcentajes, por ejemplo: El rango de profesionales es del 67%.

tabla=table(newdata$rank)
prop.table(tabla)
## 
## AssocProf  AsstProf      Prof 
## 0.1612091 0.1687657 0.6700252

Seguidamente realizamos el gráfico

barplot(tabla, xlab="Frecuencia",ylab = "Rango" ,main="Frecuencias Salario",horiz= TRUE , col= c ("#5F9EA0", "#C1CDCD", "#8EE5EE"))
text(x=tabla/1.8, y=c(0.4, 1.6, 2.8), label = (tabla)) 

El diagrama de barras nos permite ver la frecuencia con la que sucede un suceso. Para este caso tenemos que del total de datos o de la muestra 266 datos pertencen al rango profesional, o sea, un 67%, 67 datos pertenecen al rango de profesional asitente y 64 datos pertenecen a profesional asociado, lo que corresponde al 16.8% y 16.15 respectivamente.

En otras plabras, del total de personas, 266 son profesionales, 67 son profesionales asitentes y 64 son profesionales asociados.

Lo anterior permite concluir que el rango de “profesional” es el más grande y que la diferencia que existe entre la cantidad de “profesional asociado” y “profesional asistente” es mínima.

Diagramas en una sola ventana

Por ultimo colocamos ambos gráficos en una sola ventana.

par(mfrow=c(1,2))
boxplot(newdata$salary ~ newdata$rank, data = newdata, ylab = "Rango", xlab="Salario", main="Diagrama de caja Salarios", horizontal = TRUE, col= c ("#5F9EA0", "#C1CDCD", "#8EE5EE"))
barplot(tabla, xlab="Frecuencia",ylab ="Rango",main="Frecuencias Salario",horiz= TRUE , col= c ("#5F9EA0", "#C1CDCD", "#8EE5EE"))
text(x=tabla/1.8, y=c(0.4, 1.6, 2.8), label = (tabla))