library(readxl)
Datos_Rotacion <- read_excel("C:/Users/Asus/Desktop/MAESTRIA FINANZAS/analitica financiera/analitica II/Datos_Rotacion.xlsx")
##variables cualitativas
Genero,Cargo,Estado Civil
Se intuye que los cargos de menor rango jerarquico presentan mayor rotación, por las posibilidades de crecimiento que se presentan a los trabajadores el mercado laboral con mejores condiciones.
Estado Civil se trabaja con el supuesto que las personas casadas tienen a buscar una estabilidad laboral.
Genero se pretende conocer la incidencia en la rotación del personal tiene una relación marcada con esta variable.
##Variables Cuantitativas #Distancia, Ingreso_Mensual, Años_Experiencia
La distancia se considera que al ser mayor la distancia de recorrido al trabajo, el personal incurre en mayores gastos de transporte y mayor inversión de tiempo en desplazamientos, lo que puede incidir en la rotación.
Ingreso_Mensual Se intuye que las personas de menos ingresos pueden tener una mayor rotación, dada la busqueda de mejor un mejor salario.
Años_Experiencia Se trabaja bajo el suspuesto que las personas con menor experiencia laboral tienen un indice de rotación mayor por encontrarse en búsqueda de nuevas experiencias y crecimiento.
summary(Datos_Rotacion)
## Rotación Edad Viaje de Negocios Departamento
## Min. :0.0000 Min. :18.00 Length:1470 Length:1470
## 1st Qu.:0.0000 1st Qu.:30.00 Class :character Class :character
## Median :0.0000 Median :36.00 Mode :character Mode :character
## Mean :0.1612 Mean :36.92
## 3rd Qu.:0.0000 3rd Qu.:43.00
## Max. :1.0000 Max. :60.00
## Distancia_Casa Educación Campo_Educación Satisfacción_Ambiental
## Min. : 1.000 Min. :1.000 Length:1470 Min. :1.000
## 1st Qu.: 2.000 1st Qu.:2.000 Class :character 1st Qu.:2.000
## Median : 7.000 Median :3.000 Mode :character Median :3.000
## Mean : 9.193 Mean :2.913 Mean :2.722
## 3rd Qu.:14.000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :29.000 Max. :5.000 Max. :4.000
## Genero Cargo Satisfación_Laboral Estado_Civil
## Length:1470 Length:1470 Min. :1.000 Length:1470
## Class :character Class :character 1st Qu.:2.000 Class :character
## Mode :character Mode :character Median :3.000 Mode :character
## Mean :2.729
## 3rd Qu.:4.000
## Max. :4.000
## Ingreso_Mensual Trabajos_Anteriores Horas_Extra
## Min. : 1009 Min. :0.000 Min. :0.000
## 1st Qu.: 2911 1st Qu.:1.000 1st Qu.:0.000
## Median : 4919 Median :2.000 Median :0.000
## Mean : 6503 Mean :2.693 Mean :0.283
## 3rd Qu.: 8379 3rd Qu.:4.000 3rd Qu.:1.000
## Max. :19999 Max. :9.000 Max. :1.000
## Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
## Min. :11.00 Min. :3.000 Min. : 0.00
## 1st Qu.:12.00 1st Qu.:3.000 1st Qu.: 6.00
## Median :14.00 Median :3.000 Median :10.00
## Mean :15.21 Mean :3.154 Mean :11.28
## 3rd Qu.:18.00 3rd Qu.:3.000 3rd Qu.:15.00
## Max. :25.00 Max. :4.000 Max. :40.00
## Capacitaciones Equilibrio_Trabajo_Vida Antigüedad Antigüedad_Cargo
## Min. :0.000 Min. :1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.:2.000 1st Qu.:2.000 1st Qu.: 3.000 1st Qu.: 2.000
## Median :3.000 Median :3.000 Median : 5.000 Median : 3.000
## Mean :2.799 Mean :2.761 Mean : 7.008 Mean : 4.229
## 3rd Qu.:3.000 3rd Qu.:3.000 3rd Qu.: 9.000 3rd Qu.: 7.000
## Max. :6.000 Max. :4.000 Max. :40.000 Max. :18.000
## Años_ultima_promoción Años_acargo_con_mismo_jefe
## Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.000 1st Qu.: 2.000
## Median : 1.000 Median : 3.000
## Mean : 2.188 Mean : 4.123
## 3rd Qu.: 3.000 3rd Qu.: 7.000
## Max. :15.000 Max. :17.000
##Analisis univariado
promedio=mean(Datos_Rotacion$Ingreso_Mensual)
desviacion=sd(Datos_Rotacion$Ingreso_Mensual)
data.frame(promedio,desviacion)
## promedio desviacion
## 1 6502.931 4707.957
require(ggplot2)
## Loading required package: ggplot2
ggplot(Datos_Rotacion,aes(x=Ingreso_Mensual))+geom_boxplot(fill="blue")+theme_bw()
Al analizar los salarios de la compañia estos presentan un promedio cop$6,5 mm una desviación equivalente a cop\(4,7 millones, lo que significa que los salarios pueden ascender a cop\) 11,2 mm y un minimo de cop$ 1,8 mm, el rango salarial nos indica que es amplio y variado y el maximo valor es el salario integral.
promedio=mean(Datos_Rotacion$Años_Experiencia)
desviacion=sd(Datos_Rotacion$Años_Experiencia)
data.frame(promedio,desviacion)
## promedio desviacion
## 1 11.27959 7.780782
require(ggplot2)
ggplot(Datos_Rotacion,aes(x=Años_Experiencia))+geom_boxplot(fill="green")+theme_bw()
La experiencia de los trabajores oscila entre [0,40]años siendo 11.28 años la media en años, con una desviación estandar de 7.7 años.
promedio=mean(Datos_Rotacion$Distancia_Casa)
desviacion=sd(Datos_Rotacion$Distancia_Casa)
data.frame(promedio,desviacion)
## promedio desviacion
## 1 9.192517 8.106864
hist(Datos_Rotacion$Distancia_Casa)
require(ggplot2)
ggplot(Datos_Rotacion,aes(x=Distancia_Casa))+geom_boxplot(fill="red")+theme_bw()
La distancia nominal de la residencia al lugar de trabajo del personal que labora es de 9.19 con un rango de 1 a 29 Km entre la muestra selecciona y un rango intercuartil de 14.
##Variable Cualitativa
table(Datos_Rotacion$Genero)
##
## F M
## 588 882
barplot(table(Datos_Rotacion$Genero), col=c("lightblue","darkred"),main="Genero",ylab="Count",horiz=T)
De acuerdo con los datos, la mayor representación en la empresa la tienen los hombres con un 60% de participación en la muestra total, contra un 40% de personas que se representan con el género femenino.
table(Datos_Rotacion$Cargo)
##
## Director_Investigación Director_Ma0factura Ejecutivo_Ventas
## 80 145 326
## Gerente Investigador_Cientifico Recursos_Huma0s
## 102 292 52
## Representante_Salud Representante_Ventas Tecnico_Laboratorio
## 131 83 259
Al analizar la estructura de cargos de la compañia se observa que la empresa tiene en mayor proporción colaboradores en el área de ventas de 326 ejecutivos y 83 representantes de ventas. Y en el área tecnica cientifica tiene la mayor proporcion de empleos representando 259 cargos y director de investigación 80.
table(Datos_Rotacion$Estado_Civil)
##
## Casado Divorciado Soltero
## 673 327 470
barplot(table(Datos_Rotacion$Estado_Civil), col=c("dodgerblue2","gray67","darkslategray3"),main="Estado Civil",ylab="Count",horiz = F)
Descripción de la grafica del total de la muestra de colaboradores de 673 corresponden a personal caasado 45,8%, 470 son personas de estado civil solteras 32% y el ultimo grupo en menos perticipacion corresponde a 327 divorsiados 22.2%
attach(Datos_Rotacion)
##Bivariado - Cuali vs Cuali
tabla1=table(Rotación,`Genero`)
tabla1
## Genero
## Rotación F M
## 0 501 732
## 1 87 150
prop.table(tabla1,margin = 2)*100
## Genero
## Rotación F M
## 0 85.20408 82.99320
## 1 14.79592 17.00680
tabla2=table(Rotación,`Cargo`)
tabla2
## Cargo
## Rotación Director_Investigación Director_Ma0factura Ejecutivo_Ventas Gerente
## 0 78 135 269 97
## 1 2 10 57 5
## Cargo
## Rotación Investigador_Cientifico Recursos_Huma0s Representante_Salud
## 0 245 40 122
## 1 47 12 9
## Cargo
## Rotación Representante_Ventas Tecnico_Laboratorio
## 0 50 197
## 1 33 62
prop.table(tabla2,margin = 2)*100
## Cargo
## Rotación Director_Investigación Director_Ma0factura Ejecutivo_Ventas Gerente
## 0 97.500000 93.103448 82.515337 95.098039
## 1 2.500000 6.896552 17.484663 4.901961
## Cargo
## Rotación Investigador_Cientifico Recursos_Huma0s Representante_Salud
## 0 83.904110 76.923077 93.129771
## 1 16.095890 23.076923 6.870229
## Cargo
## Rotación Representante_Ventas Tecnico_Laboratorio
## 0 60.240964 76.061776
## 1 39.759036 23.938224
tabla3=table(Rotación,`Estado_Civil`)
tabla3
## Estado_Civil
## Rotación Casado Divorciado Soltero
## 0 589 294 350
## 1 84 33 120
prop.table(tabla3,margin = 2)*100
## Estado_Civil
## Rotación Casado Divorciado Soltero
## 0 87.51857 89.90826 74.46809
## 1 12.48143 10.09174 25.53191
##Bivariado - Cuali vs Cuanti
tapply(Ingreso_Mensual,Rotación, mean)
## 0 1
## 6832.740 4787.093
tapply(Distancia_Casa,Rotación, mean)
## 0 1
## 8.915653 10.632911
tapply(Años_Experiencia,Rotación, mean)
## 0 1
## 11.862936 8.244726
##Analisis Bivariado Los datos muestran que en cuanto a genero la rotación es mayor en hombres 150 y que en mujeres 87, porcentualmente del total de los hombre vinculados a la compañia el 17% cambia de empleo mientras del total del personal del genero femenino el 14.79% se retira de la compañía.
Para la posición representante de ventas 33 trabajadores se retiraron vs. 50 personas que continuaron en la compañia, la rotacion se da en el 40% del total del cargo.
En los representates de ventas el numero en magnitud del personal que rotó es equivalente a 57 personas vs. 269 que no rotaron, correspondiente a un valor porcentual de 17.5%
Para el caso de los técnicos de laboratorio 62 personas se retiraron de la compañia vs. 197 que no rotaron, valor equivalente a 23% de rotación.
A nivel de Directores y Gerentes la rotación es baja de lo cual se puede inferir que la remuneración percibida por los cargos mas operativos es una de las causas de la alta rotación.
Del total de directores de manufactura 80, 2 se retiraron de la compañia, porcentualmente 2.5% del total de la rotación. Los gerentes 5 rotaron de 97 que no rotaron, corresponde a 4.90%. Los representantes en salud 9 rotaron vs. 122 que no tuvieron movilidad externa. Para este cargo solo el 6% rotó.
De acuerdo con el estado civil de los empleados se evidencia que existe una mayor rotación en personas solteras 25.53% correspondiente a 120 personas de 350 que no rotan, lo cual se puede interpretar como personas jóvenes que buscan mejores oportunidades y crecimiento laboral.
En cuanto a las personas casadas de 673, 84 se movieron a otras compañias representando esto el 10.09% del total de la rotación de esta variable, lo que puede inferirse respecto a este grupo es que busca estabilidad laboral y en los divorciados de un total de 327 33 rotaron,cuyo valor porcentual representa tan solo el 12%.
##4.Estimar un modelo de Regresion logística para la relación entre la rotacion y las variables seleccionadas.
mod=glm(Rotación~Genero+Cargo+Estado_Civil+ Distancia_Casa+Ingreso_Mensual+Años_Experiencia,family = "binomial")
summary(mod)
##
## Call:
## glm(formula = Rotación ~ Genero + Cargo + Estado_Civil + Distancia_Casa +
## Ingreso_Mensual + Años_Experiencia, family = "binomial")
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.4439 -0.6271 -0.4638 -0.2689 2.8299
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.183e+00 9.945e-01 -4.206 2.60e-05 ***
## GeneroM 1.392e-01 1.559e-01 0.893 0.371939
## CargoDirector_Ma0factura 1.084e+00 8.728e-01 1.242 0.214186
## CargoEjecutivo_Ventas 2.055e+00 8.290e-01 2.479 0.013168 *
## CargoGerente 7.882e-01 8.572e-01 0.920 0.357812
## CargoInvestigador_Cientifico 1.979e+00 9.163e-01 2.160 0.030794 *
## CargoRecursos_Huma0s 2.603e+00 9.372e-01 2.778 0.005474 **
## CargoRepresentante_Salud 1.131e+00 8.802e-01 1.285 0.198951
## CargoRepresentante_Ventas 3.112e+00 9.418e-01 3.304 0.000954 ***
## CargoTecnico_Laboratorio 2.505e+00 9.138e-01 2.741 0.006127 **
## Estado_CivilDivorciado -1.924e-01 2.234e-01 -0.861 0.389080
## Estado_CivilSoltero 8.379e-01 1.649e-01 5.080 3.77e-07 ***
## Distancia_Casa 2.956e-02 8.911e-03 3.317 0.000909 ***
## Ingreso_Mensual 5.281e-05 4.961e-05 1.064 0.287113
## Años_Experiencia -4.364e-02 1.736e-02 -2.513 0.011962 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1156.1 on 1455 degrees of freedom
## AIC: 1186.1
##
## Number of Fisher Scoring iterations: 6
Al consolidar las variables de entrada del modelo, cargo, genero y distancia, Ingreso_Mensual, Años_Experiencia, se observa que las de mayor relevancia corresponde a: Distancia_Casa (), Estado_Civil soltero () y el cargo de representante de ventas cuando los Años_Experiencia (*).
De manera deductiva variables como el Ingreso_Mensual que consideramos una variable de extrema importancia
##5. Variables predictorias
predict(mod,list(Genero="M",Cargo="Representante_Ventas", Estado_Civil="Soltero",Distancia_Casa=26,Ingreso_Mensual=5000,Años_Experiencia=2),type = "response")
## 1
## 0.7008779
##Descripción: Se realizo un estudio de una persona con las siguientes caracteristicas: Genero=“M” Cargo=“Representantes de ventas” Estado_civil=“Soltero” Ingreso_Mensual=5000 Años_Experiencia=2
De cuyas variables de entreda se obtiene que la probabilidad de que rote (renuncie a la compañia)es del 70%, es decir, una tendencia moderada a cambiar su trabajo.
y_mod=mod$fitted.values
y=Rotación
##6. veamos varios cortes
cal_metrica=function(corte){
y_mod=as.numeric(y_mod>corte)
mat_confu=table(y_mod,y)
metrica=(mat_confu[1,1]+mat_confu[2,2])/sum(mat_confu)*100
return(metrica)
}
cortes=seq(from= 0.1,to = 0.5, by= 0.02)
probas=sapply(cortes,cal_metrica)
plot(cortes,probas,type="b")
cal_metrica(0.4)
## [1] 83.60544
6.Al analizar el corte del modelo mediantela matriz de confusión se observa que apartir del corte 0.4 el modelo muestra una mejor prediccion, dado que la relación entre los distintos cortes a partir de este valor se estabiliza. A partir de este valor se estima que el poder predictivo del modelo es 83.3%, que corresponde a la relevancia que en la rotacion que tienen factores analizados en el modelo: #Distancia_casa,Ingreso_Mensual, AÑos_Experiencia #Cargo,Estado_Civil, Genero.
El 16%.4% corresponde a otros factores.
Implementar teletrabajo o Alternancia, buscando mejorar la caliad de vida de los trabajadores, al reducir los desplazamientos y los costos asociados.
Facilitar acceso créditos de vehiculo a baja tasas de interés o nula,
para incentivar la permanencia del personal, facilitando a su vez el desplazamiento de la casa al trabajo y el desplazamiento en actividades laborales principalmente en ventas.
Otorgar auxilios de movilidad a los empleados para pago de de combustibles, impuestos y mantenimiento preventivo de los vehículos.
Ofrecer un medio de transporte corporativo que facilite la llegada al trabajo de los empleados.
Implementar horarios flexibles dando a los empleados la posibilidad de manejar horarios de ingreso y salida de acuerdo a su conveniencia y otorgando espacios para atender asuntos personales.
Las estrategias anteriormente descritas se plantean teniendo en cuenta que la variable Distancia_Casa es altamente significativa para el modelo.