PONTIFICIA UNIVERSIDAD JAVERIANA

MAESTRÍA EN CIENCIA DE DATOS

ESTUDIANTE: ZULY ALFONSO M

Modelos Estadísticos para la toma de decisiones

Actividad 3

Problema: Rotación de cargo

En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuáles factores indicen en mayor proporción a estos cambios.

Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.

A continuación, se describen los pasos que la gerencia ha propuesto para el análisis:

1. PUNTO. Selección de variables

Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.

PUNTO 1. Variables escogidas:

CATEGORICAS

1. Estado_Civil

Se espera que exista una relación positiva con la variable “ROTACIÓN” dado que se presume que el estado civil soltero puede considerar con mayor riesgo o probabilidad de rotar de empleo o trabajo al no tener cónyuge o familia se presumen menos responsabilidades financieras de inmediatez o corto plazo.

Hipótesis: Se espera que los empleados solteros o divorciados tengan un mayor riesgo o probabilidad de rotación que los demás empleados con estado civil casados debido a la necesidad de estabilidad económica.

2. Horas_Extra

Se espera que exista una relación positiva con la variable “ROTACIÓN” dado que se presume que el trabajar horas adicionales para algunos empleados puede considerarse un deterioro de las actividades no laborales, como las personales, familiares, etc. por lo tanto mayor riesgo o probabilidad de rotar de empleo o trabajo al tener que sacrificar el tiempo para estas actividades en el corto plazo.

Hipótesis: Se espera que los empleados que trabajan horas extras tengan un mayor riesgo o probabilidad de rotación que las que no lo hacen debido a la necesidad de tener más tiempo para actividades extra-laborales.

3. Viaje de Negocios

Se espera que exista una relación positiva con la variable “ROTACIÓN” dado que se presume que el desplazarse o ausentarse de la ciudad natal para algunos empleados puede considerarse un deterioro de las actividades no laborales, como las personales, familiares, etc. por lo tanto mayor riesgo o probabilidad de rotar de empleo o trabajo al tener que sacrificar el tiempo para estas actividades en el corto plazo.

Hipótesis: Se espera que los empleados que tienen viajes de negocios tengan un mayor riesgo o probabilidad de rotación que las que no lo hacen, debido a la necesidad de tener más tiempo para actividades extra-laborales.

CUANTITATIVAS

1. Educación

Se espera que exista una relación positiva con la variable “ROTACIÓN dado que se espera que los empleados que se sienten más preparados profesionalmente roten en mayor medida de puesto como de trabajo, dado que buscaran compensar tanto el tiempo como el dinero invertido en la educación con cargos que les represente un aumento salarial.

Hipótesis: Se espera que los empleados que cuentan con más años de educación, mayor rotación de puesto de trabajo como de trabajo que los que menos tiempo tienen en educación, esperando siempre una mejora salarial.

2. Edad

Se espera que exista una relación positiva con la variable “ROTACIÓN dado que se espera que los empleados más jóvenes tiendan a rotar más de puesto como de trabajo dado que no planean una estabilidad laboral en el corto plazo, a diferencia de los empleados que con la edad van adquiriendo otro tipo de expectativas laborales más estables, esto generalizando.

Hipótesis: Se espera que a menor edad exista mayor rotación y a más edad y menos rotación.

3. Antigüedad_Cargo

Se espera que exista una relación positiva con la variable “ROTACIÓN dado que se espera que los empleados que llevan más tiempo en un cargo deseen un cambio en el largo plazo, a diferencia de una persona nueva en un cargo.

Hipótesis: Se espera que en los empleados con mayor antigüedad exista mayor rotación a diferencia de los empleados con menor antigüedad exista menos rotación.

EXPLORACION DATA

library(paqueteMODELOS)
## Loading required package: boot
## Loading required package: broom
## Loading required package: GGally
## Warning: package 'GGally' was built under R version 4.2.3
## Loading required package: ggplot2
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
## Loading required package: gridExtra
## Warning: package 'gridExtra' was built under R version 4.2.3
## Loading required package: knitr
## Loading required package: summarytools
data("rotacion")
rotacion
## # A tibble: 1,470 × 24
##    Rotación  Edad Viaje d…¹ Depar…² Dista…³ Educa…⁴ Campo…⁵ Satis…⁶ Genero Cargo
##    <chr>    <dbl> <chr>     <chr>     <dbl>   <dbl> <chr>     <dbl> <chr>  <chr>
##  1 Si          41 Raramente Ventas        1       2 Cienci…       2 F      Ejec…
##  2 No          49 Frecuent… IyD           8       1 Cienci…       3 M      Inve…
##  3 Si          37 Raramente IyD           2       2 Otra          4 M      Tecn…
##  4 No          33 Frecuent… IyD           3       4 Cienci…       4 F      Inve…
##  5 No          27 Raramente IyD           2       1 Salud         1 M      Tecn…
##  6 No          32 Frecuent… IyD           2       2 Cienci…       4 M      Tecn…
##  7 No          59 Raramente IyD           3       3 Salud         3 F      Tecn…
##  8 No          30 Raramente IyD          24       1 Cienci…       4 M      Tecn…
##  9 No          38 Frecuent… IyD          23       3 Cienci…       4 M      Dire…
## 10 No          36 Raramente IyD          27       3 Salud         3 M      Repr…
## # … with 1,460 more rows, 14 more variables: Satisfación_Laboral <dbl>,
## #   Estado_Civil <chr>, Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>,
## #   Horas_Extra <chr>, Porcentaje_aumento_salarial <dbl>,
## #   Rendimiento_Laboral <dbl>, Años_Experiencia <dbl>, Capacitaciones <dbl>,
## #   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## #   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>, and
## #   abbreviated variable names ¹​`Viaje de Negocios`, ²​Departamento, …
summary(rotacion)
##    Rotación              Edad       Viaje de Negocios  Departamento      
##  Length:1470        Min.   :18.00   Length:1470        Length:1470       
##  Class :character   1st Qu.:30.00   Class :character   Class :character  
##  Mode  :character   Median :36.00   Mode  :character   Mode  :character  
##                     Mean   :36.92                                        
##                     3rd Qu.:43.00                                        
##                     Max.   :60.00                                        
##  Distancia_Casa     Educación     Campo_Educación    Satisfacción_Ambiental
##  Min.   : 1.000   Min.   :1.000   Length:1470        Min.   :1.000         
##  1st Qu.: 2.000   1st Qu.:2.000   Class :character   1st Qu.:2.000         
##  Median : 7.000   Median :3.000   Mode  :character   Median :3.000         
##  Mean   : 9.193   Mean   :2.913                      Mean   :2.722         
##  3rd Qu.:14.000   3rd Qu.:4.000                      3rd Qu.:4.000         
##  Max.   :29.000   Max.   :5.000                      Max.   :4.000         
##     Genero             Cargo           Satisfación_Laboral Estado_Civil      
##  Length:1470        Length:1470        Min.   :1.000       Length:1470       
##  Class :character   Class :character   1st Qu.:2.000       Class :character  
##  Mode  :character   Mode  :character   Median :3.000       Mode  :character  
##                                        Mean   :2.729                         
##                                        3rd Qu.:4.000                         
##                                        Max.   :4.000                         
##  Ingreso_Mensual Trabajos_Anteriores Horas_Extra       
##  Min.   : 1009   Min.   :0.000       Length:1470       
##  1st Qu.: 2911   1st Qu.:1.000       Class :character  
##  Median : 4919   Median :2.000       Mode  :character  
##  Mean   : 6503   Mean   :2.693                         
##  3rd Qu.: 8379   3rd Qu.:4.000                         
##  Max.   :19999   Max.   :9.000                         
##  Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
##  Min.   :11.00               Min.   :3.000       Min.   : 0.00   
##  1st Qu.:12.00               1st Qu.:3.000       1st Qu.: 6.00   
##  Median :14.00               Median :3.000       Median :10.00   
##  Mean   :15.21               Mean   :3.154       Mean   :11.28   
##  3rd Qu.:18.00               3rd Qu.:3.000       3rd Qu.:15.00   
##  Max.   :25.00               Max.   :4.000       Max.   :40.00   
##  Capacitaciones  Equilibrio_Trabajo_Vida   Antigüedad     Antigüedad_Cargo
##  Min.   :0.000   Min.   :1.000           Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:2.000   1st Qu.:2.000           1st Qu.: 3.000   1st Qu.: 2.000  
##  Median :3.000   Median :3.000           Median : 5.000   Median : 3.000  
##  Mean   :2.799   Mean   :2.761           Mean   : 7.008   Mean   : 4.229  
##  3rd Qu.:3.000   3rd Qu.:3.000           3rd Qu.: 9.000   3rd Qu.: 7.000  
##  Max.   :6.000   Max.   :4.000           Max.   :40.000   Max.   :18.000  
##  Años_ultima_promoción Años_acargo_con_mismo_jefe
##  Min.   : 0.000        Min.   : 0.000            
##  1st Qu.: 0.000        1st Qu.: 2.000            
##  Median : 1.000        Median : 3.000            
##  Mean   : 2.188        Mean   : 4.123            
##  3rd Qu.: 3.000        3rd Qu.: 7.000            
##  Max.   :15.000        Max.   :17.000
str(rotacion)
## tibble [1,470 × 24] (S3: tbl_df/tbl/data.frame)
##  $ Rotación                   : chr [1:1470] "Si" "No" "Si" "No" ...
##  $ Edad                       : num [1:1470] 41 49 37 33 27 32 59 30 38 36 ...
##  $ Viaje de Negocios          : chr [1:1470] "Raramente" "Frecuentemente" "Raramente" "Frecuentemente" ...
##  $ Departamento               : chr [1:1470] "Ventas" "IyD" "IyD" "IyD" ...
##  $ Distancia_Casa             : num [1:1470] 1 8 2 3 2 2 3 24 23 27 ...
##  $ Educación                  : num [1:1470] 2 1 2 4 1 2 3 1 3 3 ...
##  $ Campo_Educación            : chr [1:1470] "Ciencias" "Ciencias" "Otra" "Ciencias" ...
##  $ Satisfacción_Ambiental     : num [1:1470] 2 3 4 4 1 4 3 4 4 3 ...
##  $ Genero                     : chr [1:1470] "F" "M" "M" "F" ...
##  $ Cargo                      : chr [1:1470] "Ejecutivo_Ventas" "Investigador_Cientifico" "Tecnico_Laboratorio" "Investigador_Cientifico" ...
##  $ Satisfación_Laboral        : num [1:1470] 4 2 3 3 2 4 1 3 3 3 ...
##  $ Estado_Civil               : chr [1:1470] "Soltero" "Casado" "Soltero" "Casado" ...
##  $ Ingreso_Mensual            : num [1:1470] 5993 5130 2090 2909 3468 ...
##  $ Trabajos_Anteriores        : num [1:1470] 8 1 6 1 9 0 4 1 0 6 ...
##  $ Horas_Extra                : chr [1:1470] "Si" "No" "Si" "Si" ...
##  $ Porcentaje_aumento_salarial: num [1:1470] 11 23 15 11 12 13 20 22 21 13 ...
##  $ Rendimiento_Laboral        : num [1:1470] 3 4 3 3 3 3 4 4 4 3 ...
##  $ Años_Experiencia           : num [1:1470] 8 10 7 8 6 8 12 1 10 17 ...
##  $ Capacitaciones             : num [1:1470] 0 3 3 3 3 2 3 2 2 3 ...
##  $ Equilibrio_Trabajo_Vida    : num [1:1470] 1 3 3 3 3 2 2 3 3 2 ...
##  $ Antigüedad                 : num [1:1470] 6 10 0 8 2 7 1 1 9 7 ...
##  $ Antigüedad_Cargo           : num [1:1470] 4 7 0 7 2 7 0 0 7 7 ...
##  $ Años_ultima_promoción      : num [1:1470] 0 1 0 3 2 3 0 0 1 7 ...
##  $ Años_acargo_con_mismo_jefe : num [1:1470] 5 7 0 0 2 6 0 0 8 7 ...
names(rotacion)
##  [1] "Rotación"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educación"                  
##  [7] "Campo_Educación"             "Satisfacción_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfación_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Años_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antigüedad"                  "Antigüedad_Cargo"           
## [23] "Años_ultima_promoción"       "Años_acargo_con_mismo_jefe"

2 PUNTO. Análisis univariado

Realiza un análisis univariado (caracterización) de la información contenida en la base de datos rotación.

Nota: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuantitativas o cualitativas). Incluir interpretaciones de la variable rotación.

tabla_1 = table(rotacion$Rotación)
kable(tabla_1, caption = "Distribución rotación por Empleado")
Distribución rotación por Empleado
Var1 Freq
No 1233
Si 237
datos_1 <- c(0.84, 0.16)
categorías <- c("NO", "SI")
colores <- c("pink", "purple")
pie(datos_1, labels = categorías, col = colores, main = "Rotación Empleados")

De la data se evidencia que existen 24 variables y 1470 registros. De la gráfica podemos decir que, en cuanto a la rotación de trabajadores, el 84% (1233) manifestaron no haber rotado mientras el 16% (237) manifestaron haberlo hecho.

library(ggplot2)
library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.2.3
g1 = ggplot(rotacion, aes(x = Edad)) + geom_histogram() + theme_gray()

g2 = ggplot(rotacion, aes(x = Educación)) + geom_histogram() + theme_gray()

g3 = ggplot(rotacion, aes(x = Antigüedad_Cargo)) + geom_histogram() + theme_gray()

g4 = ggplot(rotacion, aes(x = `Viaje de Negocios`)) + geom_bar() + theme_gray()

g5 = ggplot(rotacion, aes(x = Estado_Civil)) + geom_bar() + theme_gray()

g6 = ggplot(rotacion, aes(x = Horas_Extra)) + geom_bar() + theme_gray()

ggarrange(g1, g2, g3, g4, g5, g6, labels = c("A", "B", "C", "D", "E", "F"), ncol = 3, nrow = 2)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ANALISIS E INTERPRETACIONES

Como se puede observar en las gráficas, en la variable ““Edad” tenemos que la mayor concentración de empleados de esta empresa se encuentra entre los 30 y 40 años. En cuanto a la variable “Satisfacción Laboral” se puede observar que más del 60% de los empleados calificaron en nivel 3 y 4 esta variable. Por último, la variable “Antigüedad_Cargo” se observa que la mayoría de empleados se encuentran en el rango de antigüedad entre 0 y <10 años, son muy pocos los empleados antiguos entre 10 y 10 años.

Para las variables categóricas, la variable “Viaje de Negocios” máqs del 70% de los empleados contesto “Raramente” por lo que entre “Frecuentemente” y la anterior se encuentra concentrada la mayoría de empleados por lo que se consideraría altamente significativa para la rotación de cargo o empleo. En cuanto a la variable “Estado Civil” la proporción es igual para el estado “Casado” como para la sumatoria de “Divorciado” y “soltero”. Por último, la variable “Horas Extra” si bien es cierto que más del 70% de los empleados no trabajan horas adicionales, si existe un gran porcentaje que lo hace por lo que podría ser significativa al momento del análisis de rotación de cargo o empleo.

PUNTO 3.

Realizar un análisis de bivariado en donde la variable respuesta sea la rotación codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación), con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipótesis planteada en el punto 2.***

require(CGPfunctions)
## Loading required package: CGPfunctions
## Warning: package 'CGPfunctions' was built under R version 4.2.3
require(plotly)
## Loading required package: plotly
## Warning: package 'plotly' was built under R version 4.2.3
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
###Variables categóricas

g1 = PlotXTabs2(rotacion,`Viaje de Negocios`, Rotación , plottype = "percent")
g2 = PlotXTabs2(rotacion, Estado_Civil, Rotación , plottype = "percent")
g3 = PlotXTabs2(rotacion, Horas_Extra, Rotación , plottype = "percent")

###Variables cuantitativas

g4 = ggplot(rotacion,aes(x=Rotación,y= Edad,fill=Rotación))+geom_boxplot()+theme_gray()
g5 = ggplot(rotacion,aes(x=Rotación,y= Educación,fill=Rotación))+geom_boxplot()+theme_gray()
g6 = ggplot(rotacion,aes(x=Rotación,y= Antigüedad_Cargo,fill=Rotación))+geom_boxplot()+theme_gray()

g1

Viaje de Negocios

En la gráfica se puede observar que el 25% de los empleados que viajan frecuentemente rotaron de cargo y el 15% de los que lo hacen raramente rotaron, esto quiere decir que entre estos 1.320 empleados representa el 40% de la rotación de los empleados, frente al 8% de rotación de los empleados que no realiza viaje de negocios. Esto se comporta de acuerdo a la hipótesis inicial donde se postula que los empleados que viajan tienden mayor probabilidad de rotar de cargo.

g2

Estado Civil

En esta gráfica se observa que el 12% de los empleados que pertenecen al estado civil “Casado” roto de cargo el 12%, frente a un 10% para los empleados de estado “Divorciado” y el 26% los del estado “soltero” que agrupados estos dos últimos significan el 36% del personal que roto de cargo. Esta relación se comporta de acuerdo a la hipótesis inicial sobre que los empleados del estado civil “Casados” tienden a rotar menos de cargo que los de estado civil “Soltero” y “Divorciado”

g3

Horas Extra

En esta gráfica se puede observar que el 31% de los empleados que trabajan horas adicionales rotaron, mientras que el 10% de la rotación representa empleados que no tienen horas adicionales de trabajo. Efectivamente se comprueba de acuerdo a la hipótesis inicial que estimaba que los empleados que trabajan horas adicionales rotarían en una mayor proporción frente a los que no lo hacen.

ggplotly(g4)

Edad

En esta gráfica se observa que la mediana de las personas que sí rotaron es de 32 años comparada con 36 años de los que no rotaron. Como vemos hay una tendencia que marca que los empleados de menor edad rotaron en mayor proporción, lo que se comporta de acuerdo a la hipótesis inicial.

ggplotly(g5)

Educación

Se observa en esta gráfica que la proporción es exactamente igual para todos los empleados tanto los que rotaron como los que no, por lo tanto, se desestima la hipótesis inicial concluyendo que la variable “Educación” no sugieren una relevancia en el comportamiento de rotación de los empleados de esta empresa.

ggplotly(g6)

Antigüedad Cargo

En esta gráfica observamos que al contrario de la hipótesis planteada la rotación se da en menor antigüedad en el cargo, pues a mayor antigüedad existe menos rotación. Por lo tanto, aunque no se desestima la hipótesis inicial si se concluye que la relación es inversa.

PUNTO 4. Estimación del modelo

Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotación (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.

rotacion$Rotación=as.numeric(rotacion$Rotación=="Si")

modelo1=glm(Rotación~Estado_Civil+Horas_Extra+`Viaje de Negocios`+Educación+Edad+Antigüedad_Cargo,data = rotacion,family = "binomial")

summary(modelo1)
## 
## Call:
## glm(formula = Rotación ~ Estado_Civil + Horas_Extra + `Viaje de Negocios` + 
##     Educación + Edad + Antigüedad_Cargo, family = "binomial", 
##     data = rotacion)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.5846  -0.5823  -0.4028  -0.2541   3.0352  
## 
## Coefficients:
##                               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                   0.004764   0.401336   0.012 0.990529    
## Estado_CivilDivorciado       -0.292867   0.228489  -1.282 0.199929    
## Estado_CivilSoltero           0.788670   0.170937   4.614 3.95e-06 ***
## Horas_ExtraSi                 1.439550   0.157575   9.136  < 2e-16 ***
## `Viaje de Negocios`No_Viaja  -1.358165   0.352748  -3.850 0.000118 ***
## `Viaje de Negocios`Raramente -0.666985   0.180363  -3.698 0.000217 ***
## Educación                     0.034267   0.076470   0.448 0.654077    
## Edad                         -0.042929   0.009425  -4.555 5.24e-06 ***
## Antigüedad_Cargo             -0.123989   0.026257  -4.722 2.33e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1090.1  on 1461  degrees of freedom
## AIC: 1108.1
## 
## Number of Fisher Scoring iterations: 5

Para este modelo según la estimación, las variables seleccionadas en general no son significativas sugieriendo que los cambios en el predictor no están asociados con cambios en la respuesta de las variables seleccionadas a excepción de la variable ’Viaje de Negocios´ con un valor p de significancia estadística.

Para conocer los coeficientes se debe sacar el ratio de ODDS, indicándonos la probabilidad de rotación de acuerdo con cada una de las variables seleccionada.

exp(modelo1$coefficients)
##                  (Intercept)       Estado_CivilDivorciado 
##                    1.0047753                    0.7461217 
##          Estado_CivilSoltero                Horas_ExtraSi 
##                    2.2004685                    4.2187953 
##  `Viaje de Negocios`No_Viaja `Viaje de Negocios`Raramente 
##                    0.2571323                    0.5132537 
##                    Educación                         Edad 
##                    1.0348604                    0.9579791 
##             Antigüedad_Cargo 
##                    0.8833899

PUNTO 5

Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.

library(vcd)
## Warning: package 'vcd' was built under R version 4.2.3
## Loading required package: grid
pp1= predict.glm(modelo1, newdata = rotacion, type = "response")
resp = table(rotacion$Rotación, ifelse(pp1 >0.2, 1, 0), dnn = c("observaciones", "predicciones"))
resp
##              predicciones
## observaciones   0   1
##             0 976 257
##             1  84 153
mosaic(resp, shade = T, colorize = T,
gp = gpar(fill = matrix(c("pink", "purple", "purple", "pink"), 2, 2)))

sum(diag(resp)/sum(resp))
## [1] 0.7680272
library(ROCR)
## Warning: package 'ROCR' was built under R version 4.2.3
prediccion_rotacion= ROCR::prediction(pp1,rotacion$Rotación)
perf= performance(prediction.obj = prediccion_rotacion, "tpr", "fpr")
plot(perf,xlab = "Specificity", ylab = "Sensitivity", col="red")
abline(a=0, b=1, col="gold")
grid()

AUClog= performance(prediccion_rotacion, measure = "auc")@y.values[[1]]
cat("AUC: ", AUClog, "n")
## AUC:  0.7720681 n

El área bajo la curva de 0.77 indica que el modelo es aceptable y puede servir para predecir la probabilidad de rotación del empleado.

Conclusiones y estrategia para disminuir rotación.

Teniendo en cuenta las variables escogidas en el modelo, aunque en la estimación no se encontraron de significancia estadística, se pudo apreciar cierto impacto sobre casi todas ellas, exceptuando “Educación” por lo que sugiere que este factor no influye en la decisión del empleado de esta empresa de rotar el cargo en búsqueda de otro. Por lo tanto, de las estrategias que se podrían sugerir:

Analizar el las causas que lleven a los empleados a percibir una baja satisfacción laboral, se puede desplegar una campaña de motivación, identidad corporativa y políticas de “salario emocional” que contribuyan a una mejor percepción del empleado sobre su satisfacción dentro de la empresa, estos pueden ser días compensatorios, salidas temprano los viernes y otras campañas que podrían elevar los indicadores para evitar la eventual rotación de este personal.