Actividad 1

Con base en los datos de rotación realizar los puntos 1 a 4:

library(readxl)
datos = read_excel("~/Desktop/Datos_Rotación.xlsx")
names(datos)

##  [1] "Rotación"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educación"                  
##  [7] "Campo_Educación"             "Satisfacción_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfación_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Años_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antigüedad"                  "Antigüedad_Cargo"           
## [23] "Años_ultima_promoción"       "Años_acargo_con_mismo_jefe"

Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis). Ejemplo: Se espera que las horas extra se relacionen con la rotación ya que las personas podrían desgastarse mas al trabajar horas extra y descuidan aspectos personales. La hipótesis es que las personas que trabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan extra. (serian 6, una por variable).
Realizar un análisis univariado (caracterización). Nota: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuanti o cuali). Incluir interpretaciones de la rotación.

require(ggplot2)
require(ggpubr)

g1=ggplot(datos,aes(x=Edad))+geom_histogram()+theme_bw()
g2=ggplot(datos,aes(x=`Viaje de Negocios`))+geom_bar()+theme_bw()

ggarrange(g1, g2,labels = c("A", "B"),ncol = 2, nrow = 1)

Realizar un análisis de bivariado en donde la variable respuesta sea la rotación codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación), con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.

datos$Edad_grupo=cut(datos$Edad,breaks = c(0,30,40,50,60))
require(table1)
y <- table1::table1(~ Edad_grupo+`Viaje de Negocios`+Estado_Civil+Ingreso_Mensual+Genero | Rotación, data = datos)

y

	No (N=1233)	Si (N=237)	Overall (N=1470)
Edad_grupo
(0,30]	286 (23.2%)	100 (42.2%)	386 (26.3%)
(30,40]	534 (43.3%)	85 (35.9%)	619 (42.1%)
(40,50]	288 (23.4%)	34 (14.3%)	322 (21.9%)
(50,60]	125 (10.1%)	18 (7.6%)	143 (9.7%)
Viaje de Negocios
Frecuentemente	208 (16.9%)	69 (29.1%)	277 (18.8%)
No_Viaja	138 (11.2%)	12 (5.1%)	150 (10.2%)
Raramente	887 (71.9%)	156 (65.8%)	1043 (71.0%)
Estado_Civil
Casado	589 (47.8%)	84 (35.4%)	673 (45.8%)
Divorciado	294 (23.8%)	33 (13.9%)	327 (22.2%)
Soltero	350 (28.4%)	120 (50.6%)	470 (32.0%)
Ingreso_Mensual
Mean (SD)	6830 (4820)	4790 (3640)	6500 (4710)
Median [Min, Max]	5200 [1050, 20000]	3200 [1010, 19900]	4920 [1010, 20000]
Genero
F	501 (40.6%)	87 (36.7%)	588 (40.0%)
M	732 (59.4%)	150 (63.3%)	882 (60.0%)

t.test(datos$Edad~datos$Rotación)

## 
##  Welch Two Sample t-test
## 
## data:  datos$Edad by datos$Rotación
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si 
##         37.56123         33.60759

require(CGPfunctions)
PlotXTabs2(data = datos,x = Edad_grupo,y = Rotación)

Realizar la estimación de un modelo de regresión logistico en el cual la variable respuesta es rotación (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas. Interprete los coeficientes del modelo y la significancia de los parametros.
Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.
Predeccir la probabilida de que un individuo (hipotetico) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).
En las conclusiones se discute sobre cual seria la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3). Ejemplo: Mejorar el ambiente laboral, los incentivos económicos, distribuir la carga de horas extra (menos turnos y mas personal).

Actividad 1

David Arango-Londoño

17/03/2022