library(readxl)
datos = read_excel("D:/GUIANCARLO_2022/MAESTRIA CIENCIA DE DATOS/Metodos y Simulacion Estadistica/Actividad_27_02_2022/Rotacion.xlsx")
names(datos)
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis). Ejemplo: Se espera que las horas extra se relacionen con la rotación ya que las personas podrían desgastarse mas al trabajar horas extra y descuidan aspectos personales. La hipótesis es que las personas que trabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan extra. (serian 6, una por variable).
La variable edad se relacionada con la rotación, ya que las personas entre mayor edad están menos dispuestas a rotar, debido a su experticia en las actividades que desarrollan. La hipótesis es que las personas con edad mayor a 37 años tienen menor probabilidad de rotar de Empresa, dado que influye mucho en su vida personal y familiar.
La variable antigüedad se relaciona con la rotación, esto debido a que las personas con mayor antigüedad en la empresa no estarían dispuestas a rotar, estas son conocedoras de sus funciones en el cargo asignado. La hipótesis es que aquellas personas que tienen una antigüedad en la empresa mayor o igual a 7 años no estaria dispuesta a rotar.
La variable Estado_Civil está relacionada con rotación, en particular las personas casadas ya tienen una situación definida con sus parejas, además por sus compromisos familiares poco probable que roten en sus empresas, La hipótesis seria que la persona con estado civil casado tiene probabilidad menor de rotar de Empresa, debido a su estabilidad en sus cargos y situación familiar.
La variable años_acargo_con_mismo_jefe está relacionada con la rotación, se puede dar que las personas que llevan bastante años con el mismo jefe no estén dispuestas a rotar, ya que conocen su forma de trabajo y valoran la experiencia adquirida con su jefe y la forma de trabajar. La hipótesis es que las personas con una antigüedad mayor o igual a 4 años con el mismo jefe no estarían dispuestas a rotar de empresa.
La variable educación está relacionada con la rotación, se puede dar que las personas que tienen un nivel bajo a nivel de educación estén dispuestas a rotar de empresa, en busqueda de nuevas oportunidades y puedan ser partícipes de capacitación, la hipótesis es que aquellas personas que tengan un nivel de educación igual a 3 estan dispuestos a rotar.
La variable Ingreso Mensual tiene relación con la rotación, dado que cuando se tienen ingresos menores exista la probabilidad de buscar otras opciones, que les permita aumentar sus ingresos. La hipótesis es que aquellas personas que tienen un ingreso mensual menor o igual a la media (4920) estén dispuestos a rotar.
Realizar un análisis univariado (caracterización). Nota: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuantitativa o cualitativa). Incluir interpretaciones de la rotación.
require(ggplot2)
## Loading required package: ggplot2
require(ggpubr)
## Loading required package: ggpubr
se desarrolla mediante un histograma, nos indica que el mayor número de personas tiene una antigüedad de 2 años aproximadamente y muy pocas personas tienen antigüedad de 40 años en la empresa**
Indica que la mayoria de personas que trabajan en la empresa tienen un nivel educativo de 3, es decir un nivel profesionay, y un número muy pequeños de personas con nivel de estudio muy alto (5).
require(ggplot2)
require(ggpubr)
g1=ggplot(datos,aes(x=Antigüedad))+geom_histogram()+theme_bw()
g2=ggplot(datos,aes(x=Educación))+geom_bar()+theme_bw()
ggarrange(g1, g2,labels = c("a", "b"),ncol = 2, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Indica que la mayoria de las personas tienen una edad entre 35 a 37 años, de igual manera se puede detallar que hay muy pocos personas menores de 23 años y mayores de 57 años.
Indica el estado civil de las personas, podemos notar que la mayor parte de las personas son casados, le siguen los solteros y por último divorciados.
require(ggplot2)
require(ggpubr)
g1=ggplot(datos,aes(x=Edad))+geom_histogram()+theme_bw()
g2=ggplot(datos,aes(x=Estado_Civil))+geom_bar()+theme_bw()
ggarrange(g1, g2,labels = c("c", "d"),ncol = 2, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Indica que la gran parte de las personas De la empresa tienen un salario mensual aproximado a 2500, mientras que muy pocas personas tienen un ingreso aproximado de 15000.
Este analisis univariable indica que la mayor parte de personas llevan trabajando con el mismo jefe por un periodo de 2 años y hay muy pocas personas que llevan trabajando con el mismo jefe 15 años.
require(ggplot2)
require(ggpubr)
g1=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
g2=ggplot(datos,aes(x=Años_acargo_con_mismo_jefe))+geom_histogram()+theme_bw()
ggarrange(g1, g2,labels = c("e", "f"),ncol = 2, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Realizar un análisis bivariado (siempre contra la rotación).
Nota: Los indicadores y gráficos se usan dependiendo del tipo de variable (cuanti VS cuali, cuali VS cuali). Comparar los resultados con la hipótesis planteada inicialmente y determinar si los datos apoyan o no la hipótesis.
La hipótesis es que las personas con edad mayor a 37 años tienen menor probabilidad de rotar de Empresa, dado que influye mucho en su vida personal y familiar.
De acuerdo al análisis de diagrama de cajas y bigotes se puede notar que las mayores concentraciones de personas dispuestas a rotar se encuentran en edades entre 28 y 32 años aproximadamente, aunque se presentan algunos datos dispersos, se podría definir lo mencionado anteriormente, de esta manera con los datos obtenidos no sirven para apoyar la hipótesis planteada.
require(ggplot2)
require(ggpubr)
boxplot(datos$Edad~datos$Rotación,
xlab = 'Rotacion',
ylab = 'Edad',
main= 'Rotacion vs Edad',
col= 'red')
La hipótesis es que aquellas personas que tienen una antigüedad en la empresa mayor o igual a 7 años no estaria dispuesta a rotar.
para este caso tenemos una distribución asimétrica positiva, la mediana está más cerca al cuartil 1, la mediana corresponde al valor de 7 para el estado de NO, estos datos apoyarían la hipótesis planteada, sin embargo, se cuentan con datos no convencionales, esto hace que se tengan sesgos muy grandes, esto hace que los datos sean poco confiables, de esta manera los datos no apoyan la hipótesis planteada al principio.
require(ggplot2)
require(ggpubr)
boxplot(datos$Antigüedad~datos$Rotación,
xlab = 'Rotacion',
ylab = 'Antiguedad',
main= 'Rotacion vs Antigüedad',
col= 'blue')
La hipótesis seria que la persona con estado civil casado tiene probabilidad menor de rotar de Empresa, debido a su estabilidad en sus cargos y situación familiar. Una vez realizado el análisis se puede establecer que las personas con menos probabilidad de rotación son las divorciadas, de esta manera los datos no apoyan la hipótesis planteada inicialmente.
require(ggplot2)
require(ggpubr)
require(CGPfunctions)
## Loading required package: CGPfunctions
g2=PlotXTabs(datos, Rotación,Estado_Civil, "percent")
## Plotted dataset datos variables Rotación by Estado_Civil
La hipótesis es que las personas con una antigüedad mayor o igual a 4 años con el mismo jefe no estarían dispuestas a rotar de empresa, para este caso tenemos una distribución asimetrica positiva, luego la mediana esta mas cerca al cuartil 1,la media esta cercana al valor planteado en la hipotesis para el estado NO, la longitud del bigote superior es mayor al bigote inferior, implicando variación de los datos, tambien se cuenta con valores atipicos es decir que se alejan de los puntos que estan concentrados en la caja, luego los datos no apoyan la hipotesis planteada al principio.
require(ggplot2)
require(ggpubr)
boxplot(datos$Antigüedad~datos$Rotación,
xlab = 'Rotacion',
ylab = 'Años_acargo_con_mismo_jefe',
main= 'Rotacion vs Años_acargo_con_mismo_jefe',
col= 'yellow')
la hipótesis es que aquellas personas que tengan un nivel de educación igual a 3 están dispuestos a rotar. De acuerdo al grafico de cajas y bigotes se puede observar que la mediana está en el centro de ambas cajas y corresponde al valor de mediana planteado en la hipótesis para el estado SI, estamos frente a una distribución simétrica, luego los datos no apoyan la hipótesis planteada, dado que hay un nivel de incertidumbre entre las respuestas que dieron las personas, porque se cuenta con datos similares impidiendo asegurar la hipótesis.
require(ggplot2)
require(ggpubr)
boxplot(datos$Educación~datos$Rotación,
xlab = 'Rotacion',
ylab = 'Educación',
main= 'Rotacion vs Educación',
col= 'red')
La hipótesis es que aquellas personas que tienen un ingreso mensual menor o igual a la media (4920) estén dispuestos a rotar. De acuerdo al diagrama de cajas y bigotes se puede observar que la mediana en el estado SI no corresponde al valor de mediana plateado en la hipótesis, sin embargo hay mayor concentración en el diagrama de cajas de la opción SI frente a la opción NO, lo que apoyaria en un principio la hipotesis planteada, sin embargo se cuenta con una distribución asimétrica positiva, también se tienen puntos no convencionales, denotando puntos no convencionales, luego hay demasiado sesgo en la información y no se puede dar una respuesta confiable, es decir que los datos no apoyan la hipótesis planteada inicialmente.
boxplot(datos$Ingreso_Mensual~datos$Rotación,
xlab = 'Rotacion',
ylab = 'Ingreso_Mensual',
main= 'Rotacion vs Ingreso_Mensual',
col= 'blue')
Como estrategias la Empresa debería incentivar a las personas jóvenes para evitar que se retiren de la empresa, mejorar los incentivos a las personas que llevan bastante tiempo en le Empresa, crear eventos de integración donde sean partícipes los colaboradores con sus familias, esto ayudaría a potencializar la relación colaborador-empresa y así evitar que muchos de ellos se vayan a otras empresas. Capacitar a los jefes en manejo de personal, temas de liderazgo y trabajo en equipo, crear ambientes agradables de trabajo, crear programas de capacitación para los colaboradores, crear plan carrera para que las personas puedan avanzar dentro de la misma empresa, mejorar los salarios, crear métodos de bonificación por tareas cumplidas, mejorar el valor de las horas extras para aumentar el ingreso mensual de los colaboradores.