Antes de cualquier cosa fue necesario crear dos csv separados para
cada una de las sheets de las bases de datos, tanto para Colaboradores
como para bajas para asi poder trabajar de una manera mas optima.
Tipos de Variables Existentes para RHCOLAB
variable<-c("numero_de_empleado","nombre_completo", "edad", "genero", "fecha_de_alta", "antioguedad", "BAJA", "puesto", "departamento", "mano_de_obra", "salario_diario", "colonia", "municipio")
type<-c("Cualitativo (nominal)","Cualitativo (nominal)", "Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(discreta)", "cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cuantitativo (continua)", "Cualitativo (nominal)", "Cualitativo (nominal)")
Escala_de_Medición<-c("Numero", "Fecha", "Departamento", "Salario", "Estado")
table<-data.frame(variable,type)
knitr::kable(table)
| numero_de_empleado |
Cualitativo (nominal) |
| nombre_completo |
Cualitativo (nominal) |
| edad |
Cuantitativo(discreta) |
| genero |
Cualitativo (nominal) |
| fecha_de_alta |
Cuantitativo(discreta) |
| antioguedad |
cualitativo (nominal) |
| BAJA |
Cualitativo (nominal) |
| puesto |
Cualitativo (nominal) |
| departamento |
Cualitativo (nominal) |
| mano_de_obra |
Cualitativo (nominal) |
| salario_diario |
Cuantitativo (continua) |
| colonia |
Cualitativo (nominal) |
| municipio |
Cualitativo (nominal) |
Tipos de Variables Existentes para RHBAJAS
variable<-c ("nombre","edad", "genero", "fecha_alta", "motivo_baja", "dias_de_trabajo", "baja", "puesto_que_desempeña", "salario_imss", "colonia", "municipio", "estado", "estado_civil" )
type<-c ("Cualitativo (nominal)","Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(discreta)", "Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(Continua)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)" )
Escala_de_Medición<-c("Numero", "Fecha", "Departamento", "Salario", "Estado")
table<-data.frame(variable,type)
knitr::kable(table)
| nombre |
Cualitativo (nominal) |
| edad |
Cuantitativo(discreta) |
| genero |
Cualitativo (nominal) |
| fecha_alta |
Cuantitativo(discreta) |
| motivo_baja |
Cualitativo (nominal) |
| dias_de_trabajo |
Cuantitativo(discreta) |
| baja |
Cuantitativo(discreta) |
| puesto_que_desempeña |
Cualitativo (nominal) |
| salario_imss |
Cuantitativo(Continua) |
| colonia |
Cualitativo (nominal) |
| municipio |
Cualitativo (nominal) |
| estado |
Cualitativo (nominal) |
| estado_civil |
Cualitativo (nominal) |
Lo siguiente fue ver los tipos de variables de las bases de datos y
esto para poder saber bien de que manera iba a ser mejor y mas eficiente
tratar cada una de las variables dependiendo si eras cualitativas,
cuantitatvas, nominales, discretas y continuas
Limpieza de datos
RhColab1<-RhColab %>% select(-one_of('numero_de_empleado','Fecha_alta' , 'BAJA', 'edad'))
# lets rename the selected columns / variables
summary(RhColab1)
## nombre_completo genero fecha_de_alta antiguedad
## Length:999 Length:999 Length:999 Min. : 0.000
## Class :character Class :character Class :character 1st Qu.: 0.000
## Mode :character Mode :character Mode :character Median : 0.000
## Mean : 1.425
## 3rd Qu.: 2.000
## Max. :12.000
## NA's :886
## puesto departamento mano_de_obra salario_diario
## Length:999 Length:999 Length:999 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## NA's :886
## colonia municipio
## Length:999 Length:999
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
names(RhColab1)<-c('Nom_Comp', 'Gen', 'Fecha_alta', 'Ant', 'Puesto', 'Dep', 'MDO', 'Sal_Diario', 'Col', 'Mun')
names(RhBajas1)<-c('Nom', 'Edad', 'Gen', 'Fecha_alta', 'MB', 'Días_trab', 'Baja', 'PuestDes', 'Sal_IMSS', 'Col', 'Mun', 'Estado', 'EstCiv')
##lets convert fecha_nacimiento to date format
RhColab1$Fecha_alta<-as.Date(RhColab$fecha_de_alta, format = "%d/%m/%Y")
RhBajas1$Fecha_alta<-as.Date(RhBajas1$Fecha_alta, format = "%d/%m/%Y")
RhBajas1$Baja<-as.Date(RhBajas1$Baja, format = "%d/%m/%Y")
str(RhColab1)
## 'data.frame': 999 obs. of 10 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : chr "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : chr "Supervisor de Máquin" "Supervisor de pegado" "Externo" "SUPERVISORA" ...
## $ Dep : chr "Produccion Cartón MDL" "Produccion Cartón MDL" "Externo" "Produccion Cartón MC" ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : chr "UNIDAD LABORAL" "SANTA TERESITA" "VILLAS DE HUINALA" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "APODACA" "APODACA" "APODACA" ...
str(RhBajas1)
## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ Días_trab : int 628 60 59 59 51 37 37 31 18 224 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ Estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ EstCiv : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
# Eliminar NA's y sustituir con 0's
sum(is.na(RhColab1))
## [1] 2658
sum(is.na(RhBajas1))
## [1] 0
summary(RhColab1)
## Nom_Comp Gen Fecha_alta Ant
## Length:999 Length:999 Min. :2010-07-01 Min. : 0.000
## Class :character Class :character 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
## NA's :886 NA's :886
## Puesto Dep MDO Sal_Diario
## Length:999 Length:999 Length:999 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## NA's :886
## Col Mun
## Length:999 Length:999
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
summary(RhBajas1)
## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Min. :2016-10-12
## Class :character 1st Qu.:23.00 Class :character 1st Qu.:2022-01-19
## Mode :character Median :29.00 Mode :character Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Min. :2021-11-27 Length:237
## Class :character 1st Qu.: 9.00 1st Qu.:2022-03-01 Class :character
## Mode :character Median : 21.00 Median :2022-05-06 Mode :character
## Mean : 83.42 Mean :2022-05-05
## 3rd Qu.: 49.00 3rd Qu.:2022-07-07
## Max. :1966.00 Max. :2022-08-25
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
RhColab1 <- na.omit(RhColab1)
RhBajas1 <- na.omit(RhBajas1)
summary(RhColab1)
## Nom_Comp Gen Fecha_alta Ant
## Length:113 Length:113 Min. :2010-07-01 Min. : 0.000
## Class :character Class :character 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
## Puesto Dep MDO Sal_Diario
## Length:113 Length:113 Length:113 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## Col Mun
## Length:113 Length:113
## Class :character Class :character
## Mode :character Mode :character
##
##
##
summary(RhBajas1)
## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Min. :2016-10-12
## Class :character 1st Qu.:23.00 Class :character 1st Qu.:2022-01-19
## Mode :character Median :29.00 Mode :character Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Min. :2021-11-27 Length:237
## Class :character 1st Qu.: 9.00 1st Qu.:2022-03-01 Class :character
## Mode :character Median : 21.00 Median :2022-05-06 Mode :character
## Mean : 83.42 Mean :2022-05-05
## 3rd Qu.: 49.00 3rd Qu.:2022-07-07
## Max. :1966.00 Max. :2022-08-25
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
str(RhColab1)
## 'data.frame': 113 obs. of 10 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : chr "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : chr "Supervisor de Máquin" "Supervisor de pegado" "Externo" "SUPERVISORA" ...
## $ Dep : chr "Produccion Cartón MDL" "Produccion Cartón MDL" "Externo" "Produccion Cartón MC" ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : chr "UNIDAD LABORAL" "SANTA TERESITA" "VILLAS DE HUINALA" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "APODACA" "APODACA" "APODACA" ...
## - attr(*, "na.action")= 'omit' Named int [1:886] 114 115 116 117 118 119 120 121 122 123 ...
## ..- attr(*, "names")= chr [1:886] "114" "115" "116" "117" ...
str(RhBajas1)
## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ Días_trab : int 628 60 59 59 51 37 37 31 18 224 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ Estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ EstCiv : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
Caracteristicas Adicionales
library(lubridate)
##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
edad<-trunc((RhColab1$Fecha_alta %--% RhColab1$Fecha_alta) / years(1)) # %--% creates a time interval based on as.date() format
RhColab1$edad<-edad
edad<-trunc((RhBajas1$Fecha_alta %--% RhBajas1$Fecha_alta) / years(1))
edad<-trunc((RhBajas1$Baja %--% RhBajas1$Baja) / years(1))
Necesario realizar el calculo de la variable “año” para proseguir con
las caracteristicas adicionales de los colaboradores
Estructura de las bases de datos RhColab1 y RhBajas1
str(RhColab1)
## 'data.frame': 113 obs. of 11 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : Factor w/ 2 levels "FEMENINO","MASCULINO": 2 1 2 1 1 2 1 2 2 1 ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : Factor w/ 29 levels "AY. GENERAL",..: 27 28 10 29 29 8 7 4 3 7 ...
## $ Dep : Factor w/ 22 levels "","Ay.flexo",..: 18 18 13 17 8 4 8 19 4 10 ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : Factor w/ 73 levels "ALAMOS DEL PARQUE",..: 64 61 69 51 56 18 1 52 14 5 ...
## $ Mun : Factor w/ 9 levels "APODACA","CAÑADA BLANCA",..: 9 1 1 1 1 8 1 1 8 9 ...
## $ edad : num 0 0 0 0 0 0 0 0 0 0 ...
## - attr(*, "na.action")= 'omit' Named int [1:886] 114 115 116 117 118 119 120 121 122 123 ...
## ..- attr(*, "names")= chr [1:886] "114" "115" "116" "117" ...
summary(RhColab1)
## Nom_Comp Gen Fecha_alta Ant
## Length:113 FEMENINO :61 Min. :2010-07-01 Min. : 0.000
## Class :character MASCULINO:52 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
##
## Puesto Dep MDO
## AYUDANTE GENERAL:59 :40 Length:113
## COSTURERA :10 Producción Retorn :10 Class :character
## AY. GENERAL : 7 Costura : 7 Mode :character
## SOLDADOR : 5 Produccion Cartón MDL: 7
## CHOFER : 4 Stabilus : 7
## RESIDENTE : 4 Cedis : 6
## (Other) :24 (Other) :36
## Sal_Diario Col Mun edad
## Min. :144.4 PUEBLO NUEVO :27 APODACA :72 Min. :0
## 1st Qu.:176.7 CANTORAL : 4 JUAREZ :10 1st Qu.:0
## Median :180.7 CAÑADA BLANCA : 3 PESQUERIA: 9 Median :0
## Mean :181.4 MISION SAN PABLO : 3 GUADALUPE: 6 Mean :0
## 3rd Qu.:180.7 PORTAL DE HUINALA : 3 SALTILLO : 5 3rd Qu.:0
## Max. :441.4 VALLE DE SANTA MARIA: 3 MONTERREY: 4 Max. :0
## (Other) :70 (Other) : 7
str(RhBajas1)
## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : Factor w/ 2 levels "FEMENINO","MASCULINO": 2 1 1 1 1 1 1 2 2 2 ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : Factor w/ 5 levels "ABANDONO","BAJA POR FALTAS",..: 4 4 4 4 4 2 2 2 2 4 ...
## $ Días_trab : Factor w/ 95 levels "0","1","2","3",..: 88 53 52 52 48 37 37 31 19 79 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : Factor w/ 31 levels "ANALISTA DE NOMINAS /AUX DE R.H.",..: 15 9 9 9 9 9 9 9 9 4 ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : Factor w/ 98 levels "ACANTO RESIDENCIAL",..: 82 18 72 72 73 28 72 48 15 80 ...
## $ Mun : Factor w/ 13 levels "APODACA","CADEREYTA",..: 10 7 1 1 1 1 1 5 4 1 ...
## $ Estado : Factor w/ 3 levels "COAHUILA","NUEVO LEÓN",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ EstCiv : Factor w/ 5 levels "CASADO","DIVORCIADO",..: 3 5 1 3 3 3 5 5 3 3 ...
summary(RhBajas1)
## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 FEMENINO :140 Min. :2016-10-12
## Class :character 1st Qu.:23.00 MASCULINO: 97 1st Qu.:2022-01-19
## Mode :character Median :29.00 Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
##
## MB Días_trab Baja
## ABANDONO : 1 15 : 11 Min. :2021-11-27
## BAJA POR FALTAS :141 1 : 9 1st Qu.:2022-03-01
## JUBILACION : 1 6 : 9 Median :2022-05-06
## RENUNCIA VOLUNTARIA: 86 9 : 8 Mean :2022-05-05
## TERMINO DE CONTRATO: 8 0 : 7 3rd Qu.:2022-07-07
## 8 : 7 Max. :2022-08-25
## (Other):186
## PuestDes Sal_IMSS Col
## AYUDANTE GENERAL :173 Min. :144.4 PUEBLO NUEVO : 67
## SOLDADOR : 11 1st Qu.:180.7 VALLE DE SANTA MARIA: 15
## COSTURERA : 10 Median :180.7 CANTORAL : 10
## MONTACARGUISTA : 5 Mean :178.6 PORTAL DE HUINALA : 6
## AY. GENERAL : 4 3rd Qu.:180.7 SAN ISIDRO : 6
## AUXILIAR DE EMBARQUES: 3 Max. :500.0 BOSQUES DE HUINALA : 4
## (Other) : 31 (Other) :129
## Mun Estado EstCiv
## APODACA :162 COAHUILA : 9 CASADO : 64
## PESQUERIA : 32 NUEVO LEÓN:227 DIVORCIADO : 3
## JUAREZ : 15 SALTILLO : 1 SOLTERO :110
## GUADALUPE : 10 Unión libre: 1
## RAMOS ARIZPE : 8 UNIÓN LIBRE: 59
## SAN NICOLAS DE LOS GARZA: 3
## (Other) : 7
Tablas de Visualizacion
## Colaboradores
tapply(RhColab1$Sal_Diario,
list(RhColab1$Gen,RhColab1$Puesto), mean)
## AY. GENERAL AYUDANTE DE MANTENIMIENTO Ayudante general
## FEMENINO 151.61 NA NA
## MASCULINO 151.61 180.68 176.72
## AYUDANTE GENERAL CHOFER CHOFER GESTOR COSTURERA CUSTOMER SERVICE INF
## FEMENINO 177.4222 NA NA 191.7533 NA
## MASCULINO 176.2268 177.71 180.68 176.7200 176.72
## ENFERMERA Externo EXTERNO GESTOR GUARDIA DE SEGURIDAD
## FEMENINO 176.72 NA NA NA NA
## MASCULINO NA 176.72 151.67 176.72 180.68
## INSPECTOR DE CALIDAD INSPECTORA DE CALIDAD LIDER LIMPIEZA
## FEMENINO 208.65 180.68 144.45 176.72
## MASCULINO NA NA NA NA
## MANTENIMIENTO MONTACARGUISTA MOZO OP. FLEXO-RANURADORA-REFILADORA
## FEMENINO NA NA NA NA
## MASCULINO 279.61 180.68 180.68 176.72
## OPERADOR SIERRA PINTOR RECIBO RESIDENTE SOLDADOR Supervisor de Máquin
## FEMENINO NA NA 176.72 NA NA NA
## MASCULINO 180.68 176.72 NA 177.71 179.888 176.72
## Supervisor de pegado SUPERVISORA
## FEMENINO 176.72 389.21
## MASCULINO NA NA
tapply(RhColab1$Sal_Diario,
list(RhColab1$Gen,RhColab1$Dep), mean)
## Ay.flexo Calidad Cedis CEDIS Celdas CORTADORAS Costura
## FEMENINO 178.7544 NA 194.665 NA NA 180.68 NA 245.375
## MASCULINO 176.5400 180.68 NA 176.72 180.68 NA 180.68 176.720
## COSTURA Costura T2 EHS Embarques Externo Limpieza Materiales
## FEMENINO 151.61 152.86 176.720 NA NA 176.72 176.72
## MASCULINO NA NA 230.145 177.71 164.195 NA NA
## Paileria Produccion Cartón MC Produccion Cartón MDL Producción Retorn
## FEMENINO NA 194.405 156.0975 161.3000
## MASCULINO 178.7 151.670 168.3700 183.8443
## Rotativa Stabilus Troquel
## FEMENINO NA 180.68 180.68
## MASCULINO 151.61 180.68 180.68
## Bajas
tapply(RhBajas1$Sal_IMSS,RhBajas1$Gen,mean)
## FEMENINO MASCULINO
## 177.3126 180.5544
Reemplazamientos
RhColab1$Sal_Diario<-replace(RhColab1$Sal_Diario,RhColab1$Sal_Diario>1000000,181)
Necesario reemplazar el valor arrojado de salario_diario por la
mediana para asi poder tener un analisis mas certero ya que es bastante
comun que con esta se puedan realizar estos tipos de cambios.
Graficos
tapply(RhColab1$Sal_Diario,
list(RhColab1$Gen,RhColab1$Dep), mean)
## Ay.flexo Calidad Cedis CEDIS Celdas CORTADORAS Costura
## FEMENINO 178.7544 NA 194.665 NA NA 180.68 NA 245.375
## MASCULINO 176.5400 180.68 NA 176.72 180.68 NA 180.68 176.720
## COSTURA Costura T2 EHS Embarques Externo Limpieza Materiales
## FEMENINO 151.61 152.86 176.720 NA NA 176.72 176.72
## MASCULINO NA NA 230.145 177.71 164.195 NA NA
## Paileria Produccion Cartón MC Produccion Cartón MDL Producción Retorn
## FEMENINO NA 194.405 156.0975 161.3000
## MASCULINO 178.7 151.670 168.3700 183.8443
## Rotativa Stabilus Troquel
## FEMENINO NA 180.68 180.68
## MASCULINO 151.61 180.68 180.68
hist(RhBajas1$Edad, freq=TRUE, col='orange', main="Histograma de Edad",xlab="Edad en AC1os")

ggplot(RhBajas1, aes(x=Gen, y=Edad, fill=Gen)) +
geom_boxplot()

ggplot(RhColab1, aes(x=Gen, y=Sal_Diario, fill=Gen)) +
geom_boxplot()

ggplot(RhColab1, aes(Gen,Sal_Diario,fill=Gen)) +
geom_bar(stat = "identity") +
scale_fill_brewer(palette = "Set2") + ggtitle("Salario Diario por Genero")

ggplot(RhBajas1, aes(x=Gen, y=Sal_IMSS, fill=Gen)) +
geom_bar(stat="identity") +
facet_grid(~EstCiv) + scale_fill_brewer(palette = "Set1")
