data <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/Producion Completa.csv")
bd_merma <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/FORM - Merma1.csv")
bd_scrap <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/FORM - Scrap.csv")
bd_delivery_perf <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/FORM - Delivery Performance C.csv")
bd_externa <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/us_motor_production_and_domestic_sales.csv")
blimpia<-read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/bajas_limpia.csv")
climpia<-read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/rlimpia.csv")
base <-read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/us_motor_production_and_domestic_sales1.csv")
dp <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/Act 2.4 Equipo/DELIVERY PLAN bdf_Prueba.csv")bajas_bd<-read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/BD_Form_Limpias/bajas_final.csv")
colab_bd<-read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/BD_Form_Limpias/colab_final.csv")library(foreign)
library(dplyr) # data manipulation
library(forcats) # to work with categorical variables
library(ggplot2) # data visualization
library(janitor) # data exploration and cleaning
library(Hmisc) # several useful functions for data analysis
library(naniar)
library(dlookr)
library(pollster)
library(descr)
library(data.table)
library(epiDisplay)
library(tidyr)
library(psych) # functions for multivariate analysis
library(corrplot) # correlation plots
library(jtools) # presentation of regression analysis
library(lmtest) # diagnostic checks - linear regression analysis
library(car) # diagnostic checks - linear regression analysis
library(olsrr) # diagnostic checks - linear regression analysis
library(kableExtra) # HTML table attributes
library(tseries) # time series analysis and computational finance
library(forecast) # provides methods and tools for displaying and analyzing univariate time series forecast
library(astsa) # applied statistical time series analysis
library(plyr) Se trabajo en la base de datos para primero eliminar columnas que no son relevantes para el analisis, después convertir de caracter a N/A para poder eliminar los espacios en blanco sin datos y por último se reemplazó los NA’s con el promedio para obtener un aproximando del tiempo de producion en los dias que esta en blanco o N/A.
#### Tecnica 1. Remover valores irrelevantes
data1 <- data
data1<-subset(data1,select=-c(No.,ID.FORM,PRODUCTO,X,HR..FIN,ESTACION.ARRANQUE,INICIO.SEP.UP,FIN.INICIO.DE.SEP.UP,INICIO.de.PROCESO,FIN.de.PROCESO,TIEMPO.CALIDAD,TIEMPO.MATERIALES,MERMAS.Maquinas.))
str(data1)## 'data.frame': 5300 obs. of 5 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ TMO..MIN. : chr "9:20" "9:35" "9:55" "10:05" ...
## $ Laminas.procesadas: chr "9:05" "10:05" "9:40" "11.2" ...
#### Tecnica 4. Convertir tipos de datos
data2 <- data1
data2$TMO..MIN. <- substr(data2$TMO..MIN., start = 1, stop = 2)
#tibble(data2)
data2$TMO..MIN. <- as.integer(data2$TMO..MIN.)
str(data2) ## 'data.frame': 5300 obs. of 5 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ TMO..MIN. : int NA NA NA 10 10 10 10 10 11 10 ...
## $ Laminas.procesadas: chr "9:05" "10:05" "9:40" "11.2" ...
data3 <- data2
data3$Laminas.procesadas <- substr(data3$Laminas.procesadas, start = 1, stop = 2)
#tibble(data3)
data3$Laminas.procesadas <- as.integer(data3$Laminas.procesadas)
str(data3) ## 'data.frame': 5300 obs. of 5 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ TMO..MIN. : int NA NA NA 10 10 10 10 10 11 10 ...
## $ Laminas.procesadas: int NA 10 NA 11 12 12 2 2 NA NA ...
data3$Fecha <- as.Date(data3$Fecha, format ="%d/%m/%y")
#### Tecnica 5. Valores faltantes
data4 <- data3
data4$TMO..MIN.[is.na(data4$TMO..MIN.)]<-mean(data4$TMO..MIN., na.rm = TRUE)
summary (data4) ## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## Min. :2022-01-08 Length:5300 Min. : 0.00 Min. : 0.0
## 1st Qu.:2022-07-22 Class :character 1st Qu.: 15.00 1st Qu.:10.3
## Median :2022-08-19 Mode :character Median : 20.00 Median :10.3
## Mean :2022-08-05 Mean : 28.18 Mean :10.3
## 3rd Qu.:2022-09-03 3rd Qu.: 25.00 3rd Qu.:10.3
## Max. :2022-12-09 Max. :800.00 Max. :70.0
## NA's :1496
## Laminas.procesadas
## Min. : 0.000
## 1st Qu.: 0.000
## Median : 0.000
## Mean : 4.765
## 3rd Qu.:10.000
## Max. :97.000
## NA's :2626
data5 <- data4
data5$PIEZAS.PROG.[is.na(data5$PIEZAS.PROG.)]<-mean(data5$PIEZAS.PROG., na.rm = TRUE)
summary (data5) ## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## Min. :2022-01-08 Length:5300 Min. : 0.00 Min. : 0.0
## 1st Qu.:2022-07-22 Class :character 1st Qu.: 15.00 1st Qu.:10.3
## Median :2022-08-19 Mode :character Median : 25.00 Median :10.3
## Mean :2022-08-05 Mean : 28.18 Mean :10.3
## 3rd Qu.:2022-09-03 3rd Qu.: 28.18 3rd Qu.:10.3
## Max. :2022-12-09 Max. :800.00 Max. :70.0
##
## Laminas.procesadas
## Min. : 0.000
## 1st Qu.: 0.000
## Median : 0.000
## Mean : 4.765
## 3rd Qu.:10.000
## Max. :97.000
## NA's :2626
data6 <- data5
data6$Laminas.procesadas[is.na(data6$Laminas.procesadas)]<-mean(data6$Laminas.procesadas, na.rm = TRUE)
summary (data6)## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## Min. :2022-01-08 Length:5300 Min. : 0.00 Min. : 0.0
## 1st Qu.:2022-07-22 Class :character 1st Qu.: 15.00 1st Qu.:10.3
## Median :2022-08-19 Mode :character Median : 25.00 Median :10.3
## Mean :2022-08-05 Mean : 28.18 Mean :10.3
## 3rd Qu.:2022-09-03 3rd Qu.: 28.18 3rd Qu.:10.3
## Max. :2022-12-09 Max. :800.00 Max. :70.0
## Laminas.procesadas
## Min. : 0.000
## 1st Qu.: 0.000
## Median : 4.765
## Mean : 4.765
## 3rd Qu.: 4.765
## Max. :97.000
Se realizó una limpia previa a la base de datos debido a que no se podía manejar en R, ya que el formato en que se encontraba no permitía que R pudiera entender cuales eran las variables de nuestra base de datos y una vez teniendo la base de datos las técnicas que utilizamos en el programa fue Remover valores irrelevantes dejando las variables con mayor importancia como: Fecha, Cantidad y Ubicación de origen y la segunda técnica que utilizamos fue Convertir de caracter a fecha para tener la fecha en entero.
#### Técnica. Remover valores irrelevantes
#### Eliminar columnas
summary(bd_scrap)## Referencia Fecha Hora Producto
## Length:250 Length:250 Length:250 Length:250
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Cantidad Unidad.de.medida Ubicación.de.origen Ubicación.de.desecho
## Min. : 0.000 Length:250 Length:250 Length:250
## 1st Qu.: 1.000 Class :character Class :character Class :character
## Median : 2.000 Mode :character Mode :character Mode :character
## Mean : 6.696
## 3rd Qu.: 7.000
## Max. :96.000
## Estado
## Length:250
## Class :character
## Mode :character
##
##
##
bd_scrap2 <- bd_scrap
bd_scrap2 <- subset (bd_scrap2, select = -c (Referencia, Hora, Producto, Unidad.de.medida, Ubicación.de.desecho, Estado))
summary (bd_scrap2)## Fecha Cantidad Ubicación.de.origen
## Length:250 Min. : 0.000 Length:250
## Class :character 1st Qu.: 1.000 Class :character
## Mode :character Median : 2.000 Mode :character
## Mean : 6.696
## 3rd Qu.: 7.000
## Max. :96.000
#### Técnica. Convertir tipos de datos
#### Convertir de caracter a fecha
bd_scrap3 <- bd_scrap2
bd_scrap3$Fecha <- as.Date(bd_scrap3$Fecha, format ="%d/%m/%y")
summary(bd_scrap3)## Fecha Cantidad Ubicación.de.origen
## Min. :2020-08-01 Min. : 0.000 Length:250
## 1st Qu.:2020-08-11 1st Qu.: 1.000 Class :character
## Median :2020-08-19 Median : 2.000 Mode :character
## Mean :2020-08-17 Mean : 6.696
## 3rd Qu.:2020-08-25 3rd Qu.: 7.000
## Max. :2020-08-31 Max. :96.000
# Cambiar los nombres de las variables más cortas y específicas
names(bd_scrap3) [3] = "Ubi_origen"
names(bd_scrap3)## [1] "Fecha" "Cantidad" "Ubi_origen"
#### Exportar base de datos
bd_scrap4 <- bd_scrap3
write.csv(bd_scrap4, file ="scrap_FORM_limpia.csv", row.names = FALSE)Se realizó una limpia previa a la base de datos debido a que no se podía manejar en R, ya que el formato en que se encontraba no permitía que R pudiera entender cuales eran las variables de nuestra base de datos y una vez teniendo la base de datos las técnicas que utilizamos en el programa fue Remover valores irrelevantes dejando las variables con mayor importancia como: Fecha, Cantidad y Ubicación de origen y la segunda técnica que utilizamos fue Convertir de caracter a fecha para tener la fecha en entero.
# Técnica. Remover valores irrelevantes
# Eliminar columnas
summary(bd_merma)## Fecha Mes Kilos
## Length:60 Length:60 Min. : 790
## Class :character Class :character 1st Qu.: 3545
## Mode :character Mode :character Median : 4025
## Mean : 9271
## 3rd Qu.: 4702
## Max. :185426
bd_merma2 <- bd_merma
bd_merma2 <- subset (bd_merma2, select = -c (Mes))
# Eliminar renglones
bd_merma3 <- bd_merma2
bd_merma3 <- bd_merma3[bd_merma3$Fecha > 0, ]
# Técnica. Convertir tipos de datos
# Convertir de caracter a fecha
bd_merma4 <- bd_merma3
bd_merma4$Fecha <- as.Date(bd_merma4$Fecha, format ="%d/%m/%y")
# Exportar
bd_merma5 <- bd_merma4
write.csv(bd_merma5, file ="merma_FORM_limpia.csv", row.names = FALSE)Se realizó una limpia previa a la base de datos debido a que no se podía manejar en R, ya que el formato en que se encontraba no permitía que R pudiera entender cuales eran las variables de nuestra base de datos, por lo tanto las modificaciones y limpiezas que se realizaron fue la técnica de ‘Remover valores irrelevantes’ en este caso quitamos la conclusión porque no tendría valor en la base de datos, eliminamos target (horas) y tomamos el valor de cada inicio de mes para comparar principio de mes con mes, después en R se trabajo con la técnica de convertir tipos de datos en este caso de caracter a fecha y caracter a hora.
# Técnica 4. Convertir tipos de datos
# Convertir de caracter a fecha
bd_delivery_perf2 <- bd_delivery_perf
bd_delivery_perf2$fecha <- as.Date(bd_delivery_perf2$fecha, format ="%d/%m/%y")
library(tibble)
tibble(bd_delivery_perf2) ## # A tibble: 52 × 3
## fecha cliente dif
## <date> <chr> <dbl>
## 1 2021-07-31 "PRINTEL " 4.9
## 2 2021-07-31 "MAHLE" 15.7
## 3 2021-07-31 "MAGNA" 0
## 4 2021-07-31 "VARROC" 0
## 5 2021-08-31 "PRINTEL " 27.7
## 6 2021-08-31 "MAHLE" 67.3
## 7 2021-08-31 "MAGNA" 0
## 8 2021-08-31 "VARROC" 0
## 9 2021-09-30 "PRINTEL " 8.6
## 10 2021-09-30 "MAHLE" 56.8
## # … with 42 more rows
# Cambiar los nombres de las variables más cortas y específicas
names(bd_delivery_perf2) [3] = "delay_performance"
names(bd_delivery_perf2)## [1] "fecha" "cliente" "delay_performance"
# Exportar
bd_delivery_perf3 <- bd_delivery_perf2
write.csv(bd_delivery_perf3, file ="deliveryperformance_FORM_limpia.csv", row.names = FALSE)La limpieza y modificación de filas y columnas respecto a las variables se realizó directamente en Excel por cuestiones de facilidad ya que la base estaba ordenada de una manera en donde R resultaría mucho más complicado.
# Técnica 4. Convertir tipos de datos
# Convertir de caracter a fecha
dp1 <- dp
dp1$Fecha<-as.Date(dp1$Fecha,format="%m/%d/%Y")
# Contabilizar si hay NA´S dentro de la base de datos actual para sustituirlos con la media, moda o mediana.
colSums(is.na(dp1))## ID_Fecha Fecha CLIENTE Pedidos
## 0 0 0 0
# Vemos que en la base de datos no hay NA´S
## Exportamos la base de datos limpia
write.csv(dp1, file ="DELIVERY_FINAL_LIMPIA.csv", row.names = FALSE)En la base de datos s e trabajó previamente en excel, homogenizando las variables y después se trabajo en R distintas técnicas logrando eliminar las variables que no se consideren necesarias.
# Técnica. Remover valores irrelevantes
climpia2<-climpia
climpia2<-subset(climpia2,select=-c(Primer.mes,X4to.mes,Empleado,DEPARTAMENTO))
summary(climpia2)## ANO.DE.NACIMIENTO GENERO FECHA.DE.ALTA PUESTO
## Min. :1955 Length:104 Min. :2010 Length:104
## 1st Qu.:1978 Class :character 1st Qu.:2021 Class :character
## Median :1989 Mode :character Median :2022 Mode :character
## Mean :1987 Mean :2021
## 3rd Qu.:1996 3rd Qu.:2022
## Max. :2003 Max. :2022
## SALARIO.DIARIO.IMSS LUGAR.DE.NACIMIENTO MUNICIPIO ESTADO
## Min. :144.4 Length:104 Length:104 Length:104
## 1st Qu.:176.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :179.3
## 3rd Qu.:180.7
## Max. :337.1
## ESTADO.CIVIL
## Length:104
## Class :character
## Mode :character
##
##
##
# ¿Cuántos NA tengo por variables? COLAB
sapply(climpia2,function(x) sum(is.na(x)))## ANO.DE.NACIMIENTO GENERO FECHA.DE.ALTA PUESTO
## 0 0 0 0
## SALARIO.DIARIO.IMSS LUGAR.DE.NACIMIENTO MUNICIPIO ESTADO
## 0 0 0 0
## ESTADO.CIVIL
## 0
# ¿Cuántos NA tengo por variables? BAJAS
sapply(blimpia,function(x) sum(is.na(x)))## NOMBRE.COMPLETO EDAD GENERO FECHA.DE.ALTA
## 0 0 0 0
## MOTIVO.DE.BAJA DURACION PUESTO SALARIO.DIARIO.IMSS
## 0 0 0 0
## ESTADO ESTADO.CIVIL
## 0 0
# No hay más valores faltantes.
# Técnica. Convertir tipos de datos
# Cambiar nombres de columnas.
# COLAB
str(climpia2)## 'data.frame': 104 obs. of 9 variables:
## $ ANO.DE.NACIMIENTO : int 1990 1984 1984 1985 1984 1962 1966 1976 1963 1979 ...
## $ GENERO : chr "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" ...
## $ FECHA.DE.ALTA : int 2013 2018 2015 2016 2020 2020 2022 2022 2022 2022 ...
## $ PUESTO : chr "SUPERVISORA" "MANTENIMIENTO" "COSTURERA" "AYUDANTE GENERAL" ...
## $ SALARIO.DIARIO.IMSS: num 337 280 260 241 241 ...
## $ LUGAR.DE.NACIMIENTO: chr "" "" "" "" ...
## $ MUNICIPIO : chr "APODACA" "APODACA" "APODACA" "APODACA" ...
## $ ESTADO : chr "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" ...
## $ ESTADO.CIVIL : chr "Casado" "Soltero" "Casado" "Casado" ...
names (climpia2) = c("edad", "genero", "alta", "puesto", "salario_diario", "lugar.nacim.","mpio","estado","civil")
names (climpia2)## [1] "edad" "genero" "alta" "puesto"
## [5] "salario_diario" "lugar.nacim." "mpio" "estado"
## [9] "civil"
str(climpia2)## 'data.frame': 104 obs. of 9 variables:
## $ edad : int 1990 1984 1984 1985 1984 1962 1966 1976 1963 1979 ...
## $ genero : chr "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" ...
## $ alta : int 2013 2018 2015 2016 2020 2020 2022 2022 2022 2022 ...
## $ puesto : chr "SUPERVISORA" "MANTENIMIENTO" "COSTURERA" "AYUDANTE GENERAL" ...
## $ salario_diario: num 337 280 260 241 241 ...
## $ lugar.nacim. : chr "" "" "" "" ...
## $ mpio : chr "APODACA" "APODACA" "APODACA" "APODACA" ...
## $ estado : chr "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" ...
## $ civil : chr "Casado" "Soltero" "Casado" "Casado" ...
# BAJAS
str(blimpia)## 'data.frame': 233 obs. of 10 variables:
## $ NOMBRE.COMPLETO : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ EDAD : int 32 36 23 21 29 46 29 31 50 19 ...
## $ GENERO : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ FECHA.DE.ALTA : chr "09/03/20" "09/11/21" "10/11/21" "10/11/21" ...
## $ MOTIVO.DE.BAJA : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ DURACION : num 628 60 59 59 51 37 37 31 18 224 ...
## $ PUESTO : chr "DISENO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ SALARIO.DIARIO.IMSS: num 500 152 152 152 152 ...
## $ ESTADO : chr "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" ...
## $ ESTADO.CIVIL : chr "Soltero" "Union libre" "Matrimonio" "Soltero" ...
names (blimpia) = c("nombre", "edad", "genero", "alta", "motivo_baja", "duracion", "puesto","salario_diario","estado","e.civil.")
names (blimpia)## [1] "nombre" "edad" "genero" "alta"
## [5] "motivo_baja" "duracion" "puesto" "salario_diario"
## [9] "estado" "e.civil."
str(blimpia)## 'data.frame': 233 obs. of 10 variables:
## $ nombre : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ genero : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ alta : chr "09/03/20" "09/11/21" "10/11/21" "10/11/21" ...
## $ motivo_baja : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ duracion : num 628 60 59 59 51 37 37 31 18 224 ...
## $ puesto : chr "DISENO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ salario_diario: num 500 152 152 152 152 ...
## $ estado : chr "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" ...
## $ e.civil. : chr "Soltero" "Union libre" "Matrimonio" "Soltero" ...
# Exportar
colab_final<-climpia2
write.csv(colab_final, file ="colab_final.csv", row.names = FALSE)
bajas_final<-blimpia
write.csv(bajas_final, file ="bajas_final.csv", row.names = FALSE)colab_bd$genero[colab_bd$genero == "FEMENINO"] <- "F"
colab_bd$genero[colab_bd$genero == "MASCULINO"] <- "M"
str(colab_bd)## 'data.frame': 104 obs. of 9 variables:
## $ edad : int 32 38 38 37 38 60 56 46 59 43 ...
## $ genero : chr "F" "M" "F" "M" ...
## $ alta : int 2013 2018 2015 2016 2020 2020 2022 2022 2022 2022 ...
## $ puesto : chr "SUPERVISORA" "MANTENIMIENTO" "COSTURERA" "AYUDANTE GENERAL" ...
## $ salario_diario: num 337 280 260 241 241 ...
## $ lugar.nacim. : chr "" "" "" "" ...
## $ mpio : chr "APODACA" "APODACA" "APODACA" "APODACA" ...
## $ estado : chr "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" ...
## $ civil : chr "Casado" "Soltero" "Casado" "Casado" ...
bajas_bd$genero[bajas_bd$genero == "FEMENINO"] <- "F"
bajas_bd$genero[bajas_bd$genero == "MASCULINO"] <- "M"
str(bajas_bd)## 'data.frame': 233 obs. of 10 variables:
## $ nombre : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ genero : chr "M" "F" "F" "F" ...
## $ alta : chr "09/03/20" "09/11/21" "10/11/21" "10/11/21" ...
## $ motivo_baja : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ duracion : num 628 60 59 59 51 37 37 31 18 224 ...
## $ puesto : chr "DISENO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ salario_diario: num 500 152 152 152 152 ...
## $ estado : chr "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" "Nuevo Leon" ...
## $ e.civil. : chr "Soltero" "Union libre" "Matrimonio" "Soltero" ...
cruzada1<-table(data6$Fecha,data6$PIEZAS.PROG.)
knitr::kable(cruzada1)| 0 | 5 | 10 | 12 | 15 | 20 | 25 | 26 | 28.1845425867508 | 30 | 35 | 40 | 41 | 45 | 50 | 56 | 57 | 60 | 62 | 68 | 69 | 70 | 75 | 80 | 90 | 99 | 100 | 104 | 110 | 120 | 130 | 150 | 160 | 192 | 199 | 200 | 208 | 216 | 240 | 300 | 320 | 400 | 483 | 600 | 800 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2022-01-08 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 1 | 1 | 0 | 4 | 1 | 2 | 1 | 1 | 1 | 2 | 1 | 0 | 1 | 0 | 1 | 11 | 4 | 0 | 0 | 0 | 0 | 5 | 12 | 5 | 22 | 6 | 1 | 1 | 2 | 5 | 11 | 1 | 1 | 3 |
| 2022-02-08 | 1 | 0 | 22 | 0 | 15 | 18 | 15 | 0 | 37 | 2 | 0 | 6 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 2 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-03-08 | 0 | 0 | 18 | 0 | 20 | 9 | 18 | 0 | 28 | 1 | 2 | 6 | 0 | 0 | 3 | 0 | 0 | 3 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-04-08 | 0 | 1 | 7 | 0 | 14 | 11 | 15 | 0 | 20 | 1 | 3 | 3 | 0 | 2 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-05-08 | 4 | 0 | 18 | 0 | 9 | 11 | 9 | 0 | 25 | 4 | 0 | 1 | 0 | 1 | 2 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-05-09 | 0 | 0 | 27 | 0 | 13 | 17 | 24 | 0 | 26 | 2 | 3 | 3 | 0 | 0 | 4 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-06-08 | 0 | 0 | 7 | 0 | 6 | 4 | 13 | 0 | 22 | 0 | 2 | 4 | 0 | 2 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-06-09 | 0 | 0 | 18 | 0 | 19 | 13 | 18 | 0 | 32 | 0 | 6 | 5 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-09 | 0 | 0 | 7 | 0 | 8 | 13 | 12 | 0 | 21 | 1 | 1 | 1 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-15 | 0 | 0 | 8 | 0 | 1 | 11 | 13 | 0 | 15 | 1 | 1 | 1 | 0 | 0 | 4 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-16 | 0 | 0 | 13 | 0 | 4 | 8 | 6 | 0 | 14 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-18 | 0 | 0 | 9 | 0 | 9 | 4 | 13 | 0 | 17 | 1 | 1 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-19 | 0 | 0 | 6 | 0 | 6 | 10 | 15 | 0 | 17 | 2 | 1 | 5 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-20 | 0 | 0 | 22 | 0 | 5 | 12 | 10 | 0 | 16 | 6 | 2 | 1 | 0 | 0 | 3 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-21 | 0 | 0 | 9 | 0 | 8 | 13 | 16 | 0 | 29 | 2 | 1 | 0 | 0 | 0 | 4 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-22 | 0 | 0 | 17 | 0 | 1 | 9 | 15 | 0 | 29 | 0 | 0 | 4 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-23 | 0 | 0 | 8 | 0 | 3 | 7 | 7 | 0 | 17 | 2 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-25 | 0 | 0 | 26 | 0 | 15 | 13 | 19 | 0 | 21 | 4 | 2 | 1 | 0 | 0 | 2 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-26 | 0 | 0 | 11 | 0 | 12 | 18 | 19 | 0 | 25 | 1 | 0 | 5 | 0 | 0 | 6 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-27 | 0 | 0 | 12 | 0 | 11 | 11 | 17 | 0 | 26 | 0 | 3 | 1 | 0 | 0 | 7 | 0 | 0 | 4 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-28 | 0 | 0 | 15 | 0 | 18 | 7 | 24 | 0 | 35 | 0 | 3 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-29 | 0 | 0 | 25 | 0 | 11 | 13 | 14 | 0 | 40 | 0 | 2 | 2 | 0 | 0 | 1 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-07-30 | 0 | 0 | 7 | 0 | 14 | 7 | 5 | 0 | 28 | 1 | 3 | 1 | 0 | 0 | 1 | 0 | 0 | 3 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-08 | 0 | 0 | 0 | 0 | 0 | 6 | 7 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-09 | 0 | 0 | 13 | 0 | 3 | 13 | 18 | 0 | 21 | 0 | 3 | 1 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-13 | 0 | 0 | 14 | 0 | 7 | 10 | 25 | 0 | 23 | 1 | 0 | 2 | 0 | 0 | 1 | 0 | 0 | 4 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-15 | 0 | 0 | 19 | 0 | 17 | 12 | 15 | 0 | 31 | 1 | 1 | 3 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-16 | 2 | 0 | 13 | 0 | 14 | 9 | 20 | 0 | 28 | 2 | 1 | 3 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-17 | 0 | 0 | 17 | 0 | 19 | 9 | 22 | 0 | 33 | 2 | 0 | 2 | 0 | 0 | 1 | 0 | 0 | 4 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-18 | 0 | 0 | 11 | 0 | 10 | 12 | 18 | 0 | 28 | 2 | 3 | 3 | 0 | 0 | 3 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-19 | 0 | 0 | 20 | 0 | 18 | 7 | 26 | 0 | 28 | 1 | 1 | 4 | 0 | 0 | 3 | 0 | 0 | 4 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-20 | 0 | 0 | 12 | 0 | 8 | 7 | 13 | 0 | 25 | 2 | 2 | 2 | 0 | 0 | 4 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-22 | 29 | 0 | 7 | 0 | 14 | 2 | 16 | 0 | 2 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-23 | 0 | 0 | 12 | 0 | 8 | 16 | 14 | 0 | 35 | 2 | 3 | 4 | 0 | 2 | 5 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-24 | 0 | 0 | 8 | 0 | 13 | 13 | 22 | 0 | 33 | 0 | 2 | 1 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-25 | 0 | 0 | 18 | 0 | 11 | 14 | 26 | 0 | 33 | 2 | 1 | 1 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-26 | 0 | 0 | 21 | 0 | 10 | 16 | 16 | 0 | 35 | 2 | 6 | 0 | 0 | 0 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-27 | 0 | 0 | 9 | 0 | 7 | 4 | 18 | 0 | 21 | 0 | 4 | 0 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-29 | 0 | 0 | 23 | 0 | 7 | 14 | 19 | 0 | 26 | 1 | 7 | 5 | 0 | 0 | 6 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-30 | 0 | 0 | 27 | 0 | 8 | 17 | 22 | 0 | 35 | 0 | 2 | 2 | 0 | 0 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-08-31 | 0 | 0 | 23 | 0 | 4 | 14 | 25 | 0 | 38 | 3 | 1 | 1 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-01 | 0 | 0 | 23 | 0 | 12 | 13 | 25 | 0 | 31 | 1 | 2 | 2 | 0 | 0 | 3 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-02 | 0 | 0 | 10 | 0 | 9 | 12 | 23 | 0 | 33 | 8 | 1 | 2 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-03 | 0 | 0 | 22 | 0 | 24 | 13 | 35 | 0 | 56 | 2 | 3 | 3 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-08 | 0 | 0 | 13 | 0 | 12 | 14 | 21 | 0 | 23 | 1 | 6 | 4 | 0 | 0 | 4 | 0 | 0 | 3 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-09 | 0 | 0 | 4 | 0 | 5 | 4 | 13 | 0 | 18 | 0 | 0 | 0 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-13 | 0 | 0 | 12 | 0 | 13 | 12 | 29 | 0 | 36 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-14 | 0 | 0 | 20 | 0 | 14 | 11 | 17 | 0 | 28 | 0 | 3 | 5 | 0 | 0 | 4 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-15 | 0 | 0 | 8 | 0 | 7 | 8 | 13 | 0 | 22 | 0 | 3 | 2 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-16 | 0 | 0 | 7 | 0 | 11 | 3 | 10 | 0 | 13 | 1 | 0 | 2 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-17 | 0 | 0 | 14 | 0 | 14 | 7 | 8 | 0 | 24 | 1 | 0 | 1 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-19 | 0 | 0 | 10 | 0 | 14 | 13 | 22 | 0 | 32 | 2 | 1 | 3 | 0 | 0 | 4 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-09-20 | 0 | 0 | 11 | 0 | 24 | 7 | 17 | 0 | 29 | 1 | 0 | 1 | 0 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-10-08 | 0 | 0 | 15 | 0 | 10 | 16 | 23 | 0 | 24 | 3 | 4 | 8 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-10-09 | 0 | 0 | 19 | 0 | 10 | 9 | 19 | 0 | 29 | 2 | 4 | 4 | 0 | 0 | 2 | 0 | 0 | 2 | 0 | 0 | 0 | 1 | 2 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-11-08 | 0 | 0 | 17 | 0 | 11 | 7 | 26 | 0 | 23 | 1 | 0 | 5 | 0 | 0 | 3 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-12-08 | 0 | 0 | 16 | 0 | 12 | 7 | 23 | 0 | 26 | 3 | 3 | 1 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2022-12-09 | 0 | 0 | 17 | 0 | 12 | 10 | 20 | 0 | 34 | 0 | 2 | 1 | 0 | 0 | 5 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
cruzada2<-table(data6$Laminas.procesadas,data6$TMO..MIN.)
knitr::kable(cruzada2)| 0 | 2 | 4 | 9 | 10 | 10.3026178010471 | 11 | 12 | 15 | 20 | 25 | 30 | 35 | 40 | 45 | 50 | 60 | 65 | 70 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 128 | 0 | 0 | 0 | 100 | 1166 | 124 | 109 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 1 | 1 | 0 | 0 | 0 | 0 | 5 | 3 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2 | 0 | 0 | 0 | 0 | 4 | 7 | 1 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 3 | 1 | 0 | 0 | 0 | 1 | 8 | 5 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 4 | 1 | 0 | 0 | 0 | 0 | 2 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 4.76477187733732 | 60 | 1 | 1 | 0 | 250 | 1947 | 175 | 186 | 4 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
| 8 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 9 | 4 | 0 | 0 | 0 | 6 | 12 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 10 | 3 | 0 | 0 | 1 | 146 | 92 | 75 | 26 | 0 | 2 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
| 11 | 1 | 0 | 0 | 0 | 103 | 71 | 84 | 40 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 12 | 1 | 0 | 0 | 0 | 57 | 71 | 61 | 50 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 13 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
| 14 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 |
| 16 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
| 17 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 19 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
| 20 | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 0 | 1 | 1 | 13 | 0 | 1 | 0 | 2 | 0 | 1 | 0 | 0 |
| 21 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 22 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 23 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 25 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 27 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 32 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 |
| 33 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 |
| 35 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 38 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 40 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 |
| 41 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 44 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 49 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 50 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
| 51 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 53 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 55 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 65 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 69 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 79 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
| 80 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
| 97 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
# install.packages("psych")
library(psych)
describe(data)## vars n mean sd median trimmed mad min max
## Fecha* 1 5300 29.28 17.49 29.0 29.26 23.72 1 58
## No. 2 5274 48.19 29.44 46.0 47.12 35.58 1 121
## CLIENTE* 3 5299 6.98 2.62 7.0 6.98 1.48 1 12
## ID.FORM* 4 5299 143.39 85.45 152.0 142.01 99.33 1 311
## PRODUCTO* 5 5300 218.20 123.08 218.0 221.84 149.74 1 408
## X* 6 5300 124.77 99.35 92.0 117.47 130.47 1 339
## PIEZAS.PROG. 7 3804 28.18 42.61 20.0 20.98 7.41 0 800
## TMO..MIN.* 8 5300 118.29 90.54 131.0 114.21 100.82 1 274
## HR..FIN* 9 5300 84.93 14.28 87.0 86.41 14.83 1 99
## ESTACION.ARRANQUE* 10 5300 128.93 151.44 43.5 107.20 63.01 1 480
## Laminas.procesadas* 11 5300 177.48 247.37 3.0 134.55 2.97 1 754
## INICIO.SEP.UP* 12 5300 171.86 241.80 2.0 128.45 1.48 1 748
## FIN.INICIO.DE.SEP.UP* 13 5300 279.91 301.99 206.0 245.66 303.93 1 886
## INICIO.de.PROCESO* 14 5300 284.75 303.73 223.0 248.79 329.14 1 905
## FIN.de.PROCESO* 15 5300 10.41 14.37 12.0 7.84 0.00 1 109
## TIEMPO.CALIDAD 16 676 3.11 7.41 0.0 1.27 0.00 0 60
## TIEMPO.MATERIALES* 17 5300 1.10 0.68 1.0 1.00 0.00 1 13
## MERMAS.Maquinas. 18 24 2.21 1.10 2.0 2.15 1.48 1 4
## range skew kurtosis se
## Fecha* 57 0.01 -1.28 0.24
## No. 120 0.25 -0.96 0.41
## CLIENTE* 11 0.07 0.22 0.04
## ID.FORM* 310 0.01 -0.90 1.17
## PRODUCTO* 407 -0.17 -1.20 1.69
## X* 338 0.42 -0.99 1.36
## PIEZAS.PROG. 800 9.06 118.00 0.69
## TMO..MIN.* 273 0.01 -1.12 1.24
## HR..FIN* 98 -2.23 9.78 0.20
## ESTACION.ARRANQUE* 479 0.85 -0.65 2.08
## Laminas.procesadas* 753 1.09 -0.32 3.40
## INICIO.SEP.UP* 747 1.12 -0.23 3.32
## FIN.INICIO.DE.SEP.UP* 885 0.63 -1.05 4.15
## INICIO.de.PROCESO* 904 0.61 -1.04 4.17
## FIN.de.PROCESO* 108 3.74 16.10 0.20
## TIEMPO.CALIDAD 60 3.78 17.62 0.28
## TIEMPO.MATERIALES* 12 9.07 97.02 0.01
## MERMAS.Maquinas. 3 0.35 -1.30 0.23
Variables <-c("Cantidad" )
Media <-c("6.70" )
Mediana <-c("2" )
Desviacion_estandar <-c("11.85" )
table1 <- describe(data)
knitr::kable(table1)| vars | n | mean | sd | median | trimmed | mad | min | max | range | skew | kurtosis | se | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Fecha* | 1 | 5300 | 29.284717 | 17.493629 | 29.0 | 29.264623 | 23.7216 | 1 | 58 | 57 | 0.0064672 | -1.2818588 | 0.2402935 |
| No. | 2 | 5274 | 48.189041 | 29.437293 | 46.0 | 47.121090 | 35.5824 | 1 | 121 | 120 | 0.2499196 | -0.9584016 | 0.4053478 |
| CLIENTE* | 3 | 5299 | 6.975090 | 2.617878 | 7.0 | 6.979014 | 1.4826 | 1 | 12 | 11 | 0.0736036 | 0.2211464 | 0.0359627 |
| ID.FORM* | 4 | 5299 | 143.393659 | 85.453129 | 152.0 | 142.013912 | 99.3342 | 1 | 311 | 310 | 0.0098375 | -0.9025308 | 1.1738997 |
| PRODUCTO* | 5 | 5300 | 218.204528 | 123.083001 | 218.0 | 221.840094 | 149.7426 | 1 | 408 | 407 | -0.1680240 | -1.2048808 | 1.6906750 |
| X* | 6 | 5300 | 124.773962 | 99.349535 | 92.0 | 117.475000 | 130.4688 | 1 | 339 | 338 | 0.4240316 | -0.9917658 | 1.3646708 |
| PIEZAS.PROG. | 7 | 3804 | 28.184543 | 42.610363 | 20.0 | 20.978975 | 7.4130 | 0 | 800 | 800 | 9.0626518 | 118.0020228 | 0.6908678 |
| TMO..MIN.* | 8 | 5300 | 118.286793 | 90.535906 | 131.0 | 114.214151 | 100.8168 | 1 | 274 | 273 | 0.0092239 | -1.1219211 | 1.2436063 |
| HR..FIN* | 9 | 5300 | 84.927925 | 14.275750 | 87.0 | 86.411557 | 14.8260 | 1 | 99 | 98 | -2.2309927 | 9.7820520 | 0.1960925 |
| ESTACION.ARRANQUE* | 10 | 5300 | 128.931509 | 151.437504 | 43.5 | 107.197170 | 63.0105 | 1 | 480 | 479 | 0.8514809 | -0.6492739 | 2.0801541 |
| Laminas.procesadas* | 11 | 5300 | 177.477170 | 247.368831 | 3.0 | 134.551179 | 2.9652 | 1 | 754 | 753 | 1.0927667 | -0.3197660 | 3.3978722 |
| INICIO.SEP.UP* | 12 | 5300 | 171.862830 | 241.797486 | 2.0 | 128.451887 | 1.4826 | 1 | 748 | 747 | 1.1205817 | -0.2259700 | 3.3213439 |
| FIN.INICIO.DE.SEP.UP* | 13 | 5300 | 279.906604 | 301.987843 | 206.0 | 245.659670 | 303.9330 | 1 | 886 | 885 | 0.6272972 | -1.0548002 | 4.1481220 |
| INICIO.de.PROCESO* | 14 | 5300 | 284.753585 | 303.733582 | 223.0 | 248.791745 | 329.1372 | 1 | 905 | 904 | 0.6060365 | -1.0362020 | 4.1721016 |
| FIN.de.PROCESO* | 15 | 5300 | 10.405283 | 14.371053 | 12.0 | 7.844104 | 0.0000 | 1 | 109 | 108 | 3.7375855 | 16.1045786 | 0.1974016 |
| TIEMPO.CALIDAD | 16 | 676 | 3.106509 | 7.406737 | 0.0 | 1.265683 | 0.0000 | 0 | 60 | 60 | 3.7767077 | 17.6210730 | 0.2848745 |
| TIEMPO.MATERIALES* | 17 | 5300 | 1.102453 | 0.682923 | 1.0 | 1.000000 | 0.0000 | 1 | 13 | 12 | 9.0669699 | 97.0207719 | 0.0093807 |
| MERMAS.Maquinas. | 18 | 24 | 2.208333 | 1.102533 | 2.0 | 2.150000 | 1.4826 | 1 | 4 | 3 | 0.3515919 | -1.3010627 | 0.2250537 |
# install.packages("psych")
library(psych)
describe(bd_scrap4)## vars n mean sd median trimmed mad min max range skew
## Fecha 1 250 NaN NA NA NaN NA Inf -Inf -Inf NA
## Cantidad 2 250 6.70 11.85 2 3.88 1.48 0 96 96 4.12
## Ubi_origen* 3 250 2.48 0.85 3 2.60 0.00 1 3 2 -1.10
## kurtosis se
## Fecha NA NA
## Cantidad 21.14 0.75
## Ubi_origen* -0.70 0.05
Variables <-c("Cantidad" )
Media <-c("6.70" )
Mediana <-c("2" )
Desviacion_estandar <-c("11.85" )
table1 <-data.frame(Variables, Media , Mediana , Desviacion_estandar)
knitr::kable(table1)| Variables | Media | Mediana | Desviacion_estandar |
|---|---|---|---|
| Cantidad | 6.70 | 2 | 11.85 |
# install.packages("psych")
library(psych)
describe(bd_merma5)## vars n mean sd median trimmed mad min max range skew
## Fecha 1 50 NaN NA NA NaN NA Inf -Inf -Inf NA
## Kilos 2 50 3708.52 1023.99 3925 3798.65 541.15 790 6140 5350 -0.94
## kurtosis se
## Fecha NA NA
## Kilos 1.65 144.81
Variables <-c("Kilos")
Media <-c("3709.52")
Mediana <-c("3925")
Desviacion_estandar <-c("1023.99")table2 <-data.frame(Variables, Media, Mediana, Desviacion_estandar)
knitr::kable(table2)| Variables | Media | Mediana | Desviacion_estandar |
|---|---|---|---|
| Kilos | 3709.52 | 3925 | 1023.99 |
# install.packages("psych")
library(psych)
describe(bd_delivery_perf3)## vars n mean sd median trimmed mad min max range skew
## fecha 1 52 NaN NA NA NaN NA Inf -Inf -Inf NA
## cliente* 2 52 2.50 1.13 2.5 2.50 1.48 1 4.00 3.00 0.00
## delay_performance 3 52 16.07 24.63 0.0 11.88 0.00 0 71.25 71.25 1.15
## kurtosis se
## fecha NA NA
## cliente* -1.42 0.16
## delay_performance -0.33 3.42
Variables <-c("Diferencia Delivery")
Media <-c("16.07")
Mediana <-c("0")
Desviacion_estandar <-c("24.63")table3 <-data.frame(Variables, Media, Mediana, Desviacion_estandar)
knitr::kable(table3)| Variables | Media | Mediana | Desviacion_estandar |
|---|---|---|---|
| Diferencia Delivery | 16.07 | 0 | 24.63 |
mediana <- median(dp1$Pedidos, na.rm = TRUE)
mediana## [1] 0
describe(dp1)## Warning in FUN(newX[, i], ...): no non-missing arguments to min; returning Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to max; returning -Inf
## vars n mean sd median trimmed mad min max range skew
## ID_Fecha 1 228 6.50 3.46 6.5 6.50 4.45 1 12 11 0.00
## Fecha 2 228 NaN NA NA NaN NA Inf -Inf -Inf NA
## CLIENTE* 3 228 10.00 5.49 10.0 10.00 7.41 1 19 18 0.00
## Pedidos 4 228 1703.14 6164.04 0.0 251.26 0.00 0 52779 52779 5.69
## kurtosis se
## ID_Fecha -1.23 0.23
## Fecha NA NA
## CLIENTE* -1.22 0.36
## Pedidos 37.14 408.22
hist(dp1$Pedidos) barplot(prop.table(table(data6$Laminas.procesadas)),col=c("orange"),main="Laminas procesadas",xlab = "Laminas", ylab ="Frecuencias",las=1)library(plyr)
pie(prop.table(table(bd_scrap4$Ubi_origen)),col=c("lightgreen","blue","red"),main="Ubicación de origen",las=1)Con la siguiente función podremos identificar los principales clientes para generar un análisis con la información relevante, pues hay clientes con pocos o sin pedidos por lo que generar un diagnóstico respecto a delivery plan con esos datos no es necesario.
ggplot(dp1, aes(x=reorder(CLIENTE,Pedidos), y=Pedidos)) +
geom_bar(stat="identity")+
coord_flip()Como siguiente paso eliminaremos todos los clientes que no nos interesan para el análisis y dejaremos el top 6 de clientes para el ejercicio.
dp2 <- dp1
dp2<-dp2[dp2$CLIENTE!="ABC QUERETARO",]
dp2<-dp2[dp2$CLIENTE!="ANTOLIN ARTEAGA",]
dp2<-dp2[dp2$CLIENTE!="ANTOLIN TOLUCA",]
dp2<-dp2[dp2$CLIENTE!="ISRI",]
dp2<-dp2[dp2$CLIENTE!="SEGROVE",]
dp2<-dp2[dp2$CLIENTE!="STB 1",]
dp2<-dp2[dp2$CLIENTE!="UFI",]
dp2<-dp2[dp2$CLIENTE!="YF QRO",]
dp2<-dp2[dp2$CLIENTE!="INOAC POLYTEC",]
dp2<-dp2[dp2$CLIENTE!="HANON",]
dp2<-dp2[dp2$CLIENTE!="MERIDIAN",]
dp2<-dp2[dp2$CLIENTE!="YF RAMOS",]
dp2<-dp2[dp2$CLIENTE!="YANFENG sm",] ggplot(dp2,aes(x=Fecha, y=Pedidos,fill=CLIENTE))+
geom_bar(stat="identity")+
geom_hline(yintercept=33,linetype="dashed",color="black")+
labs(x="Fecha",y="Número de pedidos", color="Legend")+
ggtitle("Pedidos por fecha")# as.data.frame(bajas_bd)
# as.data.frame(colab_bd)colab_bd2<-colab_bd %>% dplyr::select(genero,edad,salario_diario) %>% dplyr::group_by(genero) %>%
dplyr::summarise(across(everything(),mean,na.rm=TRUE)) %>% arrange(desc(edad))
ggplot(colab_bd2, aes(x=reorder(genero,edad), y=edad, fill=(salario_diario))) +
geom_bar(stat="identity",col=c("black"))+
coord_flip()+
guides(fill=guide_legend(reverse=FALSE))ggplot(colab_bd, aes(x=genero, y=salario_diario, fill=genero)) +
geom_bar(stat="identity") +
facet_grid(~civil) + scale_fill_brewer(palette = "Set2")bajas_bd2<-bajas_bd %>% dplyr::select(motivo_baja,edad,duracion) %>% group_by(motivo_baja) %>%
dplyr::summarise(across(everything(),mean,na.rm=TRUE)) %>% arrange(desc(edad))
ggplot(bajas_bd2, aes(x=reorder(motivo_baja,edad), y=edad, fill=(duracion))) +
geom_bar(stat="identity",col=c("black"))+
coord_flip()+
guides(fill=guide_legend(reverse=FALSE))ggplot(bajas_bd, aes(x=genero, y=salario_diario, fill=genero)) +
geom_bar(stat="identity") +
facet_grid(~e.civil.) + scale_fill_brewer(palette = "Set2")plot(data6$TMO..MIN., xlab = "Proceso de lamina", ylab = "Tiempo", main = "Tiempo por Lamina" )ggplot(bd_merma5, aes(x= Fecha, y= Kilos)) + geom_bar(stat="identity", fill="red") + scale_fill_grey() + labs(title = "Kilos de merma", x = "Fecha")bd_merma5$Fecha <- as.Date(bd_merma5$Fecha, format = "%d/%m/%Y")
plot(bd_merma5$Fecha, bd_merma5$Kilos, main = "Kilos de merma",
xlab = "Fecha", ylab = "Kilos",
pch = 19, frame = FALSE)hist(bd_scrap4$Cantidad, main = "Cantidad de Material reciclado", xlab = "Cantidad", ylab = "Frecuencia",col = "blue")plot(bd_scrap4$Fecha, bd_scrap4$Cantidad, main = "Cantidad de Scrap por fecha", xlab = "Fecha", ylab = "Cantidad")plot(dp2$Fecha, dp2$Pedidos, main = "Pedidos por fecha",
xlab = "Fecha", ylab = "Pedidos",
pch = 1, frame = FALSE)boxplot(dp2$Pedidos, main = "Pedidos")Después de generar un boxplot de pedidos en general, realizamos un boxplot que nos muestra los pedidos por cliente
dp3 <- dp2
dp3$CLIENTE<-as.factor(dp3$CLIENTE)
ggplot(dp3, aes(x=CLIENTE, y=Pedidos)) +
geom_boxplot(color="red", fill="orange", alpha=0.2)ggplot(bd_delivery_perf3,aes(x=fecha, y=delay_performance,color=cliente))+
geom_line()+
labs(x="Fecha",y="Retraso en Minutos", color="Legend")+
ggtitle("Retrasos en el desempeño por parte del cliente")bd_delivery_perf3<-bd_delivery_perf3[bd_delivery_perf3$cliente!="Magna",]
bd_delivery_perf3<-bd_delivery_perf3[bd_delivery_perf3$cliente!="Varroc",]
ggplot(bd_delivery_perf3,aes(x=fecha, y=delay_performance,fill=cliente))+
geom_bar(stat="identity")+
geom_hline(yintercept=33,linetype="dashed",color="black")+
labs(x="Fecha",y="Retraso en minutos", color="Legend")+
ggtitle("Retrasos en el desempeño por parte del cliente")Nuestro top 3 clientes de producción son STABILUS 1, STABILUS 3 y TRMX.
Traemos un retraso mayor en distribución con el cliente Mahle, arriba del promedio llegando incluso a tiempos de 1 hora con 40 minutos.
Se tienen sobrepedidos (arriba del promedio) y esto puede afectar si no se tienen la capacidad para recibir pedidos de más.
Dentro de RH tenemos más bajas por distintos motivos: en primer lugar esta por Jubilación, en segundo lugar Renuncia voluntaria y en tercer lugar Baja por Faltas.
Se cambian los nombres de las columnas.
names (base) = c("año", "prod_total", "prod_passenger", "prod_veh_comerciales", "ventas_domesticas", "ventas_passenger","ventas_comerciales","desempleo_usa","confianza_cons_usa","salario_hora_min_usa")
names (base)## [1] "año" "prod_total" "prod_passenger"
## [4] "prod_veh_comerciales" "ventas_domesticas" "ventas_passenger"
## [7] "ventas_comerciales" "desempleo_usa" "confianza_cons_usa"
## [10] "salario_hora_min_usa"
str(base)## 'data.frame': 14 obs. of 10 variables:
## $ año : int 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 ...
## $ prod_total : num 10752 8672 5710 7744 8662 ...
## $ prod_passenger : num 3867 3731 2196 2732 2978 ...
## $ prod_veh_comerciales: num 6885 4941 3514 5012 5685 ...
## $ ventas_domesticas : num 12687 10108 7868 9020 10109 ...
## $ ventas_passenger : num 5197 4491 3558 3792 4146 ...
## $ ventas_comerciales : num 7490 5617 4309 5229 5963 ...
## $ desempleo_usa : num 4.62 5.8 9.28 9.61 8.93 8.08 7.36 6.16 5.28 4.88 ...
## $ confianza_cons_usa : num 85.6 63.8 66.3 71.8 67.3 ...
## $ salario_hora_min_usa: num 5.5 6.2 6.9 7.25 7.25 7.25 7.25 7.25 7.25 7.25 ...
En este caso, se escoge como variable dependiente las ventas de los carros passenger, por ello entiéndase los automóviles de uso cotidiano en Estados Unidos. Para esta variable dependiente, se han tomado las siguientes variables independientes, con el fin de notar su efecto en las ventas. Estas son:
Desempleo USA: este índice es calculado anualmente con la formula. (Unemployed ÷ Labor Force) x 100. Entre menor mejor.
Confianza del consumidor de USA: índice que mide, a partir de una encuesta que tan optimistas o pesimistas se encuentran los consumidores sobre su situación financiera. Entre mayor, mejor.
Salario mínimo por hora: se mide en dólares. Está establecido a nivel federal.
Año: los años que se tienen de los datos, 2007-2020.
regresion1 <- lm (ventas_passenger ~ desempleo_usa + confianza_cons_usa + salario_hora_min_usa + año, data=base)
summary (regresion1)##
## Call:
## lm(formula = ventas_passenger ~ desempleo_usa + confianza_cons_usa +
## salario_hora_min_usa + año, data = base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -850.29 -560.86 88.28 446.55 847.47
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 646180.04 197959.50 3.264 0.00977 **
## desempleo_usa -255.04 217.62 -1.172 0.27129
## confianza_cons_usa 46.68 41.57 1.123 0.29062
## salario_hora_min_usa 1394.06 697.08 2.000 0.07657 .
## año -324.65 100.49 -3.231 0.01031 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 712.5 on 9 degrees of freedom
## Multiple R-squared: 0.5831, Adjusted R-squared: 0.3978
## F-statistic: 3.147 on 4 and 9 DF, p-value: 0.0707
Para la tasa de desempleo y el índice de confianza del consumidor, se ha decidido tomar el promedio del 2007 al 2020, para poder predecir. Con el salario mínimo por hora, al ser establecido a nivel federal, se toma en cuenta la última cantidad: $7.25 dólares. Se quieren las predicciones para los siguientes cinco años, a partir del último año con datos (2020).
datos_nuevos1 <- data.frame(desempleo_usa=6.43,confianza_cons_usa=82.3,salario_hora_min_usa=7.25,año=2021:2025)
predict(regresion1,datos_nuevos1)## 1 2 3 4 5
## 2369.905 2045.254 1720.604 1395.954 1071.303
¿Qué observamos?
primer <- plot(predict(regresion1,datos_nuevos1), type = "l", xlab = "Año", ylab ="Ventas Passenger", main="Predicción de Ventas")En esta predicción de ventas de automóviles passenger, observamos que es hacia abajo. Es decir, tomando en cuenta una tasa de desempleo de 6.43, un índice de confianza de 82.3 y el salario mínimo por hora de $7.25, se espera que las ventas de estos automóviles bajen en EUA del 2021 hasta 2025. Igualmente, resulta destacable mencionar que las variables que más impactan en las ventas de automóviles passenger son el año y el salario mínimo.
effect_plot(regresion1,pred=desempleo_usa,interval=TRUE)Si tomamos en cuenta la tasa de desempleo de EUA, y su relación con las ventas de los automóviles passenger, observamos que esta es negativa. Debido a que al crecer la tasa de desempleo, bajan las ventas.
effect_plot(regresion1,pred=confianza_cons_usa,interval=TRUE)
Mientras que el índice de confianza del consumidor de EUA, y su relación
con las ventas de los automóviles passenger, observamos que
esta es positiva. Debido a que al crecer la confianza, incrementan las
ventas.
effect_plot(regresion1,pred=salario_hora_min_usa,interval=TRUE)Igualmente, al subir el salario mínimo por hora, las ventas de los automóviles passenger incrementan.
effect_plot(regresion1,pred=año,interval=TRUE)Con el pasar de los años las ventas han decrecido.
En este caso, se escoge como variable dependiente las ventas de los
carros comerciales, por ello entiéndase los cualquier tipo de
vehículo de motor utilizado para transportar mercancías o pasajeros en
Estados Unidos. Para esta variable dependiente, se han tomado las
siguientes variables independientes, con el fin de notar su efecto en
las ventas. Estas son:
1. Desempleo USA: este índice es calculado anualmente con la formula.
(Unemployed ÷ Labor Force) x 100. Entre menor mejor.
2. Confianza del consumidor de USA: índice que mide, a partir de una
encuesta que tan optimistas o pesimistas se encuentran los consumidores
sobre su situación financiera. Entre mayor, mejor.
3. Salario mínimo por hora: se mide en dólares. Está establecido a nivel
federal.
4. Año: los años que se tienen de los datos, 2007-2020.
regresion2 <- lm (ventas_comerciales ~ desempleo_usa + confianza_cons_usa + salario_hora_min_usa + año, data=base)
summary (regresion2)##
## Call:
## lm(formula = ventas_comerciales ~ desempleo_usa + confianza_cons_usa +
## salario_hora_min_usa + año, data = base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -731.58 -87.12 57.56 160.03 513.82
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -588817.41 97672.75 -6.028 0.000196 ***
## desempleo_usa -147.24 107.37 -1.371 0.203504
## confianza_cons_usa 50.55 20.51 2.464 0.035896 *
## salario_hora_min_usa -839.15 343.94 -2.440 0.037374 *
## año 297.49 49.58 6.000 0.000203 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 351.6 on 9 degrees of freedom
## Multiple R-squared: 0.9732, Adjusted R-squared: 0.9613
## F-statistic: 81.82 on 4 and 9 DF, p-value: 4.516e-07
Para la tasa de desempleo y el índice de confianza del consumidor, se ha decidido tomar el promedio del 2007 al 2020, para poder predecir. Con el salario mínimo por hora, al ser establecido a nivel federal, se toma en cuenta la última cantidad: $7.25 dólares. Se quieren las predicciones para los siguientes cinco años, a partir del último año con datos (2020).
datos_nuevos2 <- data.frame(desempleo_usa=6.43,confianza_cons_usa=82.3,salario_hora_min_usa=7.25,año=2021:2025)
predict(regresion2,datos_nuevos2)## 1 2 3 4 5
## 9547.780 9845.274 10142.768 10440.262 10737.756
¿Qué observamos?
segundo <- plot(predict(regresion2,datos_nuevos2), type = "l", xlab = "Año", ylab ="Ventas Comerciales", main="Predicción de Ventas")En esta predicción de ventas de automóviles comerciales, observamos que es hacia arriba Es decir, tomando en cuenta una tasa de desempleo de 6.43, un índice de confianza de 82.3 y el salario mínimo por hora de $7.25, se espera que las ventas de estos automóviles suban en EUA del 2021 hasta 2025. En el caso de las ventas de automóviles comerciales, notamos que el pasar de los años es la variable que más impacta, siguiendo por el nivel de confianza del consumidor y el salario mínimo por hora; mientras que el que menos afecta es la tasa de desempleo.
effect_plot(regresion2,pred=desempleo_usa,interval=TRUE)Si tomamos en cuenta la tasa de desempleo de EUA, y su relación con las ventas de los automóviles comerciales, observamos que esta es negativa. Debido a que al crecer la tasa de desempleo, bajan las ventas.
effect_plot(regresion2,pred=confianza_cons_usa,interval=TRUE)Mientras que el índice de confianza del consumidor de EUA, y su relación con las ventas de los automóviles comerciales, observamos que esta es positiva. Debido a que al crecer la confianza, incrementan las ventas. A comparación de la gráfica de ventas passenger con el nivel de confianza, observamos que en este caso la pendiente es más pronunciada, por lo que vemos un mayor impacto.
effect_plot(regresion2,pred=salario_hora_min_usa,interval=TRUE)Igualmente, al subir el salario mínimo por hora, las ventas de los automóviles comerciales disminuyen. Este podría ser un tema interesante a investigar.
effect_plot(regresion2,pred=año,interval=TRUE)Con el pasar de los años las ventas han incrementado.
plot(bd_externa$Year,bd_externa$Production_Commercial_Vehicles, type="l",col="blue", lwd=1.5, xlab ="Year",ylab ="Thousands of Units", main = "Annual U.S. Motor Vehicle Sales")
lines(bd_externa$Year,bd_externa$Sales_Commercial_Vehicles,col="red",lty=3)
legend("topleft", legend=c("Domestic Commercial Sales", "Production Commercial Vehicles"),
col=c("blue", "red"), lty = 1:2, cex=0.8)summary(ma_model<-arma(bd_externa$Total_Production,order=c(0,1)))##
## Call:
## arma(x = bd_externa$Total_Production, order = c(0, 1))
##
## Model:
## ARMA(0,1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3425.7 -1313.0 141.6 1100.1 1449.5
##
## Coefficient(s):
## Estimate Std. Error t value Pr(>|t|)
## ma1 6.756e-01 1.610e-01 4.195 2.73e-05 ***
## intercept 1.010e+04 6.096e+02 16.569 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Fit:
## sigma^2 estimated as 2094390, Conditional Sum-of-Squares = 25229390, AIC = 247.5
ma_model_forecast<-forecast(ma_model$fitted,h=3,level=c(95))
ma_model_forecast## Point Forecast Lo 95 Hi 95
## 15 10455.67 8568.350 12342.99
## 16 10455.67 8438.084 12473.26
## 17 10455.67 8315.732 12595.61
plot(data6$Fecha,data6$PIEZAS.PROG., type="l",col="blue", lwd=1.5, xlab ="Fecha",ylab ="Piezas programadas", main = "Piezas programadas por fecha")
lines(data6$Fecha,data6$Laminas.procesadas,col="red",lty=3)
legend("topleft", legend=c("Piezas programadas", "Laminas procesadas"),
col=c("blue", "red"), lty = 1:2, cex=0.8)(ma_model<-arma(data6$PIEZAS.PROG.,order=c(0,1)))##
## Call:
## arma(x = data6$PIEZAS.PROG., order = c(0, 1))
##
## Coefficient(s):
## ma1 intercept
## 0.441 28.180
ma_model_forecast<-forecast(ma_model$fitted,h=3,level=c(95))
ma_model_forecast## Point Forecast Lo 95 Hi 95
## 5301 25.55237 3.086481 48.01827
## 5302 25.41480 2.928867 47.90072
## 5303 25.30473 2.782038 47.82743
# Sumar el Total de KilosxMes
merma <- c(14560,22830,22470,18820,23410,18280,19370,32100,13586)
merma_st <- ts(data = merma, start = c(2022,1), frequency = 12)
merma_st## Jan Feb Mar Apr May Jun Jul Aug Sep
## 2022 14560 22830 22470 18820 23410 18280 19370 32100 13586
modelo <- auto.arima(merma_st)
modelo## Series: merma_st
## ARIMA(0,0,0) with non-zero mean
##
## Coefficients:
## mean
## 20602.889
## s.e. 1736.893
##
## sigma^2 = 30544665: log likelihood = -89.8
## AIC=183.59 AICc=185.59 BIC=183.99
pronostico <- forecast(modelo, level=c(95), h=3)
pronostico## Point Forecast Lo 95 Hi 95
## Oct 2022 20602.89 9770.711 31435.07
## Nov 2022 20602.89 9770.711 31435.07
## Dec 2022 20602.89 9770.711 31435.07
plot(pronostico)Podemos ver que en la industria Automotriz de USA, específicamente en ventas de motores, tenemos una tendencia continua y que nuestros intervalos de confianza ban disminuyendo, pero las predicciones se encuentran entre 8315.732-12595.61 de ventas anuales de motores en USA para los próximos años.
Para Form al desarrollar el pronóstico de Merma vemos que tenemos que para los próximos periodos de octubre, noviembre y diciembre tendremos una cantidad constante de 20602.89 kilos de merma y que nuestro intervalo de confianza cae entre 9770.711 a 31435.07.Interpretando la información vemos que a comparación del último mes de septiembre, los kilos crecerán.
Como podemos observar en la base de datos de Producción, el mayor cliente de Form, en cuestión de laminas procesadas, es Stabilus 1, así se muestra en la grafica de pastel de empresa, mientras que también cuenta con algunos clientes con muy poca producción como es el caso de VL-017-14989.
En la base de datos Scrap, con las graficas que elaboramos, podemos observar que el mayor numero de desecho se origina en el área de la empresa de Pre-Producción, por lo que podemos enforcarnos en proponer estrategias que reduzcan el numero de desecho significativamente en esta área, así como también en el área donde menos hay desecho es en Post-producción.
En el área de recursos humanos podemos interpretar con las graficas que en Form, hay un mayor rango de edad entre las mujeres, así como también podemos observar que las mujeres en promedio ganan más que los hombres.
En cuestión a las bajas, el análisis de la base de datos nos arroja que existe una gran rotación de personal, y la mayoría de ellos no han alcanzado el grado de jubilación, las razones principales de este son abandono y baja por faltas. En base a la grafica de barras explicada en la parte de bajas, se menciona que la mayoría de las personas que abandonan su trabajo son solteras, así como también algunas de ellas no se conoce su estado civil.
En las predicciones de desempeño de la industria automotriz se pudo observar que el automóvil de modelo Passenger se encuentra en decremento, tomando como base los datos de la tasa de desempleo de 6.43 y un índice de confianza de 82.3, se espera que siga el decremento de estos automóviles en EUA del 2021 al 2025. Mientras que en el segundo modelo de regresión con la misma base de datos se espera una predicción de ventas positiva en los automóviles comerciales, tomando en cuenta datos como tasa de desempleo de 6.43, un índice de confianza de 82.3, es incremento se espera del 2021 al 2025.
Business Analytics es un enfoque de análisis de datos dentro de alguna empresa, consiste en llevar a cabo soluciones para satisfacer las necesidades de un negocio, lograr metas y alcanzar los objetivos planteados. BA se compone de obtener datos, analizar y mostrar datos de manera visual, ayuda en tomar decisiones basado en tendencias y lo que está pasando en el mercado en general.
Business Analytics ayuda a alcanzar los objetivos empresariales a partir de un análisis de grandes volúmenes de datos mediante herramientas como los es RStudio, Phyton, entre otros.
BA detecta tendencias conforme al tiempo y puede realizar pronósticos a partir de modelos predictivos.
BA utiliza modelos predictivos para optimizar los procesos de una empresa en cualquier área como producción, logística, recursos humanos entre otros.
Business Intelligence se utiliza para evaluar, optimizar y coordinar las operaciones internas de una empresa, mientras que Business Analytics es obtener datos, analizarlos y mostrarlos. Existe diferencias entres estos dos, la mayor diferencia es en la poractica de utilizar los datos de una empresa para anticipar tendencias y resultados. Business Analytics ayuda en tomar decisiones basado en tendencias y lo que está pasando en el mercado en general.