producciontotal <- read.csv("/Users/mac/Downloads/BD Producción csv.csv")str(producciontotal)## 'data.frame': 5410 obs. of 17 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ No. : chr "1" "2" "3" "4" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ ID.FORM : chr "" "N.A." "CORTE." "ST-026-13892" ...
## $ PRODUCTO : chr "STABOMAT 643920. CAJA IMP. CORTE. AZUL.PC0011. ( 2 Pza/Caja)." "KR55006. CAJA IMP. AZUL. CORTE. ( 1 pieza)." "241B KIT. EXPORT. INSERTO CON INSERTO. CORTE para Troquel." "MOPAR GDE. 754549. CAJA IMP. NEGRA. PC0022. ( PC0043: solo si autoriza Calidad). ( 1 Pieza). CORTE." ...
## $ PIEZAS.PROG. : chr "200" "100" "216" "100" ...
## $ TMO..MIN. : chr "20" "15" "20" "10" ...
## $ HR..FIN : chr "9:20" "9:35" "9:55" "10:05" ...
## $ ESTACION.ARRANQUE : chr "C1" "C1" "C1" "C1" ...
## $ Laminas.procesadas : chr "402" "134" "110" "100" ...
## $ INICIO.SEP.UP : chr "9:05" "10:05" "9:40" "11.2" ...
## $ FIN.INICIO.DE.SEP.UP: chr "9.1" "10:16" "9:43" "11:26" ...
## $ INICIO.de.PROCESO : chr "9:12" "10.17" "9:45" "11:30" ...
## $ FIN.de.PROCESO : chr "10:04" "11:05" "9.57" "11:49" ...
## $ TIEMPO.CALIDAD : chr "1" "1" "1" "1" ...
## $ TIEMPO.MATERIALES : int NA NA NA 7 NA NA NA NA NA NA ...
## $ MERMAS.Maquinas. : chr "" "" "" "" ...
producciontotal <- subset (producciontotal,select = -c(No., ID.FORM , PRODUCTO, HR..FIN , ESTACION.ARRANQUE , INICIO.SEP.UP ,FIN.INICIO.DE.SEP.UP , INICIO.de.PROCESO , TIEMPO.MATERIALES , MERMAS.Maquinas. ))
summary (producciontotal)## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## Length:5410 Length:5410 Length:5410 Length:5410
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## Laminas.procesadas FIN.de.PROCESO TIEMPO.CALIDAD
## Length:5410 Length:5410 Length:5410
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
library(tibble)producciontotal$PIEZAS.PROG. <- substr(producciontotal$PIEZAS.PROG., start = 1, stop = 2)
tibble (producciontotal)## # A tibble: 5,410 × 7
## Fecha CLIENTE PIEZAS.PROG. TMO..MIN. Laminas.procesadas FIN.d…¹ TIEMP…²
## <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 15/07/22 STABILUS 1 20 20 402 10:04 1
## 2 15/07/22 STABILUS 1 10 15 134 11:05 1
## 3 15/07/22 STABILUS 1 21 20 110 9.57 1
## 4 15/07/22 STABILUS 1 10 10 100 11:49 1
## 5 15/07/22 YANFENG 20 10 51 12:31 1
## 6 15/07/22 TRMX 20 20 402 2:00 1
## 7 15/07/22 STABILUS 1 10 10 22 2.44 1
## 8 15/07/22 YANFENG 12 10 13 3:00 1
## 9 15/07/22 YANFENG 32 10 33 2:12 1
## 10 15/07/22 YANFENG 50 60 501/501 10:59 2
## # … with 5,400 more rows, and abbreviated variable names ¹FIN.de.PROCESO,
## # ²TIEMPO.CALIDAD
producciontotal$PIEZAS.PROG. <- as.integer(producciontotal$PIEZAS.PROG.)
str(producciontotal) ## 'data.frame': 5410 obs. of 7 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 10 21 10 20 20 10 12 32 50 ...
## $ TMO..MIN. : chr "20" "15" "20" "10" ...
## $ Laminas.procesadas: chr "402" "134" "110" "100" ...
## $ FIN.de.PROCESO : chr "10:04" "11:05" "9.57" "11:49" ...
## $ TIEMPO.CALIDAD : chr "1" "1" "1" "1" ...
producciontotal$TMO..MIN. <- substr(producciontotal$TMO..MIN., start = 1, stop = 2)
tibble (producciontotal)## # A tibble: 5,410 × 7
## Fecha CLIENTE PIEZAS.PROG. TMO..MIN. Laminas.procesadas FIN.d…¹ TIEMP…²
## <chr> <chr> <int> <chr> <chr> <chr> <chr>
## 1 15/07/22 STABILUS 1 20 20 402 10:04 1
## 2 15/07/22 STABILUS 1 10 15 134 11:05 1
## 3 15/07/22 STABILUS 1 21 20 110 9.57 1
## 4 15/07/22 STABILUS 1 10 10 100 11:49 1
## 5 15/07/22 YANFENG 20 10 51 12:31 1
## 6 15/07/22 TRMX 20 20 402 2:00 1
## 7 15/07/22 STABILUS 1 10 10 22 2.44 1
## 8 15/07/22 YANFENG 12 10 13 3:00 1
## 9 15/07/22 YANFENG 32 10 33 2:12 1
## 10 15/07/22 YANFENG 50 60 501/501 10:59 2
## # … with 5,400 more rows, and abbreviated variable names ¹FIN.de.PROCESO,
## # ²TIEMPO.CALIDAD
producciontotal$TMO..MIN. <- as.integer(producciontotal$TMO..MIN.)
str(producciontotal) ## 'data.frame': 5410 obs. of 7 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 10 21 10 20 20 10 12 32 50 ...
## $ TMO..MIN. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ Laminas.procesadas: chr "402" "134" "110" "100" ...
## $ FIN.de.PROCESO : chr "10:04" "11:05" "9.57" "11:49" ...
## $ TIEMPO.CALIDAD : chr "1" "1" "1" "1" ...
producciontotal$Laminas.procesadas <- substr(producciontotal$Laminas.procesadas, start = 1, stop = 2)
tibble (producciontotal)## # A tibble: 5,410 × 7
## Fecha CLIENTE PIEZAS.PROG. TMO..MIN. Laminas.procesadas FIN.d…¹ TIEMP…²
## <chr> <chr> <int> <int> <chr> <chr> <chr>
## 1 15/07/22 STABILUS 1 20 20 40 10:04 1
## 2 15/07/22 STABILUS 1 10 15 13 11:05 1
## 3 15/07/22 STABILUS 1 21 20 11 9.57 1
## 4 15/07/22 STABILUS 1 10 10 10 11:49 1
## 5 15/07/22 YANFENG 20 10 51 12:31 1
## 6 15/07/22 TRMX 20 20 40 2:00 1
## 7 15/07/22 STABILUS 1 10 10 22 2.44 1
## 8 15/07/22 YANFENG 12 10 13 3:00 1
## 9 15/07/22 YANFENG 32 10 33 2:12 1
## 10 15/07/22 YANFENG 50 60 50 10:59 2
## # … with 5,400 more rows, and abbreviated variable names ¹FIN.de.PROCESO,
## # ²TIEMPO.CALIDAD
producciontotal$Laminas.procesadas <- as.integer(producciontotal$Laminas.procesadas)
str(producciontotal) ## 'data.frame': 5410 obs. of 7 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 10 21 10 20 20 10 12 32 50 ...
## $ TMO..MIN. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ Laminas.procesadas: int 40 13 11 10 51 40 22 13 33 50 ...
## $ FIN.de.PROCESO : chr "10:04" "11:05" "9.57" "11:49" ...
## $ TIEMPO.CALIDAD : chr "1" "1" "1" "1" ...
producciontotal$TIEMPO.CALIDAD <- substr(producciontotal$TIEMPO.CALIDAD, start = 1, stop = 2)
tibble (producciontotal)## # A tibble: 5,410 × 7
## Fecha CLIENTE PIEZAS.PROG. TMO..MIN. Laminas.procesadas FIN.d…¹ TIEMP…²
## <chr> <chr> <int> <int> <int> <chr> <chr>
## 1 15/07/22 STABILUS 1 20 20 40 10:04 1
## 2 15/07/22 STABILUS 1 10 15 13 11:05 1
## 3 15/07/22 STABILUS 1 21 20 11 9.57 1
## 4 15/07/22 STABILUS 1 10 10 10 11:49 1
## 5 15/07/22 YANFENG 20 10 51 12:31 1
## 6 15/07/22 TRMX 20 20 40 2:00 1
## 7 15/07/22 STABILUS 1 10 10 22 2.44 1
## 8 15/07/22 YANFENG 12 10 13 3:00 1
## 9 15/07/22 YANFENG 32 10 33 2:12 1
## 10 15/07/22 YANFENG 50 60 50 10:59 2
## # … with 5,400 more rows, and abbreviated variable names ¹FIN.de.PROCESO,
## # ²TIEMPO.CALIDAD
producciontotal$TIEMPO.CALIDAD <- as.integer(producciontotal$TIEMPO.CALIDAD)
str(producciontotal) ## 'data.frame': 5410 obs. of 7 variables:
## $ Fecha : chr "15/07/22" "15/07/22" "15/07/22" "15/07/22" ...
## $ CLIENTE : chr "STABILUS 1" "STABILUS 1" "STABILUS 1" "STABILUS 1" ...
## $ PIEZAS.PROG. : int 20 10 21 10 20 20 10 12 32 50 ...
## $ TMO..MIN. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ Laminas.procesadas: int 40 13 11 10 51 40 22 13 33 50 ...
## $ FIN.de.PROCESO : chr "10:04" "11:05" "9.57" "11:49" ...
## $ TIEMPO.CALIDAD : int 1 1 1 1 1 1 1 1 1 2 ...
producciontotal$Fecha <- as.Date(producciontotal$Fecha, format = "%d/%m/%Y")
tibble(producciontotal)## # A tibble: 5,410 × 7
## Fecha CLIENTE PIEZAS.PROG. TMO..MIN. Laminas.proces…¹ FIN.d…² TIEMP…³
## <date> <chr> <int> <int> <int> <chr> <int>
## 1 0022-07-15 STABILUS 1 20 20 40 10:04 1
## 2 0022-07-15 STABILUS 1 10 15 13 11:05 1
## 3 0022-07-15 STABILUS 1 21 20 11 9.57 1
## 4 0022-07-15 STABILUS 1 10 10 10 11:49 1
## 5 0022-07-15 YANFENG 20 10 51 12:31 1
## 6 0022-07-15 TRMX 20 20 40 2:00 1
## 7 0022-07-15 STABILUS 1 10 10 22 2.44 1
## 8 0022-07-15 YANFENG 12 10 13 3:00 1
## 9 0022-07-15 YANFENG 32 10 33 2:12 1
## 10 0022-07-15 YANFENG 50 60 50 10:59 2
## # … with 5,400 more rows, and abbreviated variable names ¹Laminas.procesadas,
## # ²FIN.de.PROCESO, ³TIEMPO.CALIDAD
producciontotal$CLIENTE<-as.factor(producciontotal$CLIENTE)
str(producciontotal)## 'data.frame': 5410 obs. of 7 variables:
## $ Fecha : Date, format: "0022-07-15" "0022-07-15" ...
## $ CLIENTE : Factor w/ 12 levels "","DENSO","HANON SYSTEMS",..: 6 6 6 6 12 8 6 12 12 12 ...
## $ PIEZAS.PROG. : int 20 10 21 10 20 20 10 12 32 50 ...
## $ TMO..MIN. : int 20 15 20 10 10 20 10 10 10 60 ...
## $ Laminas.procesadas: int 40 13 11 10 51 40 22 13 33 50 ...
## $ FIN.de.PROCESO : chr "10:04" "11:05" "9.57" "11:49" ...
## $ TIEMPO.CALIDAD : int 1 1 1 1 1 1 1 1 1 2 ...
sum(is.na(producciontotal))## [1] 4283
¿Cuántos NA tengo por variable?
sapply(producciontotal, function(x) sum (is.na(x)))## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## 0 1 117 1528
## Laminas.procesadas FIN.de.PROCESO TIEMPO.CALIDAD
## 1227 0 1410
Instalar paquetes y librerias necesarias
# install.packages("dplyr")
library(dplyr)producciontotal<-producciontotal %>% mutate(PIEZAS.PROG.=ifelse(is.na(PIEZAS.PROG.),median(PIEZAS.PROG.,na.rm=T),PIEZAS.PROG.))
producciontotal<-producciontotal %>% mutate(TMO..MIN.=ifelse(is.na(TMO..MIN.),median(TMO..MIN.,na.rm=T),TMO..MIN.))
producciontotal<-producciontotal %>% mutate(laminas_procesadas=ifelse(is.na(Laminas.procesadas),median(Laminas.procesadas,na.rm=T),Laminas.procesadas))
producciontotal<-producciontotal %>% mutate(TIEMPO.CALIDAD=ifelse(is.na(TIEMPO.CALIDAD),median(TIEMPO.CALIDAD,na.rm=T),TIEMPO.CALIDAD))sum(is.na(producciontotal))## [1] 1228
sapply(producciontotal, function(x) sum (is.na(x)))## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## 0 1 0 0
## Laminas.procesadas FIN.de.PROCESO TIEMPO.CALIDAD laminas_procesadas
## 1227 0 0 0
producciontotal <- na.omit(producciontotal)
summary(producciontotal) ## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## Min. :0022-07-15 STABILUS 1:1354 Min. : 1.0 Min. : 0
## 1st Qu.:0022-08-03 TRMX : 704 1st Qu.:14.0 1st Qu.:15
## Median :0022-08-19 STABILUS 3: 642 Median :20.0 Median :20
## Mean :0022-08-19 YANFENG : 506 Mean :27.8 Mean :22
## 3rd Qu.:0022-09-05 DENSO : 414 3rd Qu.:40.0 3rd Qu.:25
## Max. :0022-09-21 VARROC : 315 Max. :99.0 Max. :90
## (Other) : 247
## Laminas.procesadas FIN.de.PROCESO TIEMPO.CALIDAD laminas_procesadas
## Min. : 0.00 Length:4182 Min. : 0.0000 Min. : 0.00
## 1st Qu.: 0.00 Class :character 1st Qu.: 1.0000 1st Qu.: 0.00
## Median :20.00 Mode :character Median : 1.0000 Median :20.00
## Mean :21.87 Mean : 0.9173 Mean :21.87
## 3rd Qu.:33.00 3rd Qu.: 1.0000 3rd Qu.:33.00
## Max. :98.00 Max. :25.0000 Max. :98.00
##
sum(is.na(producciontotal))## [1] 0
write.csv(producciontotal,"producciontotal.csv", row.names=FALSE)summary (producciontotal)## Fecha CLIENTE PIEZAS.PROG. TMO..MIN.
## Min. :0022-07-15 STABILUS 1:1354 Min. : 1.0 Min. : 0
## 1st Qu.:0022-08-03 TRMX : 704 1st Qu.:14.0 1st Qu.:15
## Median :0022-08-19 STABILUS 3: 642 Median :20.0 Median :20
## Mean :0022-08-19 YANFENG : 506 Mean :27.8 Mean :22
## 3rd Qu.:0022-09-05 DENSO : 414 3rd Qu.:40.0 3rd Qu.:25
## Max. :0022-09-21 VARROC : 315 Max. :99.0 Max. :90
## (Other) : 247
## Laminas.procesadas FIN.de.PROCESO TIEMPO.CALIDAD laminas_procesadas
## Min. : 0.00 Length:4182 Min. : 0.0000 Min. : 0.00
## 1st Qu.: 0.00 Class :character 1st Qu.: 1.0000 1st Qu.: 0.00
## Median :20.00 Mode :character Median : 1.0000 Median :20.00
## Mean :21.87 Mean : 0.9173 Mean :21.87
## 3rd Qu.:33.00 3rd Qu.: 1.0000 3rd Qu.:33.00
## Max. :98.00 Max. :25.0000 Max. :98.00
##
library (psych)
describe(producciontotal$PIEZAS.PROG.)## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 4182 27.8 19.25 20 24.61 14.83 1 99 98 1.49 2.04 0.3
describe(producciontotal$TMO..MIN.)## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 4182 22 11.75 20 20.02 7.41 0 90 90 2.17 6.79 0.18
describe(producciontotal$Laminas.procesadas)## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 4182 21.87 21.82 20 18.73 28.17 0 98 98 1.11 0.76 0.34
describe(producciontotal$TIEMPO.CALIDAD)## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 4182 0.92 1.16 1 0.84 0 0 25 25 9.07 125.95 0.02
producciontotal2<-producciontotal %>% select(CLIENTE,PIEZAS.PROG.,TIEMPO.CALIDAD) %>% group_by(CLIENTE) %>% summarise(across(everything(),mean,na.rm=TRUE)) %>% arrange(desc(PIEZAS.PROG.))producciontotal3<- producciontotal2[-c(10),]library (ggplot2)
ggplot(producciontotal3, aes(x=reorder(CLIENTE,PIEZAS.PROG.), y=PIEZAS.PROG., fill=(TIEMPO.CALIDAD))) +
geom_bar(stat="identity")+
coord_flip()+
guides(fill=guide_legend(reverse=FALSE))producciontotal4<-producciontotal3 %>% select(CLIENTE,PIEZAS.PROG.) %>% group_by(CLIENTE) %>% summarise(PIEZAS.PROG.=sum(PIEZAS.PROG.)) %>% arrange(desc(PIEZAS.PROG.))
ggplot(producciontotal4, aes(x=reorder(CLIENTE,PIEZAS.PROG.), y=PIEZAS.PROG.)) +
geom_bar(stat="identity")+
coord_flip()En los gráficos anteriores podemos observar como el cliente que más piezas programadas tiene, “YANFENG” se le dedica un tiempo de calidad de 1.1 minuto, siendo casi el tiempo mínimo de dedicación. Mientras que el cliente VL-017-1486 es el cliente el cual tiene casi la mitad de piezas programadas que YANFENG sin embargo al que más tiempo se le dedica. Por lo que se puede inferir que sus piezas pudieran ser de mucho márgen de error.
externa <- read.csv("/Users/mac/Downloads/us_motor_production_and_domestic_sales (1).csv")
summary(externa)## Year Total_Production Production_Passenger_Cars
## Min. :2007 Min. : 5710 Min. :1924
## 1st Qu.:2010 1st Qu.: 8709 1st Qu.:2745
## Median :2014 Median :10823 Median :3382
## Mean :2014 Mean :10077 Mean :3326
## 3rd Qu.:2017 3rd Qu.:11268 3rd Qu.:4061
## Max. :2020 Max. :12179 Max. :4369
## NA's :8 NA's :8 NA's :8
## Production_Commercial_Vehicles Domestic_Sales Sales_Passenger_Cars
## Min. :3514 Min. : 7868 Min. :2560
## 1st Qu.:5820 1st Qu.:10474 1st Qu.:3865
## Median :6891 Median :12583 Median :4542
## Mean :6751 Mean :11996 Mean :4491
## 3rd Qu.:8095 3rd Qu.:13669 3rd Qu.:5184
## Max. :8512 Max. :14128 Max. :5610
## NA's :8 NA's :8 NA's :8
## Sales_Commercial_Vehicles US_Unemployment US_Consumer_Confidence
## Min. : 4309 Min. :3.680 Min. :63.75
## 1st Qu.: 6088 1st Qu.:4.685 1st Qu.:73.02
## Median : 7634 Median :5.980 Median :82.83
## Mean : 7505 Mean :6.430 Mean :82.29
## 3rd Qu.: 8964 3rd Qu.:8.088 3rd Qu.:92.67
## Max. :10133 Max. :9.610 Max. :98.37
## NA's :8 NA's :8 NA's :8
## US_Min_Hour_Wage
## Min. :5.500
## 1st Qu.:7.250
## Median :7.250
## Mean :7.025
## 3rd Qu.:7.250
## Max. :7.250
## NA's :8
library(jtools)
library(lmtest)
library(car)
library(olsrr) regresion <- lm(Production_Commercial_Vehicles ~ US_Unemployment + US_Consumer_Confidence + US_Min_Hour_Wage , data=externa)
summary(regresion)##
## Call:
## lm(formula = Production_Commercial_Vehicles ~ US_Unemployment +
## US_Consumer_Confidence + US_Min_Hour_Wage, data = externa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1198.1 -257.4 109.0 286.7 623.0
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2217.25 2387.79 -0.929 0.3750
## US_Unemployment -226.91 159.03 -1.427 0.1841
## US_Consumer_Confidence 82.82 28.06 2.952 0.0145 *
## US_Min_Hour_Wage 514.11 387.30 1.327 0.2139
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 525.3 on 10 degrees of freedom
## (8 observations deleted due to missingness)
## Multiple R-squared: 0.9082, Adjusted R-squared: 0.8807
## F-statistic: 32.99 on 3 and 10 DF, p-value: 1.692e-05
Analizar el comportamiento de las variables independientes en la regresión
effect_plot(regresion,pred=US_Consumer_Confidence,interval=TRUE)effect_plot(regresion,pred=US_Unemployment,interval=TRUE)effect_plot(regresion,pred=US_Min_Hour_Wage,interval=TRUE)Siendo la Producción de Autos Comerciales mi variable dependiente, vemos como el salario, la confianza del consumidor y el desempleo generan cambios en ella. Es decir, podemos ver que la que mayor impacto tiene es la confianza del consumidor debido a que valor p esta abajo del 10%, e incluso podemos ver su comportamiento en la gráfica como si la producción sube, la confianza del consumidor sube de igual manera.
regresion2 <- lm(Production_Passenger_Cars ~ US_Unemployment + US_Consumer_Confidence + US_Min_Hour_Wage , data=externa)
summary(regresion2)##
## Call:
## lm(formula = Production_Passenger_Cars ~ US_Unemployment + US_Consumer_Confidence +
## US_Min_Hour_Wage, data = externa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1096.8 -600.5 -162.9 763.0 1154.1
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6399.886 4071.397 1.572 0.147
## US_Unemployment -194.101 271.160 -0.716 0.490
## US_Consumer_Confidence -22.272 47.840 -0.466 0.652
## US_Min_Hour_Wage 1.058 660.387 0.002 0.999
##
## Residual standard error: 895.7 on 10 degrees of freedom
## (8 observations deleted due to missingness)
## Multiple R-squared: 0.09057, Adjusted R-squared: -0.1823
## F-statistic: 0.3319 on 3 and 10 DF, p-value: 0.8026
Analizar el comportamiento de las variables independientes en la regresión
effect_plot(regresion2,pred=US_Consumer_Confidence,interval=TRUE)effect_plot(regresion2,pred=US_Unemployment,interval=TRUE)effect_plot(regresion2,pred=US_Min_Hour_Wage,interval=TRUE)A diferencia de la primera variable dependiente, vemos como la producción de autos de pasajero tiene estimados negativos en las variables independientes del desempleo y confianza del consumidor por lo tanto su comportamiento en las gráficas a pesar de que exista una producción alta su tendencia va para abajo.
#file.choose()
RhColab<-read.csv("/Users/mac/Downloads/BaseDatosL RH_Colaboradores.csv")
RhBajas<-read.csv("/Users/mac/Downloads/BaseD_Limpia RH_ Bajas .csv")variable<-c("numero_de_empleado","nombre_completo", "edad", "genero", "fecha_de_alta", "antioguedad", "BAJA", "puesto", "departamento", "mano_de_obra", "salario_diario", "colonia", "municipio")
type<-c("Cualitativo (nominal)","Cualitativo (nominal)", "Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(discreta)", "cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cuantitativo (continua)", "Cualitativo (nominal)", "Cualitativo (nominal)")
Escala_de_Medición<-c("Numero", "Fecha", "Departamento", "Salario", "Estado")
table<-data.frame(variable,type)
knitr::kable(table)| variable | type |
|---|---|
| numero_de_empleado | Cualitativo (nominal) |
| nombre_completo | Cualitativo (nominal) |
| edad | Cuantitativo(discreta) |
| genero | Cualitativo (nominal) |
| fecha_de_alta | Cuantitativo(discreta) |
| antioguedad | cualitativo (nominal) |
| BAJA | Cualitativo (nominal) |
| puesto | Cualitativo (nominal) |
| departamento | Cualitativo (nominal) |
| mano_de_obra | Cualitativo (nominal) |
| salario_diario | Cuantitativo (continua) |
| colonia | Cualitativo (nominal) |
| municipio | Cualitativo (nominal) |
variable<-c ("nombre","edad", "genero", "fecha_alta", "motivo_baja", "dias_de_trabajo", "baja", "puesto_que_desempeña", "salario_imss", "colonia", "municipio", "estado", "estado_civil" )
type<-c ("Cualitativo (nominal)","Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(discreta)", "Cuantitativo(discreta)", "Cualitativo (nominal)", "Cuantitativo(Continua)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)", "Cualitativo (nominal)" )
Escala_de_Medición<-c("Numero", "Fecha", "Departamento", "Salario", "Estado")
table<-data.frame(variable,type)
knitr::kable(table)| variable | type |
|---|---|
| nombre | Cualitativo (nominal) |
| edad | Cuantitativo(discreta) |
| genero | Cualitativo (nominal) |
| fecha_alta | Cuantitativo(discreta) |
| motivo_baja | Cualitativo (nominal) |
| dias_de_trabajo | Cuantitativo(discreta) |
| baja | Cuantitativo(discreta) |
| puesto_que_desempeña | Cualitativo (nominal) |
| salario_imss | Cuantitativo(Continua) |
| colonia | Cualitativo (nominal) |
| municipio | Cualitativo (nominal) |
| estado | Cualitativo (nominal) |
| estado_civil | Cualitativo (nominal) |
#library(foreign)
library(dplyr) # data manipulation
#library(forcats) # to work with categorical variables
#library(ggplot2) # data visualization
#library(janitor) # data exploration and cleaning
#library(Hmisc) # several useful functions for data analysis
#library(psych) # functions for multivariate analysis
#library(naniar) # summaries and visualization of missing values NAs
#library(dlookr) # summaries and visualization of missing values NAs
#library(corrplot) # correlation plots
#library(jtools) # presentation of regression analysis
#library(lmtest) # diagnostic checks - linear regression analysis
#library(car) # diagnostic checks - linear regression analysis
#library(olsrr) # diagnostic checks - linear regression analysis
#library(kableExtra) # HTML table attributesstr(RhColab)## 'data.frame': 999 obs. of 13 variables:
## $ numero_de_empleado: int 1 2 3 4 5 6 7 8 9 10 ...
## $ nombre_completo : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ edad : int 67 43 73 32 57 38 55 26 27 37 ...
## $ genero : chr "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" ...
## $ fecha_de_alta : chr "1/7/2010" "1/7/2011" "22/11/2011" "30/1/2013" ...
## $ antiguedad : int 12 11 11 9 8 8 7 6 5 5 ...
## $ BAJA : int NA NA NA NA NA NA NA NA NA NA ...
## $ puesto : chr "Supervisor de Máquin" "Supervisor de pegado" "Externo" "SUPERVISORA" ...
## $ departamento : chr "Produccion Cartón MDL" "Produccion Cartón MDL" "Externo" "Produccion Cartón MC" ...
## $ mano_de_obra : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ salario_diario : num 177 177 177 337 441 ...
## $ colonia : chr "UNIDAD LABORAL" "SANTA TERESITA" "VILLAS DE HUINALA" "PUEBLO NUEVO" ...
## $ municipio : chr "SAN NICOLAS DE LOS G" "APODACA" "APODACA" "APODACA" ...
str(RhBajas)## 'data.frame': 237 obs. of 13 variables:
## $ nombre : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ genero : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ fecha_de_alta : chr "9/3/2020" "9/11/2021" "10/11/2021" "10/11/2021" ...
## $ motivo_de_baja : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ dias_de_trabajo : int 628 60 59 59 51 37 37 31 18 224 ...
## $ baja : chr "27/11/2021" "8/1/2022" "8/1/2022" "8/1/2022" ...
## $ puesto_que_desempeña: chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ salario_imss : num 500 152 152 152 152 ...
## $ colonia : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ municipio : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ estado_civil : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
RhColab1<-RhColab
RhBajas1<-RhBajas RhColab1<-RhColab %>% select(-one_of('numero_de_empleado','Fecha_alta' , 'BAJA', 'edad'))
# lets rename the selected columns / variables
summary(RhColab1)## nombre_completo genero fecha_de_alta antiguedad
## Length:999 Length:999 Length:999 Min. : 0.000
## Class :character Class :character Class :character 1st Qu.: 0.000
## Mode :character Mode :character Mode :character Median : 0.000
## Mean : 1.425
## 3rd Qu.: 2.000
## Max. :12.000
## NA's :886
## puesto departamento mano_de_obra salario_diario
## Length:999 Length:999 Length:999 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## NA's :886
## colonia municipio
## Length:999 Length:999
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
names(RhColab1)<-c('Nom_Comp', 'Gen', 'Fecha_alta', 'Ant', 'Puesto', 'Dep', 'MDO', 'Sal_Diario', 'Col', 'Mun')
names(RhBajas1)<-c('Nom', 'Edad', 'Gen', 'Fecha_alta', 'MB', 'Días_trab', 'Baja', 'PuestDes', 'Sal_IMSS', 'Col','Mun', 'Estado', 'EstCiv')
##lets convert fecha_nacimiento to date format
RhColab1$Fecha_alta<-as.Date(RhColab$fecha_de_alta, format = "%d/%m/%Y")
RhBajas1$Fecha_alta<-as.Date(RhBajas1$Fecha_alta, format = "%d/%m/%Y")
RhBajas1$Baja<-as.Date(RhBajas1$Baja, format = "%d/%m/%Y")
str(RhColab1)## 'data.frame': 999 obs. of 10 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : chr "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : chr "Supervisor de Máquin" "Supervisor de pegado" "Externo" "SUPERVISORA" ...
## $ Dep : chr "Produccion Cartón MDL" "Produccion Cartón MDL" "Externo" "Produccion Cartón MC" ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : chr "UNIDAD LABORAL" "SANTA TERESITA" "VILLAS DE HUINALA" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "APODACA" "APODACA" "APODACA" ...
str(RhBajas1)## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ Días_trab : int 628 60 59 59 51 37 37 31 18 224 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ Estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ EstCiv : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
# Eliminar NA's y sustituir con 0's
sum(is.na(RhColab1))## [1] 2658
sum(is.na(RhBajas1))## [1] 0
summary(RhColab1)## Nom_Comp Gen Fecha_alta Ant
## Length:999 Length:999 Min. :2010-07-01 Min. : 0.000
## Class :character Class :character 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
## NA's :886 NA's :886
## Puesto Dep MDO Sal_Diario
## Length:999 Length:999 Length:999 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## NA's :886
## Col Mun
## Length:999 Length:999
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
summary(RhBajas1)## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Min. :2016-10-12
## Class :character 1st Qu.:23.00 Class :character 1st Qu.:2022-01-19
## Mode :character Median :29.00 Mode :character Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Min. :2021-11-27 Length:237
## Class :character 1st Qu.: 9.00 1st Qu.:2022-03-01 Class :character
## Mode :character Median : 21.00 Median :2022-05-06 Mode :character
## Mean : 83.42 Mean :2022-05-05
## 3rd Qu.: 49.00 3rd Qu.:2022-07-07
## Max. :1966.00 Max. :2022-08-25
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
RhColab1 <- na.omit(RhColab1)
RhBajas1 <- na.omit(RhBajas1)
summary(RhColab1)## Nom_Comp Gen Fecha_alta Ant
## Length:113 Length:113 Min. :2010-07-01 Min. : 0.000
## Class :character Class :character 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
## Puesto Dep MDO Sal_Diario
## Length:113 Length:113 Length:113 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## Col Mun
## Length:113 Length:113
## Class :character Class :character
## Mode :character Mode :character
##
##
##
summary(RhBajas1) ## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Min. :2016-10-12
## Class :character 1st Qu.:23.00 Class :character 1st Qu.:2022-01-19
## Mode :character Median :29.00 Mode :character Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Min. :2021-11-27 Length:237
## Class :character 1st Qu.: 9.00 1st Qu.:2022-03-01 Class :character
## Mode :character Median : 21.00 Median :2022-05-06 Mode :character
## Mean : 83.42 Mean :2022-05-05
## 3rd Qu.: 49.00 3rd Qu.:2022-07-07
## Max. :1966.00 Max. :2022-08-25
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
str(RhColab1)## 'data.frame': 113 obs. of 10 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : chr "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : chr "Supervisor de Máquin" "Supervisor de pegado" "Externo" "SUPERVISORA" ...
## $ Dep : chr "Produccion Cartón MDL" "Produccion Cartón MDL" "Externo" "Produccion Cartón MC" ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : chr "UNIDAD LABORAL" "SANTA TERESITA" "VILLAS DE HUINALA" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "APODACA" "APODACA" "APODACA" ...
## - attr(*, "na.action")= 'omit' Named int [1:886] 114 115 116 117 118 119 120 121 122 123 ...
## ..- attr(*, "names")= chr [1:886] "114" "115" "116" "117" ...
str(RhBajas1)## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ Días_trab : int 628 60 59 59 51 37 37 31 18 224 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ Estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ EstCiv : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
sum(is.na(RhColab1))## [1] 0
sum(is.na(RhBajas1))## [1] 0
summary(RhColab1)## Nom_Comp Gen Fecha_alta Ant
## Length:113 Length:113 Min. :2010-07-01 Min. : 0.000
## Class :character Class :character 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
## Puesto Dep MDO Sal_Diario
## Length:113 Length:113 Length:113 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## Col Mun
## Length:113 Length:113
## Class :character Class :character
## Mode :character Mode :character
##
##
##
summary(RhBajas1)## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Min. :2016-10-12
## Class :character 1st Qu.:23.00 Class :character 1st Qu.:2022-01-19
## Mode :character Median :29.00 Mode :character Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Min. :2021-11-27 Length:237
## Class :character 1st Qu.: 9.00 1st Qu.:2022-03-01 Class :character
## Mode :character Median : 21.00 Median :2022-05-06 Mode :character
## Mean : 83.42 Mean :2022-05-05
## 3rd Qu.: 49.00 3rd Qu.:2022-07-07
## Max. :1966.00 Max. :2022-08-25
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
RhColab1 <- na.omit(RhColab1)
RhBajas1 <- na.omit(RhBajas1)
summary(RhColab1)## Nom_Comp Gen Fecha_alta Ant
## Length:113 Length:113 Min. :2010-07-01 Min. : 0.000
## Class :character Class :character 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
## Puesto Dep MDO Sal_Diario
## Length:113 Length:113 Length:113 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:176.7
## Mode :character Mode :character Mode :character Median :180.7
## Mean :181.4
## 3rd Qu.:180.7
## Max. :441.4
## Col Mun
## Length:113 Length:113
## Class :character Class :character
## Mode :character Mode :character
##
##
##
summary(RhBajas1) ## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Min. :2016-10-12
## Class :character 1st Qu.:23.00 Class :character 1st Qu.:2022-01-19
## Mode :character Median :29.00 Mode :character Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Min. :2021-11-27 Length:237
## Class :character 1st Qu.: 9.00 1st Qu.:2022-03-01 Class :character
## Mode :character Median : 21.00 Median :2022-05-06 Mode :character
## Mean : 83.42 Mean :2022-05-05
## 3rd Qu.: 49.00 3rd Qu.:2022-07-07
## Max. :1966.00 Max. :2022-08-25
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
str(RhColab1)## 'data.frame': 113 obs. of 10 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : chr "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : chr "Supervisor de Máquin" "Supervisor de pegado" "Externo" "SUPERVISORA" ...
## $ Dep : chr "Produccion Cartón MDL" "Produccion Cartón MDL" "Externo" "Produccion Cartón MC" ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : chr "UNIDAD LABORAL" "SANTA TERESITA" "VILLAS DE HUINALA" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "APODACA" "APODACA" "APODACA" ...
## - attr(*, "na.action")= 'omit' Named int [1:886] 114 115 116 117 118 119 120 121 122 123 ...
## ..- attr(*, "names")= chr [1:886] "114" "115" "116" "117" ...
str(RhBajas1)## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ Días_trab : int 628 60 59 59 51 37 37 31 18 224 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ Estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ EstCiv : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
library(lubridate)##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
edad<-trunc((RhColab1$Fecha_alta %--% RhColab1$Fecha_alta) / years(1)) # %--% creates a time interval based on as.date() format
RhColab1$edad<-edad
edad<-trunc((RhBajas1$Fecha_alta %--% RhBajas1$Fecha_alta) / years(1))
edad<-trunc((RhBajas1$Baja %--% RhBajas1$Baja) / years(1))### Colab1
RhColab1$Gen<-as.factor(RhColab1$Gen)
RhColab1$Puesto<-as.factor(RhColab1$Puesto)
RhColab1$Dep<-as.factor(RhColab1$Dep)
RhColab1$Mun<-as.factor(RhColab1$Mun)
RhColab1$Col<-as.factor(RhColab1$Col)
### Bajas1
RhBajas1$Gen<-as.factor(RhBajas1$Gen)
RhBajas1$MB<-as.factor(RhBajas1$MB)
RhBajas1$Días_trab<-as.factor(RhBajas1$Días_trab)
RhBajas1$PuestDes<-as.factor(RhBajas1$PuestDes)
RhBajas1$Col<-as.factor(RhBajas1$Col)
RhBajas1$Mun<-as.factor(RhBajas1$Mun)
RhBajas1$Estado<-as.factor(RhBajas1$Estado)
RhBajas1$EstCiv<-as.factor(RhBajas1$EstCiv)str(RhColab1)## 'data.frame': 113 obs. of 11 variables:
## $ Nom_Comp : chr "NICOLAS MARTINEZ DE LOERA" "MARIANA DE LEON MORENO" "JOSE LUIS HERNANDEZ CERVANTES" "MARIA CAZARES MORALES" ...
## $ Gen : Factor w/ 2 levels "FEMENINO","MASCULINO": 2 1 2 1 1 2 1 2 2 1 ...
## $ Fecha_alta: Date, format: "2010-07-01" "2011-07-01" ...
## $ Ant : int 12 11 11 9 8 8 7 6 5 5 ...
## $ Puesto : Factor w/ 29 levels "AY. GENERAL",..: 27 28 10 29 29 8 7 4 3 7 ...
## $ Dep : Factor w/ 22 levels "","Ay.flexo",..: 18 18 13 17 8 4 8 19 4 10 ...
## $ MDO : chr "Indirecto" "Indirecto" "Indirecto" "Indirecto" ...
## $ Sal_Diario: num 177 177 177 337 441 ...
## $ Col : Factor w/ 73 levels "ALAMOS DEL PARQUE",..: 64 61 69 51 56 18 1 52 14 5 ...
## $ Mun : Factor w/ 9 levels "APODACA","CAÑADA BLANCA",..: 9 1 1 1 1 8 1 1 8 9 ...
## $ edad : num 0 0 0 0 0 0 0 0 0 0 ...
## - attr(*, "na.action")= 'omit' Named int [1:886] 114 115 116 117 118 119 120 121 122 123 ...
## ..- attr(*, "names")= chr [1:886] "114" "115" "116" "117" ...
summary(RhColab1)## Nom_Comp Gen Fecha_alta Ant
## Length:113 FEMENINO :61 Min. :2010-07-01 Min. : 0.000
## Class :character MASCULINO:52 1st Qu.:2020-08-28 1st Qu.: 0.000
## Mode :character Median :2022-02-23 Median : 0.000
## Mean :2021-01-16 Mean : 1.425
## 3rd Qu.:2022-07-05 3rd Qu.: 2.000
## Max. :2022-08-23 Max. :12.000
##
## Puesto Dep MDO
## AYUDANTE GENERAL:59 :40 Length:113
## COSTURERA :10 Producción Retorn :10 Class :character
## AY. GENERAL : 7 Costura : 7 Mode :character
## SOLDADOR : 5 Produccion Cartón MDL: 7
## CHOFER : 4 Stabilus : 7
## RESIDENTE : 4 Cedis : 6
## (Other) :24 (Other) :36
## Sal_Diario Col Mun edad
## Min. :144.4 PUEBLO NUEVO :27 APODACA :72 Min. :0
## 1st Qu.:176.7 CANTORAL : 4 JUAREZ :10 1st Qu.:0
## Median :180.7 CAÑADA BLANCA : 3 PESQUERIA: 9 Median :0
## Mean :181.4 MISION SAN PABLO : 3 GUADALUPE: 6 Mean :0
## 3rd Qu.:180.7 PORTAL DE HUINALA : 3 SALTILLO : 5 3rd Qu.:0
## Max. :441.4 VALLE DE SANTA MARIA: 3 MONTERREY: 4 Max. :0
## (Other) :70 (Other) : 7
str(RhBajas1)## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : Factor w/ 2 levels "FEMENINO","MASCULINO": 2 1 1 1 1 1 1 2 2 2 ...
## $ Fecha_alta: Date, format: "2020-03-09" "2021-11-09" ...
## $ MB : Factor w/ 5 levels "ABANDONO","BAJA POR FALTAS",..: 4 4 4 4 4 2 2 2 2 4 ...
## $ Días_trab : Factor w/ 95 levels "0","1","2","3",..: 88 53 52 52 48 37 37 31 19 79 ...
## $ Baja : Date, format: "2021-11-27" "2022-01-08" ...
## $ PuestDes : Factor w/ 31 levels "ANALISTA DE NOMINAS /AUX DE R.H.",..: 15 9 9 9 9 9 9 9 9 4 ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : Factor w/ 98 levels "ACANTO RESIDENCIAL",..: 82 18 72 72 73 28 72 48 15 80 ...
## $ Mun : Factor w/ 13 levels "APODACA","CADEREYTA",..: 10 7 1 1 1 1 1 5 4 1 ...
## $ Estado : Factor w/ 3 levels "COAHUILA","NUEVO LEÓN",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ EstCiv : Factor w/ 5 levels "CASADO","DIVORCIADO",..: 3 5 1 3 3 3 5 5 3 3 ...
summary(RhBajas1)## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 FEMENINO :140 Min. :2016-10-12
## Class :character 1st Qu.:23.00 MASCULINO: 97 1st Qu.:2022-01-19
## Mode :character Median :29.00 Median :2022-04-04
## Mean :30.52 Mean :2022-02-10
## 3rd Qu.:37.00 3rd Qu.:2022-06-14
## Max. :61.00 Max. :2022-08-17
##
## MB Días_trab Baja
## ABANDONO : 1 15 : 11 Min. :2021-11-27
## BAJA POR FALTAS :141 1 : 9 1st Qu.:2022-03-01
## JUBILACION : 1 6 : 9 Median :2022-05-06
## RENUNCIA VOLUNTARIA: 86 9 : 8 Mean :2022-05-05
## TERMINO DE CONTRATO: 8 0 : 7 3rd Qu.:2022-07-07
## 8 : 7 Max. :2022-08-25
## (Other):186
## PuestDes Sal_IMSS Col
## AYUDANTE GENERAL :173 Min. :144.4 PUEBLO NUEVO : 67
## SOLDADOR : 11 1st Qu.:180.7 VALLE DE SANTA MARIA: 15
## COSTURERA : 10 Median :180.7 CANTORAL : 10
## MONTACARGUISTA : 5 Mean :178.6 PORTAL DE HUINALA : 6
## AY. GENERAL : 4 3rd Qu.:180.7 SAN ISIDRO : 6
## AUXILIAR DE EMBARQUES: 3 Max. :500.0 BOSQUES DE HUINALA : 4
## (Other) : 31 (Other) :129
## Mun Estado EstCiv
## APODACA :162 COAHUILA : 9 CASADO : 64
## PESQUERIA : 32 NUEVO LEÓN:227 DIVORCIADO : 3
## JUAREZ : 15 SALTILLO : 1 SOLTERO :110
## GUADALUPE : 10 Unión libre: 1
## RAMOS ARIZPE : 8 UNIÓN LIBRE: 59
## SAN NICOLAS DE LOS GARZA: 3
## (Other) : 7
## Colaboradores
tapply(RhColab1$Sal_Diario,
list(RhColab1$Gen,RhColab1$Puesto), mean)## AY. GENERAL AYUDANTE DE MANTENIMIENTO Ayudante general
## FEMENINO 151.61 NA NA
## MASCULINO 151.61 180.68 176.72
## AYUDANTE GENERAL CHOFER CHOFER GESTOR COSTURERA CUSTOMER SERVICE INF
## FEMENINO 177.4222 NA NA 191.7533 NA
## MASCULINO 176.2268 177.71 180.68 176.7200 176.72
## ENFERMERA Externo EXTERNO GESTOR GUARDIA DE SEGURIDAD
## FEMENINO 176.72 NA NA NA NA
## MASCULINO NA 176.72 151.67 176.72 180.68
## INSPECTOR DE CALIDAD INSPECTORA DE CALIDAD LIDER LIMPIEZA
## FEMENINO 208.65 180.68 144.45 176.72
## MASCULINO NA NA NA NA
## MANTENIMIENTO MONTACARGUISTA MOZO OP. FLEXO-RANURADORA-REFILADORA
## FEMENINO NA NA NA NA
## MASCULINO 279.61 180.68 180.68 176.72
## OPERADOR SIERRA PINTOR RECIBO RESIDENTE SOLDADOR Supervisor de Máquin
## FEMENINO NA NA 176.72 NA NA NA
## MASCULINO 180.68 176.72 NA 177.71 179.888 176.72
## Supervisor de pegado SUPERVISORA
## FEMENINO 176.72 389.21
## MASCULINO NA NA
tapply(RhColab1$Sal_Diario,
list(RhColab1$Gen,RhColab1$Dep), mean)## Ay.flexo Calidad Cedis CEDIS Celdas CORTADORAS Costura
## FEMENINO 178.7544 NA 194.665 NA NA 180.68 NA 245.375
## MASCULINO 176.5400 180.68 NA 176.72 180.68 NA 180.68 176.720
## COSTURA Costura T2 EHS Embarques Externo Limpieza Materiales
## FEMENINO 151.61 152.86 176.720 NA NA 176.72 176.72
## MASCULINO NA NA 230.145 177.71 164.195 NA NA
## Paileria Produccion Cartón MC Produccion Cartón MDL Producción Retorn
## FEMENINO NA 194.405 156.0975 161.3000
## MASCULINO 178.7 151.670 168.3700 183.8443
## Rotativa Stabilus Troquel
## FEMENINO NA 180.68 180.68
## MASCULINO 151.61 180.68 180.68
## Bajas
tapply(RhBajas1$Sal_IMSS,RhBajas1$Gen,mean)## FEMENINO MASCULINO
## 177.3126 180.5544
RhColab1$Sal_Diario<-replace(RhColab1$Sal_Diario,RhColab1$Sal_Diario>1000000,181)library(ggplot2)
tapply(RhColab1$Sal_Diario,
list(RhColab1$Gen,RhColab1$Dep), mean)## Ay.flexo Calidad Cedis CEDIS Celdas CORTADORAS Costura
## FEMENINO 178.7544 NA 194.665 NA NA 180.68 NA 245.375
## MASCULINO 176.5400 180.68 NA 176.72 180.68 NA 180.68 176.720
## COSTURA Costura T2 EHS Embarques Externo Limpieza Materiales
## FEMENINO 151.61 152.86 176.720 NA NA 176.72 176.72
## MASCULINO NA NA 230.145 177.71 164.195 NA NA
## Paileria Produccion Cartón MC Produccion Cartón MDL Producción Retorn
## FEMENINO NA 194.405 156.0975 161.3000
## MASCULINO 178.7 151.670 168.3700 183.8443
## Rotativa Stabilus Troquel
## FEMENINO NA 180.68 180.68
## MASCULINO 151.61 180.68 180.68
hist(RhBajas1$Edad, freq=TRUE, col='orange', main="Histograma de Edad",xlab="Edad en Años")ggplot(RhBajas1, aes(x=Gen, y=Edad, fill=Gen)) +
geom_boxplot() ggplot(RhColab1, aes(x=Gen, y=Sal_Diario, fill=Gen)) +
geom_boxplot() ggplot(RhColab1, aes(Gen,Sal_Diario,fill=Gen)) +
geom_bar(stat = "identity") +
scale_fill_brewer(palette = "Set2") + ggtitle("Salario Diario por Genero")ggplot(RhBajas1, aes(x=Gen, y=Sal_IMSS, fill=Gen)) +
geom_bar(stat="identity") +
facet_grid(~EstCiv) + scale_fill_brewer(palette = "Set1")#file.choose()
bd <-read.csv("/Users/mac/Downloads/FORM - Merma limpia2.csv")# install.packages("tidyverse")
library(tidyverse)## Registered S3 methods overwritten by 'broom':
## method from
## tidy.glht jtools
## tidy.summary.glht jtools
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ tidyr 1.2.0 ✔ stringr 1.4.1
## ✔ readr 2.1.2 ✔ forcats 0.5.2
## ✔ purrr 0.3.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ ggplot2::%+%() masks psych::%+%()
## ✖ ggplot2::alpha() masks psych::alpha()
## ✖ lubridate::as.difftime() masks base::as.difftime()
## ✖ lubridate::date() masks base::date()
## ✖ dplyr::filter() masks stats::filter()
## ✖ lubridate::intersect() masks base::intersect()
## ✖ dplyr::lag() masks stats::lag()
## ✖ car::recode() masks dplyr::recode()
## ✖ lubridate::setdiff() masks base::setdiff()
## ✖ purrr::some() masks car::some()
## ✖ lubridate::union() masks base::union()
# install.packages("janitor")
library(janitor)##
## Attaching package: 'janitor'
##
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(dplyr)
library(ggplot2)summary(bd)## Fecha ENERO KilosEnero Fecha1
## Length:10 Length:10 Min. :2680 Length:10
## Class :character Class :character 1st Qu.:2912 Class :character
## Mode :character Mode :character Median :3400 Mode :character
## Mean :3640
## 3rd Qu.:4128
## Max. :5080
## NA's :6
## FEBRERO KilosFebrero Fecha2 MARZO
## Length:10 Min. :3410 Length:10 Length:10
## Class :character 1st Qu.:3605 Class :character Class :character
## Mode :character Median :3760 Mode :character Mode :character
## Mean :3805
## 3rd Qu.:3915
## Max. :4380
## NA's :4
## KilosMarzo Fecha3 ABRIL KilosAbril
## Min. :2980 Length:10 Length:10 Min. :2950
## 1st Qu.:3420 Class :character Class :character 1st Qu.:3690
## Median :3905 Mode :character Mode :character Median :3940
## Mean :3745 Mean :3764
## 3rd Qu.:4142 3rd Qu.:4050
## Max. :4200 Max. :4190
## NA's :4 NA's :5
## Fecha4 MAYO KilosMayo Fecha5
## Length:10 Length:10 Min. :3680 Length:10
## Class :character Class :character 1st Qu.:4310 Class :character
## Mode :character Mode :character Median :4510 Mode :character
## Mean :4682
## 3rd Qu.:4770
## Max. :6140
## NA's :5
## JUNIO KilosJunio Fecha6 JULIO
## Length:10 Min. :4260 Length:10 Length:10
## Class :character 1st Qu.:4312 Class :character Class :character
## Mode :character Median :4505 Mode :character Mode :character
## Mean :4570
## 3rd Qu.:4762
## Max. :5010
## NA's :6
## KilosJulio Fecha7 AGOSTO KilosAgosto
## Min. :2130 Length:10 Length:10 Min. :1040
## 1st Qu.:3920 Class :character Class :character 1st Qu.:3140
## Median :3960 Mode :character Mode :character Median :3780
## Mean :3874 Mean :3567
## 3rd Qu.:4130 3rd Qu.:4210
## Max. :5230 Max. :5080
## NA's :5 NA's :1
## Fecha8 SEPTIEMBRE KilosSeptiembre
## Length:10 Length:10 Min. :2830
## Class :character Class :character 1st Qu.:2995
## Mode :character Mode :character Median :3394
## Mean :3396
## 3rd Qu.:3796
## Max. :3967
## NA's :6
str(bd)## 'data.frame': 10 obs. of 27 variables:
## $ Fecha : chr "11/01/22" "11/01/22" "22/01/22" "22/01/22" ...
## $ ENERO : chr "Enero" "Enero" "Enero" "Enero" ...
## $ KilosEnero : int 5080 3810 2990 2680 NA NA NA NA NA NA
## $ Fecha1 : chr "18/02/22" "18/02/22" "18/02/22" "18/02/22" ...
## $ FEBRERO : chr "Febrero" "Febrero" "Febrero" "Febrero" ...
## $ KilosFebrero : int 3650 4380 3870 3590 3410 3930 NA NA NA NA
## $ Fecha2 : chr "03/03/22" "08/03/22" "11/03/22" "16/03/22" ...
## $ MARZO : chr "Marzo" "Marzo" "Marzo" "Marzo" ...
## $ KilosMarzo : int 4000 4190 2980 3290 4200 3810 NA NA NA NA
## $ Fecha3 : chr "04/04/22" "11/04/22" "14/04/22" "21/04/22" ...
## $ ABRIL : chr "Abril" "Abril" "Abril" "Abril" ...
## $ KilosAbril : int 3940 4190 2950 3690 4050 NA NA NA NA NA
## $ Fecha4 : chr "02/05/22" "09/05/22" "14/05/22" "24/05/22" ...
## $ MAYO : chr "Mayo" "Mayo" "Mayo" "Mayo" ...
## $ KilosMayo : int 4310 4770 3680 6140 4510 NA NA NA NA NA
## $ Fecha5 : chr "07/06/22" "15/06/22" "20/06/22" "27/06/22" ...
## $ JUNIO : chr "Junio" "Junio" "Junio" "Junio" ...
## $ KilosJunio : int 4680 4330 5010 4260 NA NA NA NA NA NA
## $ Fecha6 : chr "04/07/22" "11/07/22" "16/07/22" "21/07/22" ...
## $ JULIO : chr "Julio" "Julio" "Julio" "Julio" ...
## $ KilosJulio : int 5230 2130 4130 3920 3960 NA NA NA NA NA
## $ Fecha7 : chr "08/08/22" "10/08/22" "11/08/22" "13/08/22" ...
## $ AGOSTO : chr "Agosto" "Agosto" "Agosto" "Agosto" ...
## $ KilosAgosto : int 3140 4210 3140 3780 4240 4200 5080 1040 3270 NA
## $ Fecha8 : chr "05/09/22" "07/09/22" "15/09/22" "21/09/22" ...
## $ SEPTIEMBRE : chr "Septiembre" "Septiembre" "Septiembre" "Septiembre" ...
## $ KilosSeptiembre: int 3050 2830 3967 3739 NA NA NA NA NA NA
Variable<-c("Fecha","ENERO","KilosEnero","Fecha1","FEBRERO","KilosFebrero","Fecha2","MARZO","KilosMarzo","Fecha3","ABRIL","KilosAbril","Fecha4","MAYO","KilosMayo","Fecha5","JUNIO","KilosJunio","Fecha6","JULIO","KilosJulio","Fecha7","AGOSTO","KilosAgosto","Fecha8","SEPTIEMBRE","KilosSeptiembre")
Type<-c("qualitative (nominal)", "qualitative (ordinal)", "quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)","qualitative (nominal)","qualitative (ordinal)","quantitative (discrete)")
table<-data.frame(Variable,Type)
knitr::kable(table)| Variable | Type |
|---|---|
| Fecha | qualitative (nominal) |
| ENERO | qualitative (ordinal) |
| KilosEnero | quantitative (discrete) |
| Fecha1 | qualitative (nominal) |
| FEBRERO | qualitative (ordinal) |
| KilosFebrero | quantitative (discrete) |
| Fecha2 | qualitative (nominal) |
| MARZO | qualitative (ordinal) |
| KilosMarzo | quantitative (discrete) |
| Fecha3 | qualitative (nominal) |
| ABRIL | qualitative (ordinal) |
| KilosAbril | quantitative (discrete) |
| Fecha4 | qualitative (nominal) |
| MAYO | qualitative (ordinal) |
| KilosMayo | quantitative (discrete) |
| Fecha5 | qualitative (nominal) |
| JUNIO | qualitative (ordinal) |
| KilosJunio | quantitative (discrete) |
| Fecha6 | qualitative (nominal) |
| JULIO | qualitative (ordinal) |
| KilosJulio | quantitative (discrete) |
| Fecha7 | qualitative (nominal) |
| AGOSTO | qualitative (ordinal) |
| KilosAgosto | quantitative (discrete) |
| Fecha8 | qualitative (nominal) |
| SEPTIEMBRE | qualitative (ordinal) |
| KilosSeptiembre | quantitative (discrete) |
sum(is.na(bd))## [1] 42
bd[is.na(bd)]<-0bd[duplicated(bd), ]## [1] Fecha ENERO KilosEnero Fecha1
## [5] FEBRERO KilosFebrero Fecha2 MARZO
## [9] KilosMarzo Fecha3 ABRIL KilosAbril
## [13] Fecha4 MAYO KilosMayo Fecha5
## [17] JUNIO KilosJunio Fecha6 JULIO
## [21] KilosJulio Fecha7 AGOSTO KilosAgosto
## [25] Fecha8 SEPTIEMBRE KilosSeptiembre
## <0 rows> (or 0-length row.names)
sum(duplicated(bd))## [1] 0
bd1<-bd
bd1[bd1 <0] <-0
summary(bd1)## Fecha ENERO KilosEnero Fecha1
## Length:10 Length:10 Min. : 0 Length:10
## Class :character Class :character 1st Qu.: 0 Class :character
## Mode :character Mode :character Median : 0 Mode :character
## Mean :1456
## 3rd Qu.:2912
## Max. :5080
## FEBRERO KilosFebrero Fecha2 MARZO
## Length:10 Min. : 0 Length:10 Length:10
## Class :character 1st Qu.: 0 Class :character Class :character
## Mode :character Median :3500 Mode :character Mode :character
## Mean :2283
## 3rd Qu.:3815
## Max. :4380
## KilosMarzo Fecha3 ABRIL KilosAbril
## Min. : 0 Length:10 Length:10 Min. : 0
## 1st Qu.: 0 Class :character Class :character 1st Qu.: 0
## Median :3135 Mode :character Mode :character Median :1475
## Mean :2247 Mean :1882
## 3rd Qu.:3952 3rd Qu.:3878
## Max. :4200 Max. :4190
## Fecha4 MAYO KilosMayo Fecha5
## Length:10 Length:10 Min. : 0 Length:10
## Class :character Class :character 1st Qu.: 0 Class :character
## Mode :character Mode :character Median :1840 Mode :character
## Mean :2341
## 3rd Qu.:4460
## Max. :6140
## JUNIO KilosJunio Fecha6 JULIO
## Length:10 Min. : 0 Length:10 Length:10
## Class :character 1st Qu.: 0 Class :character Class :character
## Mode :character Median : 0 Mode :character Mode :character
## Mean :1828
## 3rd Qu.:4312
## Max. :5010
## KilosJulio Fecha7 AGOSTO KilosAgosto
## Min. : 0 Length:10 Length:10 Min. : 0
## 1st Qu.: 0 Class :character Class :character 1st Qu.:3140
## Median :1065 Mode :character Mode :character Median :3525
## Mean :1937 Mean :3210
## 3rd Qu.:3950 3rd Qu.:4208
## Max. :5230 Max. :5080
## Fecha8 SEPTIEMBRE KilosSeptiembre
## Length:10 Length:10 Min. : 0
## Class :character Class :character 1st Qu.: 0
## Mode :character Mode :character Median : 0
## Mean :1359
## 3rd Qu.:2995
## Max. :3967
media_bd5 <- mean(bd$KilosMayo)
media_bd5## [1] 2341
median_bd5 <- median(bd$KilosMayo)
median_bd5## [1] 1840
mode_bd5 <- mode(bd$KilosMayo)
mode_bd5## [1] "numeric"
media_bd8 <- mean(bd$KilosAgosto)
media_bd8## [1] 3210
median_bd8 <- median(bd$KilosAgosto)
median_bd8## [1] 3525
mode_bd8 <- mode(bd$KilosAgosto)
mode_bd8## [1] "numeric"
bd$Fecha7<- as.Date(bd$Fecha7,format = "%d/%m/%Y")
plot(bd$Fecha7, bd$KilosAgosto)ggplot(bd, aes(x= Fecha4, y= KilosMayo)) + geom_bar(stat="identity", fill="blue") + scale_fill_grey() + labs(title = "Kilos de merma Agosto", x = "Fecha")ggplot(bd, aes(x= Fecha7, y= KilosAgosto)) + geom_bar(stat="identity", fill="blue") + scale_fill_grey() + labs(title = "Kilos de merma Agosto", x = "Fecha")## Warning: Removed 1 rows containing missing values (position_stack).
#install.packages("forecast")
library(forecast)## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
sum(bd$KilosEnero)## [1] 14560
sum(bd$KilosFebrero)## [1] 22830
sum(bd$KilosMarzo)## [1] 22470
sum(bd$KilosAbril)## [1] 18820
sum(bd$KilosMayo)## [1] 23410
sum(bd$KilosJunio)## [1] 18280
sum(bd$KilosJulio)## [1] 19370
sum(bd$KilosAgosto)## [1] 32100
sum(bd$KilosSeptiembre)## [1] 13586
merma <- c(14560,22830,22470,18820,23410,18280,19370,32100,13586)
produccion_st <- ts(data = merma, start = c(2022,1), frequency = 12)
produccion_st## Jan Feb Mar Apr May Jun Jul Aug Sep
## 2022 14560 22830 22470 18820 23410 18280 19370 32100 13586
modelo <- auto.arima(produccion_st)
modelo## Series: produccion_st
## ARIMA(0,0,0) with non-zero mean
##
## Coefficients:
## mean
## 20602.889
## s.e. 1736.893
##
## sigma^2 = 30544665: log likelihood = -89.8
## AIC=183.59 AICc=185.59 BIC=183.99
pronostico <- forecast(modelo, level=c(95), h=3)
pronostico## Point Forecast Lo 95 Hi 95
## Oct 2022 20602.89 9770.711 31435.07
## Nov 2022 20602.89 9770.711 31435.07
## Dec 2022 20602.89 9770.711 31435.07
plot(pronostico)del_plan <- read.csv("/Users/mac/Downloads/CLEANDBDeliveryPlan.csv")library(dplyr)
del_plan<- clean_names(del_plan)
summary(del_plan$mes)## Length Class Mode
## 733 character character
del_plan$mes<-recode_factor(del_plan$mes,jun_21="junio",jul_21="julio",ago_21="agosto",sep_21="septiembre",
oct_21="octubre",nov_21="noviembre",dic_21="diciembre",oct_22="octubre_22")
function(pivot_longer)
del_plan<-pivot_longer(del_plan, cols=5:16, names_to = "mes", values_to = "unidades")## function(pivot_longer)
## del_plan<-pivot_longer(del_plan, cols=5:16, names_to = "mes", values_to = "unidades")
str(del_plan)## 'data.frame': 733 obs. of 3 variables:
## $ cliente_planta: chr "STB3" "STB3" "STB3" "STB3" ...
## $ mes : Factor w/ 12 levels "junio","julio",..: 2 3 5 7 8 9 7 8 9 10 ...
## $ unidades : int 140 530 200 150 230 500 184 125 55 55 ...
del_plan <- filter(del_plan, unidades>0)
sum(is.na(del_plan))## [1] 0
tabla_estadisticos <- describe(del_plan)
tabla_estadisticos## vars n mean sd median trimmed mad min max range
## cliente_planta* 1 733 17.06 6.42 20 17.85 2.97 1 25 24
## mes* 2 733 6.94 3.38 7 6.99 4.45 1 12 11
## unidades 3 733 406.35 1337.17 76 152.96 97.85 1 17665 17664
## skew kurtosis se
## cliente_planta* -1.21 -0.03 0.24
## mes* -0.12 -1.18 0.12
## unidades 8.35 84.94 49.39
library(dplyr)
str(del_plan)## 'data.frame': 733 obs. of 3 variables:
## $ cliente_planta: chr "STB3" "STB3" "STB3" "STB3" ...
## $ mes : Factor w/ 12 levels "junio","julio",..: 2 3 5 7 8 9 7 8 9 10 ...
## $ unidades : int 140 530 200 150 230 500 184 125 55 55 ...
del_plan$cliente_planta<-as.factor(del_plan$cliente_planta)
del_plan$unidades<-as.numeric(del_plan$unidades)
del_plan2<-aggregate(unidades~cliente_planta, data = del_plan,sum)%>% arrange(desc(unidades))
del_plan3<-filter(del_plan2, unidades>4000)
ggplot(del_plan3, aes(x=reorder(cliente_planta,unidades), y=unidades)) +
geom_bar(stat="identity")+
coord_flip()del_plan2$unidades<-as.numeric(del_plan2$unidades)
ggplot(del_plan, aes(x=cliente_planta, y=unidades, fill=cliente_planta)) +
geom_boxplot() boxplot(del_plan3$cliente_planta,del_plan3$unidades)class(del_plan2$unidades)## [1] "numeric"
del_plan4<-aggregate(unidades~cliente_planta+mes, data = del_plan,sum)%>% arrange(desc(unidades))
del_plan5<-filter(del_plan4, cliente_planta=="HELLA" & cliente_planta=="TRMX" & cliente_planta=="VARROC" & cliente_planta=="DENSO")
ggplot(del_plan,aes(x=mes, y=unidades,color=cliente_planta))+
geom_line()+
labs(x="Fecha",y="Delay in Minutes", color="Legend")+
ggtitle("Delays in Performance by Client")#file.choose()
bd <- read.csv("/Users/mac/Downloads/FORM - Scrap Limpia (1).csv")bd$Fecha<- as.Date(bd$Fecha,format = "%d/%m/%Y")
plot(bd$Fecha, bd$Cantidad)summary(bd)## Referencia Fecha Hora Producto
## Length:250 Min. :2022-08-01 Length:250 Length:250
## Class :character 1st Qu.:2022-08-11 Class :character Class :character
## Mode :character Median :2022-08-19 Mode :character Mode :character
## Mean :2022-08-17
## 3rd Qu.:2022-08-25
## Max. :2022-08-31
## Cantidad Unidad.de.medida Ubicación.de.origen Ubicación.de.desecho
## Min. : 0.000 Length:250 Length:250 Length:250
## 1st Qu.: 1.000 Class :character Class :character Class :character
## Median : 2.000 Mode :character Mode :character Mode :character
## Mean : 6.696
## 3rd Qu.: 7.000
## Max. :96.000
## Estado
## Length:250
## Class :character
## Mode :character
##
##
##
library(tidyverse)
library(janitor)
library(psych)describe(bd)## Warning in FUN(newX[, i], ...): no non-missing arguments to min; returning Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to max; returning -Inf
## vars n mean sd median trimmed mad min max range
## Referencia* 1 250 125.50 72.31 125.5 125.50 92.66 1 250 249
## Fecha 2 250 NaN NA NA NaN NA Inf -Inf -Inf
## Hora* 3 250 125.50 72.31 125.5 125.50 92.66 1 250 249
## Producto* 4 250 44.38 24.72 45.0 44.12 25.95 1 95 94
## Cantidad 5 250 6.70 11.85 2.0 3.88 1.48 0 96 96
## Unidad.de.medida* 6 250 1.00 0.00 1.0 1.00 0.00 1 1 0
## Ubicación.de.origen* 7 250 2.48 0.85 3.0 2.60 0.00 1 3 2
## Ubicación.de.desecho* 8 250 1.00 0.00 1.0 1.00 0.00 1 1 0
## Estado* 9 250 1.00 0.00 1.0 1.00 0.00 1 1 0
## skew kurtosis se
## Referencia* 0.00 -1.21 4.57
## Fecha NA NA NA
## Hora* 0.00 -1.21 4.57
## Producto* 0.01 -0.79 1.56
## Cantidad 4.12 21.14 0.75
## Unidad.de.medida* NaN NaN 0.00
## Ubicación.de.origen* -1.10 -0.70 0.05
## Ubicación.de.desecho* NaN NaN 0.00
## Estado* NaN NaN 0.00
str(bd)## 'data.frame': 250 obs. of 9 variables:
## $ Referencia : chr "SP/08731" "SP/08730" "SP/08729" "SP/08728" ...
## $ Fecha : Date, format: "2022-08-31" "2022-08-31" ...
## $ Hora : chr "14:55:40" "14:49:25" "13:49:29" "09:30:07" ...
## $ Producto : chr "[BACKFRAME 60% CUELLO ARMADO] 18805. 60% Backframe. Cuello Armado." "[N61506747 CAJA] N61506747. Kit. Caja." "[N61506729 SEPARADOR] N61506729. Kit. Separador." "[341332 DIVISOR - U611 & U625] 341332. U611. U625. Divisor Troquelado." ...
## $ Cantidad : num 2 1 1 31 1 1 1 9 2 1 ...
## $ Unidad.de.medida : chr "Unidad(es)" "Unidad(es)" "Unidad(es)" "Unidad(es)" ...
## $ Ubicación.de.origen : chr "SAB/Calidad/Entrega de PT" "SAB/Calidad/Entrega de PT" "SAB/Calidad/Entrega de PT" "SAB/Pre-Production" ...
## $ Ubicación.de.desecho: chr "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" ...
## $ Estado : chr "Hecho" "Hecho" "Hecho" "Hecho" ...
tabyl(bd, Producto, Ubicación.de.origen)## Producto
## [2065WY AS 30 99 0000 00 000 TAPA - BOX 2064WY] BOX 2064WY
## [241B EXPORT CAJA] 241B. Export. Caja.
## [341332 CELDA - U611 & U625] 341332. U611. U625. Celda Troquelada.
## [341332 CHAROLA - U611 & U625] 341332. U611. U625. Charola Troquelada.
## [341332 DIVISOR - U611 & U625] 341332. U611. U625. Divisor Troquelado.
## [357790-TAPA] 357790. Tapa.
## [358268-CAJA] 358268-CAJA
## [358268-TAPA] 358268-TAPA
## [428579 AS 30 99 0000 00 000 INSERTO- FORD DAMPER] 14306. Damper Ford DTP. Inserto.
## [428818 AS 30 99 0000 00 000 INSERTO - CHRYSLER INSERT DJ] CHRYSLER INSERT DJ PART 694087
## [429296 AS 30 99 0000 00 000 INSERTO - INSERT TMC 150 TESLA] 14783. TMC150. Inserto.
## [446265 AS 30 99 0000 00 000 CAPA INTERMEDIA- PAD 43X36 DAIMLER] 14454. Daimler Pad 43 X 36
## [467.416-24 COMPARTIMENT INSERT 535X335X221MM CC ESD] Refacciones. P1. Celdado.
## [496455 FS 30 99 0000 00 000 CARTÓN - BOX 0371813] BOX 0371813
## [500033 AS 30 99 0000 00 000 INSERTO - Inserto FORD China 500033] 17397. 500033. FORD China. Inserto.
## [642762 PACKING, SHEET, 565.2X742.9 - INSERT 642762] 642762. Pad. S.M.
## [643920 CART, SOM, 746.8X569.0X292.1, RSC - BOX 643920 STABOMAT] 13891. 643920. Stabomat. Caja.
## [647713] 647713. Caja.
## [938830 FS 30 99 0000 00 000 CARTÓN - SIZE 24"] 24". Caja Terminada.
## [939069 FS 30 99 0000 00 000 CARTÓN -BOX 939069 34"] 34". Caja Terminada.
## [A - CELDA SUDAFRICA BMW G01 LCI] Sudafrica. A. Pieza.
## [B - CELDA SUDAFRICA BMW G01 LCI] Sudáfrica. B. Pieza.
## [BACKFRAME 60% CUELLO ARMADO] 18805. 60% Backframe. Cuello Armado.
## [BACKFRAME 60% TAPA BASE] 18271. 60% Backframe. Tapa Base.
## [BOX 143907 - CELDA] 143907. Solares. Celda Troquelada.
## [BOX 143907 - TAPA] 143907. Solares. Tapa Troquelada.
## [C - CELDA SUDAFRICA BMW G01 LCI] Sudáfrica. C. Pieza.
## [CAJA ( ARMREST / HR REAR) TMC 110 MODEL Y] 19148. Modelo Y. TMC0110. Armrest & Rear & Center. Caja
## [CAJA 695] N61506695. Caja.
## [CAJA 726] N61506726 CAJA
## [CAJA 734949] CAJA 734949
## [CAJA 784] 784. Kit. Caja.
## [CAJA 95161] 19079. 95161. Kit. Caja.
## [Caja backup canastilla gris] CAJA DE CARTÓN BACK UP CANASTILLA GRIS- P3
## [CAJA INDUSTRIAL 16" ROTATIVA] 16". Lamina Troquelada.
## [CAJA INDUSTRIAL 24" ROTATIVA COMPLETA] 24". Lamina Troquelada.
## [CAJA INDUSTRIAL 34" ROTATIVA] 34". Lamina Troquelada.
## [CAJA INDUSTRIAL 48" CON SELLO (PP)] 48". Lamina Troquelada.
## [CAJA MCV] Toyota. MCV. Caja Troquelada.
## [CAJA RSC DE KIT REFLEX] 857. Reflex. Caja.
## [CAJA RSC SHOCK TOWER] Shock Tower. Caja.
## [CAJA RSC TGTX] TGTX. Caja RSC.
## [CELDA 955061] 955061. Celda Troquelada.
## [Celda Audi coupe] 18892. Coupe. Celda Troquelada.
## [CELDA AUDI Q5] 14096. Audi Q5. Celda Troquelada.
## [CELDA CON MICRO CORUUGAD O EN 32 PORTA ETIQUETA] TR13777 KIT TGTX. Caja + Celda
## [CELDA GM177] 14100. GM177. Celda Troquelada.
## [CELDA VW CHATTANOOGA] Chattanooga. St3. Celda Troquelada.
## [CELL C] 60% Backframe. Separador con Doblez.
## [CHAROLA 955061] 955061. Charola Troquelada.
## [Charola audi coupe] 18890. Coupe. Charola Troquelada.
## [CHAROLA AUDI Q5] 14128. Audi Q5. Charola Troquelada.
## [CHAROLA GM177] 14131. GM177. Charola Troquelada.
## [CHAROLA VW CHATTANOOGA] Chattanooga. St1 y St3. Charola Troquelada.
## [Console cell] Console Lower. Celda Armada.
## [D - CELDA SUDAFRICA BMW G01 LCI] Sudáfrica. D. Pieza.
## [DIVISOR AUDI Q5] 14234. Audi Q5. Divisor Troquelado.
## [DIVISOR CON DOBLEZ VW CHATTANOOGA] Chattanooga. St1 y St3. Divisor Troquelado.
## [DIVISOR GM177] 14238. GM177. Divisor.
## [DIVISOR REFLEX] 857. Reflex. Divisor.
## [DIVISOR ZIGZAG VW CHATTANOOGA] Chattanooga. St1 y St3. Zig Zag Troquelado.
## [E - CELDA SUDAFRICA BMW G01 LCI] Sudáfrica. E. Pieza.
## [F - CELDA SUDAFRICA BMW G01 LCI] Sudáfrica. F. Pieza.
## [HSC P702 ICP] 17215. P558. P702. CD539. ICP. Caja HSC. Pieza.
## [INSERTO 241B EXPORT] 14308. 241B. Export. Inserto.
## [Inserto Nextracker 3.0] Nextracker. 2.0. Damper. Inserto.
## [INSERTO SOLARES] 143907. Solares. Inserto Troquelada.
## [MITAD DE CUELLO SHOCK TOWER] Shock Tower. Mitad Cuello.
## [MQ4A-Dunnage-part2] Kia. Inserto. Pieza.
## [MQ4A-Dunnage-tray] Kia. Charola. Pieza.
## [N61506396 CAJA] N61506396. Caja.
## [N61506396 SEPARADOR] N61506396. Separador.
## [N61506729 SEPARADOR] N61506729. Kit. Separador.
## [N61506747 CAJA] N61506747. Kit. Caja.
## [N61506747 TAPA] N61506747. Kit. Tapa.
## [NEXTRACKER 2.0 DAMPER CUELLO] 18976. Nextracker. 2.0. Damper. Cuello,
## [NEXTRACKER 2.0 DAMPER TAPA DE COROPLAST] Nextracker. 2.0. Damper. Tapa de Coroplast.
## [PTN.WS IP 60 CELL IBT] Y0199489 PTN.WS IP 60 CELL IBT
## [REJILLA DE 16X PARA PIVOT DE TESLA PARA PROCESO DE MTM A PPG] CELDA PIVOTE CONTENEDOR RETORNABLE
## [SEAT BACK CAJA] Seat Back. Caja HSC 1/2
## [SEAT BACK CELDADO] Seat Back. Celda Armada.
## [SEPARADOR 41" X 44" PARA PIVOTE Y SEAT BACK DE MTM A PPG] SEPARADOR PIVOTE CONTENEDOR RETORNABLE
## [SEPARADOR MOTORGEAR] Motorgear. Separador para Celdas.
## [TAPA 695] N61506695. Tapa.
## [TAPA AVANAZAR] Avanzar. Tapa. Pieza.
## [TESLA XDA90 CELDA A] XDA90. A. Pieza.
## [TESLA XDA90 CELDA B] XDA90. B. Pieza.
## [TESLA XDA90 CHAROLA SUAJADA] XDA90. Charola. Pieza.
## [TMC 050 - RSC] Console lower - TMC 050
## [TMC 095] 19162. Modelo Y. TMC095. Front. Caja.
## [TMC XXX] Armrest. Caja RSC.
## [TR11910 CHAROLA C/2 DIV #20 SMOOTH C/32 CAVIDADES] TR11910. U725. DMS. ITB. Charola con ITB.
## [TR12438 TAPA ICP 539 TAPA 2415-2 EN CPARTÓN SENCILLO CORRUGADO] 18840. CD539. Tapa.
## [TR12440 TAPA P558] 18842. P558. Tapa.
## [TR13776 CAJA RSC CK 44 ECT C/ PORTA ETIQUETA] TR13776. Caja con Porta Etiqueta.
## SAB/Calidad/Entrega de PT SAB/Post-Production SAB/Pre-Production
## 1 0 1
## 1 0 0
## 0 0 10
## 0 0 5
## 0 0 5
## 2 0 1
## 2 0 0
## 2 0 0
## 1 0 0
## 1 0 2
## 1 0 0
## 2 0 0
## 1 0 0
## 0 1 0
## 1 0 0
## 3 0 0
## 1 0 1
## 1 0 2
## 1 0 0
## 1 0 0
## 0 0 3
## 0 0 3
## 1 0 0
## 1 0 0
## 0 0 3
## 0 0 1
## 0 0 3
## 0 0 1
## 0 1 0
## 0 1 0
## 0 0 1
## 0 2 0
## 0 0 1
## 0 1 0
## 0 0 12
## 0 0 3
## 0 0 11
## 0 0 7
## 0 0 2
## 0 1 0
## 2 0 0
## 0 0 1
## 0 0 6
## 0 0 3
## 0 0 10
## 1 0 0
## 0 0 9
## 0 0 1
## 1 0 0
## 0 0 5
## 0 0 2
## 0 0 5
## 0 0 5
## 0 0 5
## 2 0 0
## 0 0 3
## 0 0 4
## 0 0 4
## 0 0 5
## 0 1 0
## 0 0 4
## 0 0 2
## 0 0 3
## 0 0 4
## 2 0 0
## 3 0 1
## 0 0 1
## 0 0 1
## 0 0 3
## 0 0 3
## 1 1 0
## 0 1 0
## 1 0 0
## 3 0 0
## 2 0 0
## 2 0 0
## 2 0 0
## 1 0 0
## 1 0 0
## 2 0 0
## 1 0 0
## 1 0 0
## 1 0 0
## 0 1 0
## 0 0 2
## 0 0 3
## 0 0 1
## 0 0 2
## 0 0 1
## 1 0 1
## 0 0 1
## 3 0 0
## 0 1 0
## 1 0 0
## 0 1 0
variable<-c("Referencia","Fecha", "Hora", "Producto", "Cantidad", "Unidad.de.medida", "Ubicación.de.origen", "Ubicación.de.desecho")
type<-c("Cualitativo (nominal)","Cuantitativo (disccreta)", "Cuantitativo (discreta)", "Cualitativo (nominal)","Cuantitativo (Continua)", "Cualitativo (nominal)", "Cualitativo (nominal)","Cualitativo (nominal)")
table<-data.frame(variable,type)
knitr::kable(table)| variable | type |
|---|---|
| Referencia | Cualitativo (nominal) |
| Fecha | Cuantitativo (disccreta) |
| Hora | Cuantitativo (discreta) |
| Producto | Cualitativo (nominal) |
| Cantidad | Cuantitativo (Continua) |
| Unidad.de.medida | Cualitativo (nominal) |
| Ubicación.de.origen | Cualitativo (nominal) |
| Ubicación.de.desecho | Cualitativo (nominal) |
sum(is.na(bd))## [1] 0
sapply(bd, function(x) sum(is.na(x)))## Referencia Fecha Hora
## 0 0 0
## Producto Cantidad Unidad.de.medida
## 0 0 0
## Ubicación.de.origen Ubicación.de.desecho Estado
## 0 0 0
bd2 <- bd
bd2 <- subset (bd2, select = -c (Hora))
bd2 <- subset (bd2, select = -c (Producto))
bd2 <- subset (bd2, select = -c (Ubicación.de.desecho))
bd2 <- subset (bd2, select = -c (Unidad.de.medida ))
bd2 <- subset (bd2, select = -c (Referencia ))
bd2 <- subset (bd2, select = -c (Estado ))
summary(bd2)## Fecha Cantidad Ubicación.de.origen
## Min. :2022-08-01 Min. : 0.000 Length:250
## 1st Qu.:2022-08-11 1st Qu.: 1.000 Class :character
## Median :2022-08-19 Median : 2.000 Mode :character
## Mean :2022-08-17 Mean : 6.696
## 3rd Qu.:2022-08-25 3rd Qu.: 7.000
## Max. :2022-08-31 Max. :96.000
colnames(bd2) <-c ('Fecha','Cant.','Origen')
summary(bd2)## Fecha Cant. Origen
## Min. :2022-08-01 Min. : 0.000 Length:250
## 1st Qu.:2022-08-11 1st Qu.: 1.000 Class :character
## Median :2022-08-19 Median : 2.000 Mode :character
## Mean :2022-08-17 Mean : 6.696
## 3rd Qu.:2022-08-25 3rd Qu.: 7.000
## Max. :2022-08-31 Max. :96.000
summary(bd2)## Fecha Cant. Origen
## Min. :2022-08-01 Min. : 0.000 Length:250
## 1st Qu.:2022-08-11 1st Qu.: 1.000 Class :character
## Median :2022-08-19 Median : 2.000 Mode :character
## Mean :2022-08-17 Mean : 6.696
## 3rd Qu.:2022-08-25 3rd Qu.: 7.000
## Max. :2022-08-31 Max. :96.000
sd(bd2$Cant., na.rm= TRUE)## [1] 11.84885
hist(bd2$Cant.)ggplot(bd2, aes(x=Fecha, y= Origen)) +
geom_bar(stat="identity", fill="red") + scale_fill_grey() + # Add bars to the plot
labs(title = "Relación SAB", # Add a title
subtitle = "Scrap empresa FORM", # Add a subtitle
caption = "Relación", # Add a caption
x = "x")pie(table(bd2$Origen))barplot(table(bd2$Cant.,bd2$Origen), col="green", main = "Kilos de Scrap", xlab = "Origen", ylab = "Kilos" )base_de_datos <- read.csv("/Users/mac/Downloads/BDL1.csv")
base_de_datos$Fecha<- as.Date(base_de_datos$Fecha,format = "%d/%m/%Y")
plot(base_de_datos$Fecha, base_de_datos$Diferencia)library(tidyverse)
library(janitor)library(psych)
describe(base_de_datos)## Warning in FUN(newX[, i], ...): no non-missing arguments to min; returning Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to min; returning Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to min; returning Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to min; returning Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to max; returning -Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to max; returning -Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to max; returning -Inf
## Warning in FUN(newX[, i], ...): no non-missing arguments to max; returning -Inf
## vars n mean sd median trimmed mad min max range skew kurtosis
## Cliente* 1 104 2.75 1.10 2.5 2.81 1.48 1 4.00 3.00 -0.07 -1.46
## Fecha 2 104 NaN NA NA NaN NA Inf -Inf -Inf NA NA
## Diferencia 3 104 0.32 0.53 0.0 0.23 0.00 0 2.27 2.27 1.43 1.22
## X 4 0 NaN NA NA NaN NA Inf -Inf -Inf NA NA
## X.1 5 0 NaN NA NA NaN NA Inf -Inf -Inf NA NA
## X.2 6 0 NaN NA NA NaN NA Inf -Inf -Inf NA NA
## se
## Cliente* 0.11
## Fecha NA
## Diferencia 0.05
## X NA
## X.1 NA
## X.2 NA
str(base_de_datos)## 'data.frame': 104 obs. of 6 variables:
## $ Cliente : chr "PRINTEL " "MAHLE" "MAHLE" "MAHLE" ...
## $ Fecha : Date, format: "2021-07-01" "2021-07-01" ...
## $ Diferencia: num 0 0.55 1 1.1 0 0 0 0 2 0.55 ...
## $ X : logi NA NA NA NA NA NA ...
## $ X.1 : logi NA NA NA NA NA NA ...
## $ X.2 : logi NA NA NA NA NA NA ...
tabyl(base_de_datos, Cliente, Diferencia)## Cliente 0 0.1 0.4 0.55 0.8 0.95 1 1.03 1.05 1.1 1.2 1.8 2 2.27
## MAGNA 13 0 0 0 0 0 0 0 0 0 0 0 0 0
## MAHLE 10 0 1 2 1 1 15 1 1 4 1 1 0 1
## PRINTEL 10 1 0 0 0 0 0 0 0 0 1 0 1 0
## VARROC 39 0 0 0 0 0 0 0 0 0 0 0 0 0
variable<-c("Cliente","Fecha", "Diferencia")
type <- c("Cualitativo (nominal)","Cuantitativo (disccreta)", "Cuantitativo (continuo)")
table<-data.frame(variable,type)
knitr::kable(table)| variable | type |
|---|---|
| Cliente | Cualitativo (nominal) |
| Fecha | Cuantitativo (disccreta) |
| Diferencia | Cuantitativo (continuo) |
DeliveryBD <-base_de_datos
DeliveryBD <- subset ( DeliveryBD, select = -c (X, X.1, X.2))
bd2 <-base_de_datos
bd2 <- subset(bd2, select = -c (Fecha, X, X.1, X.2))
media_perfo <- mean(bd2$Diferencia)
mediana_perfo <- median(bd2$Diferencia)
mode <- function (x) {
ux <- unique(x)
ux [which.max(tabulate(match(x,ux)))]
}
mode_perfo <- mode(bd2$Diferencia)
mode_perfo## [1] 0
hist(bd2$Diferencia)bd1<-DeliveryBD
bd1[bd1 <0] <-0
summary(bd1)## Cliente Fecha Diferencia
## Length:104 Min. :2021-07-01 Min. :0.0000
## Class :character 1st Qu.:2021-10-01 1st Qu.:0.0000
## Mode :character Median :2022-01-01 Median :0.0000
## Mean :2021-12-31 Mean :0.3202
## 3rd Qu.:2022-04-01 3rd Qu.:0.9625
## Max. :2022-07-01 Max. :2.2700
count(bd2, Cliente, sort = TRUE)## Cliente n
## 1 MAHLE 39
## 2 VARROC 39
## 3 MAGNA 13
## 4 PRINTEL 13
ggplot(bd2, aes(x=media_perfo, y=Cliente)) +
geom_bar(stat="identity", fill="orange") + scale_fill_grey() + # Add bars to the plot
labs(title = "Diferencia entre clientes", # Add a title
subtitle = "Dperformance empresa FORM", # Add a subtitle
caption = "Relación", # Add a caption
x = "Diferencia")ggplot(DeliveryBD,aes(x=Fecha, y=Diferencia,color=Cliente))+
geom_line()+ geom_hline(yintercept=0.8000,linetype="dashed",color="black")+
labs(x="Fecha",y="Diferencia por día", color="Legend")+
ggtitle("Diferencia de entrega por Cliente")externa <- read.csv("/Users/mac/Downloads/us_motor_production_and_domestic_sales (2).csv")
summary(externa)## Year Total_Production Production_Passenger_Cars
## Min. :2007 Min. : 5710 Min. :1924
## 1st Qu.:2010 1st Qu.: 8709 1st Qu.:2745
## Median :2014 Median :10823 Median :3382
## Mean :2014 Mean :10077 Mean :3326
## 3rd Qu.:2017 3rd Qu.:11268 3rd Qu.:4061
## Max. :2020 Max. :12179 Max. :4369
## NA's :8 NA's :8 NA's :8
## Production_Commercial_Vehicles Domestic_Sales Sales_Passenger_Cars
## Min. :3514 Min. : 7868 Min. :2560
## 1st Qu.:5820 1st Qu.:10474 1st Qu.:3865
## Median :6891 Median :12583 Median :4542
## Mean :6751 Mean :11996 Mean :4491
## 3rd Qu.:8095 3rd Qu.:13669 3rd Qu.:5184
## Max. :8512 Max. :14128 Max. :5610
## NA's :8 NA's :8 NA's :8
## Sales_Commercial_Vehicles US_Unemployment US_Consumer_Confidence
## Min. : 4309 Min. :3.680 Min. :63.75
## 1st Qu.: 6088 1st Qu.:4.685 1st Qu.:73.02
## Median : 7634 Median :5.980 Median :82.83
## Mean : 7505 Mean :6.430 Mean :82.29
## 3rd Qu.: 8964 3rd Qu.:8.088 3rd Qu.:92.67
## Max. :10133 Max. :9.610 Max. :98.37
## NA's :8 NA's :8 NA's :8
## US_Min_Hour_Wage
## Min. :5.500
## 1st Qu.:7.250
## Median :7.250
## Mean :7.025
## 3rd Qu.:7.250
## Max. :7.250
## NA's :8
regresion <- lm(Production_Commercial_Vehicles ~ US_Unemployment + US_Consumer_Confidence + US_Min_Hour_Wage , data=externa)
summary(regresion)##
## Call:
## lm(formula = Production_Commercial_Vehicles ~ US_Unemployment +
## US_Consumer_Confidence + US_Min_Hour_Wage, data = externa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1198.1 -257.4 109.0 286.7 623.0
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2217.25 2387.79 -0.929 0.3750
## US_Unemployment -226.91 159.03 -1.427 0.1841
## US_Consumer_Confidence 82.82 28.06 2.952 0.0145 *
## US_Min_Hour_Wage 514.11 387.30 1.327 0.2139
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 525.3 on 10 degrees of freedom
## (8 observations deleted due to missingness)
## Multiple R-squared: 0.9082, Adjusted R-squared: 0.8807
## F-statistic: 32.99 on 3 and 10 DF, p-value: 1.692e-05
effect_plot(regresion,pred=US_Consumer_Confidence,interval=TRUE)effect_plot(regresion,pred=US_Unemployment,interval=TRUE)effect_plot(regresion,pred=US_Min_Hour_Wage,interval=TRUE)regresion2 <- lm(Production_Passenger_Cars ~ US_Unemployment + US_Consumer_Confidence + US_Min_Hour_Wage , data=externa)
summary(regresion2)##
## Call:
## lm(formula = Production_Passenger_Cars ~ US_Unemployment + US_Consumer_Confidence +
## US_Min_Hour_Wage, data = externa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1096.8 -600.5 -162.9 763.0 1154.1
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6399.886 4071.397 1.572 0.147
## US_Unemployment -194.101 271.160 -0.716 0.490
## US_Consumer_Confidence -22.272 47.840 -0.466 0.652
## US_Min_Hour_Wage 1.058 660.387 0.002 0.999
##
## Residual standard error: 895.7 on 10 degrees of freedom
## (8 observations deleted due to missingness)
## Multiple R-squared: 0.09057, Adjusted R-squared: -0.1823
## F-statistic: 0.3319 on 3 and 10 DF, p-value: 0.8026
effect_plot(regresion2,pred=US_Consumer_Confidence,interval=TRUE)effect_plot(regresion2,pred=US_Unemployment,interval=TRUE)effect_plot(regresion2,pred=US_Min_Hour_Wage,interval=TRUE)str(externa)## 'data.frame': 22 obs. of 10 variables:
## $ Year : int 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 ...
## $ Total_Production : num 10752 8672 5710 7744 8662 ...
## $ Production_Passenger_Cars : num 3867 3731 2196 2732 2978 ...
## $ Production_Commercial_Vehicles: num 6885 4941 3514 5012 5685 ...
## $ Domestic_Sales : num 12687 10108 7868 9020 10109 ...
## $ Sales_Passenger_Cars : num 5197 4491 3558 3792 4146 ...
## $ Sales_Commercial_Vehicles : num 7490 5617 4309 5229 5963 ...
## $ US_Unemployment : num 4.62 5.8 9.28 9.61 8.93 8.08 7.36 6.16 5.28 4.88 ...
## $ US_Consumer_Confidence : num 85.6 63.8 66.3 71.8 67.3 ...
## $ US_Min_Hour_Wage : num 5.5 6.2 6.9 7.25 7.25 7.25 7.25 7.25 7.25 7.25 ...
describe(externa)## vars n mean sd median trimmed
## Year 1 14 2013.50 4.18 2013.50 2013.50
## Total_Production 2 14 10077.11 1880.71 10822.59 10265.83
## Production_Passenger_Cars 3 14 3326.39 823.81 3382.30 3356.35
## Production_Commercial_Vehicles 4 14 6750.72 1521.04 6890.84 6873.69
## Domestic_Sales 5 14 11995.81 2018.16 12583.17 12162.17
## Sales_Passenger_Cars 6 14 4490.79 918.19 4541.92 4558.45
## Sales_Commercial_Vehicles 7 14 7505.02 1788.05 7634.25 7552.32
## US_Unemployment 8 14 6.43 2.09 5.98 6.39
## US_Consumer_Confidence 9 14 82.29 11.93 82.84 82.50
## US_Min_Hour_Wage 10 14 7.03 0.52 7.25 7.13
## mad min max range skew kurtosis
## Year 5.19 2007.00 2020.00 13.00 0.00 -1.46
## Total_Production 1573.18 5710.29 12179.30 6469.01 -0.83 -0.42
## Production_Passenger_Cars 1020.96 1924.40 4368.84 2444.44 -0.22 -1.58
## Production_Commercial_Vehicles 1824.38 3513.84 8512.03 4998.19 -0.58 -0.88
## Domestic_Sales 1646.83 7867.77 14127.53 6259.76 -0.66 -1.03
## Sales_Passenger_Cars 1042.10 2559.78 5609.88 3050.10 -0.45 -0.97
## Sales_Commercial_Vehicles 2071.49 4309.48 10132.95 5823.47 -0.22 -1.37
## US_Unemployment 2.75 3.68 9.61 5.93 0.18 -1.65
## US_Consumer_Confidence 15.64 63.75 98.37 34.62 -0.14 -1.54
## US_Min_Hour_Wage 0.00 5.50 7.25 1.75 -1.97 2.56
## se
## Year 1.12
## Total_Production 502.64
## Production_Passenger_Cars 220.17
## Production_Commercial_Vehicles 406.52
## Domestic_Sales 539.38
## Sales_Passenger_Cars 245.40
## Sales_Commercial_Vehicles 477.88
## US_Unemployment 0.56
## US_Consumer_Confidence 3.19
## US_Min_Hour_Wage 0.14
externa <- mutate_all(externa, ~replace(., is.na(.), 0))
sum(is.na(externa))## [1] 0
Variable<-c("Year","Total_Production","Production_Passenger_Cars", "Production_Commercial_Vehicles","Domestic_Sales","Sales_Passenger_Cars","Sales_Commercial_Vehicles","US_Unemployment","US_Consumer_Confidence","US_Min_Hour_Wage")
Type<-c("Cualitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa (Continua)", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa")
table<-data.frame(Variable,Type)
knitr::kable(table)| Variable | Type |
|---|---|
| Year | Cualitativa |
| Total_Production | Cuantitativa |
| Production_Passenger_Cars | Cuantitativa |
| Production_Commercial_Vehicles | Cuantitativa |
| Domestic_Sales | Cuantitativa |
| Sales_Passenger_Cars | Cuantitativa (Continua) |
| Sales_Commercial_Vehicles | Cuantitativa |
| US_Unemployment | Cuantitativa |
| US_Consumer_Confidence | Cuantitativa |
| US_Min_Hour_Wage | Cuantitativa |
externa1 <- externa
externa1 <- table(externa1$Total_Production)
externa1 <- prop.table(externa1)
externa## Year Total_Production Production_Passenger_Cars
## 1 2007 10752.31 3867.27
## 2 2008 8672.28 3731.38
## 3 2009 5710.29 2196.45
## 4 2010 7743.75 2731.76
## 5 2011 8662.26 2977.71
## 6 2012 10335.53 4109.01
## 7 2013 11066.50 4368.84
## 8 2014 11661.38 4253.10
## 9 2015 12106.00 4162.81
## 10 2016 12179.30 3916.58
## 11 2017 11178.82 3033.22
## 12 2018 11297.19 2785.16
## 13 2019 10892.88 2511.71
## 14 2020 8821.03 1924.40
## 15 0 0.00 0.00
## 16 0 0.00 0.00
## 17 0 0.00 0.00
## 18 0 0.00 0.00
## 19 0 0.00 0.00
## 20 0 0.00 0.00
## 21 0 0.00 0.00
## 22 0 0.00 0.00
## Production_Commercial_Vehicles Domestic_Sales Sales_Passenger_Cars
## 1 6885.04 12687.02 5197.27
## 2 4940.90 10107.75 4490.86
## 3 3513.84 7867.77 3558.28
## 4 5011.99 9020.09 3791.50
## 5 5684.54 10108.76 4145.96
## 6 6226.52 11581.78 5119.84
## 7 6697.67 12479.31 5433.16
## 8 7408.28 13388.63 5609.88
## 9 7943.20 14127.53 5595.12
## 10 8262.72 13969.12 5145.58
## 11 8145.60 13644.45 4592.97
## 12 8512.03 13711.00 4086.89
## 13 8381.17 13676.87 3543.92
## 14 6896.63 11571.20 2559.78
## 15 0.00 0.00 0.00
## 16 0.00 0.00 0.00
## 17 0.00 0.00 0.00
## 18 0.00 0.00 0.00
## 19 0.00 0.00 0.00
## 20 0.00 0.00 0.00
## 21 0.00 0.00 0.00
## 22 0.00 0.00 0.00
## Sales_Commercial_Vehicles US_Unemployment US_Consumer_Confidence
## 1 7489.75 4.62 85.58
## 2 5616.89 5.80 63.75
## 3 4309.48 9.28 66.26
## 4 5228.59 9.61 71.84
## 5 5962.80 8.93 67.35
## 6 6461.93 8.08 76.54
## 7 7046.15 7.36 79.21
## 8 7778.75 6.16 84.13
## 9 8532.40 5.28 92.94
## 10 8823.54 4.88 91.84
## 11 9051.48 4.36 96.77
## 12 9624.19 3.89 98.37
## 13 10132.95 3.68 95.98
## 14 9011.42 8.09 81.54
## 15 0.00 0.00 0.00
## 16 0.00 0.00 0.00
## 17 0.00 0.00 0.00
## 18 0.00 0.00 0.00
## 19 0.00 0.00 0.00
## 20 0.00 0.00 0.00
## 21 0.00 0.00 0.00
## 22 0.00 0.00 0.00
## US_Min_Hour_Wage
## 1 5.50
## 2 6.20
## 3 6.90
## 4 7.25
## 5 7.25
## 6 7.25
## 7 7.25
## 8 7.25
## 9 7.25
## 10 7.25
## 11 7.25
## 12 7.25
## 13 7.25
## 14 7.25
## 15 0.00
## 16 0.00
## 17 0.00
## 18 0.00
## 19 0.00
## 20 0.00
## 21 0.00
## 22 0.00
table(externa$Total_Production , externa$US_Unemployment)##
## 0 3.68 3.89 4.36 4.62 4.88 5.28 5.8 6.16 7.36 8.08 8.09 8.93 9.28
## 0 8 0 0 0 0 0 0 0 0 0 0 0 0 0
## 5710.29 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 7743.75 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 8662.26 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 8672.28 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 8821.03 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 10335.53 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 10752.31 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 10892.88 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 11066.5 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 11178.82 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 11297.19 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 11661.38 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 12106 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 12179.3 0 0 0 0 0 1 0 0 0 0 0 0 0 0
##
## 9.61
## 0 0
## 5710.29 0
## 7743.75 1
## 8662.26 0
## 8672.28 0
## 8821.03 0
## 10335.53 0
## 10752.31 0
## 10892.88 0
## 11066.5 0
## 11178.82 0
## 11297.19 0
## 11661.38 0
## 12106 0
## 12179.3 0
hist(log(externa$Total_Production), main = "Histograma de Producción Total", xlab="Producción Total",
ylab="Frecuencia", col="green1")ggplot(externa, aes(x=Total_Production, y=Year)) +
geom_point(shape=19, size=3) + labs(title = "Relación entre los Países y la Producción Total",caption ="us_motor_production_and_domestic_sales",x="Producción_Total", y="CASH") + theme_classic()#file.choose("/Users/mac/Downloads/mexico externa.csv")
Mexico<- read_csv("/Users/mac/Downloads/mexico externa.csv")## Rows: 7 Columns: 8
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (8): Fecha, Conf_Consumidor, tasa_inflación, % Pob Desocu, % Pob Ocu, Ve...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
library(forecast)Mexico <- c(3399076,3465615,3933154,3918603,3811068,3040178,3028481)
produccion_st <- ts(data = Mexico, start = c(2015,1), frequency = 1)
produccion_st## Time Series:
## Start = 2015
## End = 2021
## Frequency = 1
## [1] 3399076 3465615 3933154 3918603 3811068 3040178 3028481
modelo <- auto.arima(produccion_st)
modelo## Series: produccion_st
## ARIMA(0,0,0) with non-zero mean
##
## Coefficients:
## mean
## 3513739.3
## s.e. 135784.5
##
## sigma^2 = 1.506e+11: log likelihood = -99.47
## AIC=202.95 AICc=205.95 BIC=202.84
pronostico <- forecast(modelo, level=c(95), h=3)
pronostico## Point Forecast Lo 95 Hi 95
## 2022 3513739 2753205 4274274
## 2023 3513739 2753205 4274274
## 2024 3513739 2753205 4274274
plot(pronostico)#file.choose("/Users/mac/Downloads/us_motor_production_and_domestic_sales (2).csv")
EUA<- read_csv("/Users/mac/Downloads/us_motor_production_and_domestic_sales (2).csv")## Rows: 22 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (10): Year, Total_Production, Production_Passenger_Cars, Production_Comm...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
library(forecast)EUA <- c(10752,8672,5710,7744,8662,10336,11067,11611,12106,12179,11179,11297,10893,8821)
produccion_st1 <- ts(data = EUA, start = c(2007,1), frequency = 1)
produccion_st1## Time Series:
## Start = 2007
## End = 2020
## Frequency = 1
## [1] 10752 8672 5710 7744 8662 10336 11067 11611 12106 12179 11179 11297
## [13] 10893 8821
modelo1 <- auto.arima(produccion_st1)
modelo1## Series: produccion_st1
## ARIMA(0,1,0)
##
## sigma^2 = 2110238: log likelihood = -113.1
## AIC=228.2 AICc=228.57 BIC=228.77
pronostico1 <- forecast(modelo1, level=c(95), h=3)
pronostico1## Point Forecast Lo 95 Hi 95
## 2021 8821 5973.827 11668.17
## 2022 8821 4794.490 12847.51
## 2023 8821 3889.553 13752.45
plot(pronostico1)#file.choose("/Users/mac/Downloads/us_motor_production_and_domestic_sales (2).csv")
EUA1<- read_csv("/Users/mac/Downloads/us_motor_production_and_domestic_sales (2).csv")## Rows: 22 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (10): Year, Total_Production, Production_Passenger_Cars, Production_Comm...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
library(forecast)EUA1 <- c(12687,10108,7868,9020,10109,11582,12479,13389,14128,13969,13644,13711,13677,11571)
produccion_st2 <- ts(data = EUA1, start = c(2007,1), frequency = 1)
produccion_st2## Time Series:
## Start = 2007
## End = 2020
## Frequency = 1
## [1] 12687 10108 7868 9020 10109 11582 12479 13389 14128 13969 13644 13711
## [13] 13677 11571
modelo2 <- auto.arima(produccion_st2)
modelo2## Series: produccion_st2
## ARIMA(0,1,0)
##
## sigma^2 = 1777106: log likelihood = -111.98
## AIC=225.97 AICc=226.33 BIC=226.53
pronostico2 <- forecast(modelo2, level=c(95), h=3)
pronostico2## Point Forecast Lo 95 Hi 95
## 2021 11571 8958.209 14183.79
## 2022 11571 7875.955 15266.04
## 2023 11571 7045.513 16096.49
plot(pronostico2)Conceptos que contribuyen a la identificación de clusters usando analítica de datos.
I. K- Means Clustering
K- means clustering tiene como objetivo agrupar datos con
características similares en el mismo cluster. Uno de los beneficios más
grandes de la herramienta es que se pueden resumir datos de gran
dimensión.
II. Unsupervised Learning
No se asignan etiquetas al algoritmo de aprendizaje, dejándolo solo para
encontrar la estructura en su entrada. El aprendizaje no supervisado
puede ser un fin en sí mismo (descubrir patrones ocultos en los datos) o
un medio para un fin (aprendizaje de funciones).
III. Eucliedean Distance
La distancia Euclidiana es el cálculo de distancia comúnmente utilizado
para medir la distancia entre dos puntos de datos.
Instalar librerias
library(foreign)
library(dplyr) # data manipulation
library(ggplot2) # data visualization
#install.packages("psych")
library(psych) # functions for multivariate analysis
library(corrplot) # correlation plots
#install.packages("jtools")
library(jtools) # presentation of regression analysis
library(lmtest) # diagnostic checks - linear regression analysis
library(car) # diagnostic checks - linear regression analysis
library(factoextra) # provides functions to extract and visualize the output of exploratory multivariate data analyses
#install.packages("ggfortify")
library(ggfortify) # data visualization tools for statistical analysis results
library(plyr)
library(base)
library(tibble)bajasdata <-read.csv("/Users/mac/Downloads/RHBAJASFINAL.csv")
summary(bajasdata)## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Length:237
## Class :character 1st Qu.:23.00 Class :character Class :character
## Mode :character Median :29.00 Mode :character Mode :character
## Mean :30.52
## 3rd Qu.:37.00
## Max. :61.00
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Length:237 Length:237
## Class :character 1st Qu.: 9.00 Class :character Class :character
## Mode :character Median : 21.00 Mode :character Mode :character
## Mean : 83.42
## 3rd Qu.: 49.00
## Max. :1966.00
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
bajasdata1<-bajasdata
bajasdata1<-subset(bajasdata,select = -c(Gen,Fecha_alta,MB,PuestDes,Estado,Nom,Col,Mun,Baja, EstCiv, Días_trab))
summary(bajasdata1)## Edad Sal_IMSS
## Min. : 0.00 Min. :144.4
## 1st Qu.:23.00 1st Qu.:180.7
## Median :29.00 Median :180.7
## Mean :30.52 Mean :178.6
## 3rd Qu.:37.00 3rd Qu.:180.7
## Max. :61.00 Max. :500.0
bajasdata2 <- bajasdata1
bajasdata2 <- bajasdata2 [bajasdata2$Edad> min(1), ]
summary(bajasdata2)## Edad Sal_IMSS
## Min. :18.00 Min. :144.4
## 1st Qu.:23.00 1st Qu.:180.7
## Median :29.00 Median :180.7
## Mean :30.78 Mean :178.6
## 3rd Qu.:37.00 3rd Qu.:180.7
## Max. :61.00 Max. :500.0
bajas_data_norm <- scale(bajasdata2[1:2])fviz_nbclust(bajas_data_norm, kmeans, method="wss")+
geom_vline(xintercept=4, linetype=2)+
labs(subtitle = "Elbow method") edad_cluster1<-kmeans(bajas_data_norm,3)
edad_cluster1## K-means clustering with 3 clusters of sizes 69, 121, 45
##
## Cluster means:
## Edad Sal_IMSS
## 1 0.2811317 0.2784633
## 2 -0.7792176 -0.1288413
## 3 1.6641609 -0.0805373
##
## Clustering vector:
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
## 1 1 2 2 2 3 2 2 3 2 2 1 2 1 1 2 2 2 2 2
## 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
## 2 3 2 1 3 2 1 2 2 2 1 2 2 2 1 2 2 2 1 2
## 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 2 2 2 2 2 2 2 2 3 3 3 3 1 3 2 2 3 2 2 3
## 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
## 2 2 1 2 2 3 2 2 2 2 2 2 1 2 1 2 1 2 2 3
## 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 98 99 100 101
## 2 2 2 2 3 2 3 2 2 2 1 3 3 2 2 2 3 2 2 1
## 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121
## 2 2 3 1 2 2 1 2 1 1 2 1 1 2 1 1 1 3 3 3
## 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141
## 2 2 2 2 2 1 2 1 3 2 1 2 3 2 2 2 1 3 1 3
## 142 143 144 145 146 147 148 150 151 152 153 154 155 156 157 158 159 160 161 162
## 1 1 1 3 3 2 1 1 1 2 2 2 1 3 3 2 1 2 1 3
## 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182
## 3 3 3 1 3 2 2 1 2 2 3 1 3 2 3 1 1 3 1 1
## 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202
## 2 2 2 1 3 3 1 2 2 1 1 1 1 1 1 1 1 2 1 2
## 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222
## 1 1 2 1 3 1 2 2 2 3 2 2 2 1 1 2 2 1 1 1
## 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237
## 2 2 1 2 2 2 2 3 1 3 2 2 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 204.19421 35.55499 17.05330
## (between_SS / total_SS = 45.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
fviz_cluster(edad_cluster1,data=bajas_data_norm)bajasdata3<- bajasdata2
bajasdata3$Clusters<-edad_cluster1$cluster
bajasdata4<-bajasdata3 %>% group_by(Clusters) %>% summarise(Edad=max(Edad)) %>% arrange(desc(Edad))
bajasdata3$Cluster_Names<-factor(bajasdata3$Clusters,levels = c(1,2,3),
labels=c("Adulto", "Joven", "Jubilación"))bajasdata5 <- bajasdata3 %>% dplyr:: group_by(Cluster_Names) %>% dplyr:: summarize(edad_años=max(Edad),
Sal_IMSS=mean(Sal_IMSS),
count=n())clusters<-as.data.frame(bajasdata5)
clusters## Cluster_Names edad_años Sal_IMSS count
## 1 Adulto 40 185.7365 69
## 2 Joven 32 175.3303 121
## 3 Jubilación 61 176.5644 45
ggplot(bajasdata5, aes(x=Cluster_Names,y=edad_años,fill= Cluster_Names,label=round(edad_años,digits=2))) +
geom_col() +
geom_text()ggplot(bajasdata5,aes(x=Cluster_Names,y=Sal_IMSS ,fill= Cluster_Names,label=round(Sal_IMSS,digits=2))) +
geom_col() +
geom_text()ggplot(bajasdata3, aes(x=Cluster_Names, y=Edad, fill=Cluster_Names)) +
geom_boxplot()+
ggtitle("Dispersion of 'Edad' by Clusters Names")ggplot(bajasdata3, aes(x=Cluster_Names, y=Sal_IMSS, fill=Cluster_Names)) +
geom_boxplot()+
ggtitle("Dispersion of 'Salario_Diario' by Clusters Names")RHBAJAS <-read.csv("/Users/mac/Downloads/RHBAJASFINAL.csv")summary(RHBAJAS)## Nom Edad Gen Fecha_alta
## Length:237 Min. : 0.00 Length:237 Length:237
## Class :character 1st Qu.:23.00 Class :character Class :character
## Mode :character Median :29.00 Mode :character Mode :character
## Mean :30.52
## 3rd Qu.:37.00
## Max. :61.00
## MB Días_trab Baja PuestDes
## Length:237 Min. : 0.00 Length:237 Length:237
## Class :character 1st Qu.: 9.00 Class :character Class :character
## Mode :character Median : 21.00 Mode :character Mode :character
## Mean : 83.42
## 3rd Qu.: 49.00
## Max. :1966.00
## Sal_IMSS Col Mun Estado
## Min. :144.4 Length:237 Length:237 Length:237
## 1st Qu.:180.7 Class :character Class :character Class :character
## Median :180.7 Mode :character Mode :character Mode :character
## Mean :178.6
## 3rd Qu.:180.7
## Max. :500.0
## EstCiv
## Length:237
## Class :character
## Mode :character
##
##
##
str(RHBAJAS)## 'data.frame': 237 obs. of 13 variables:
## $ Nom : chr "MARIO VALDEZ ORTIZ" "ISABEL BARRIOS MENDEZ" "MARIA ELIZABETH GOMEZ HERNANDEZ" "ALONDRA ABIGAIL ESCARCIA GOMEZ" ...
## $ Edad : int 32 36 23 21 29 46 29 31 50 19 ...
## $ Gen : chr "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ Fecha_alta: chr "2020-03-09" "2021-11-09" "2021-11-10" "2021-11-10" ...
## $ MB : chr "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" "RENUNCIA VOLUNTARIA" ...
## $ Días_trab : int 628 60 59 59 51 37 37 31 18 224 ...
## $ Baja : chr "2021-11-27" "2022-01-08" "2022-01-08" "2022-01-08" ...
## $ PuestDes : chr "DISEÑO" "AYUDANTE GENERAL" "AYUDANTE GENERAL" "AYUDANTE GENERAL" ...
## $ Sal_IMSS : num 500 152 152 152 152 ...
## $ Col : chr "SAN NICOLAS DE LOS G" "COLINAS DEL AEROPÑUERTO" "PUEBLO NUEVO" "PUEBLO NUEVO" ...
## $ Mun : chr "SAN NICOLAS DE LOS G" "PESQUERIA" "APODACA" "APODACA" ...
## $ Estado : chr "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" "NUEVO LEÓN" ...
## $ EstCiv : chr "SOLTERO" "UNIÓN LIBRE" "CASADO" "SOLTERO" ...
describe(RHBAJAS)## vars n mean sd median trimmed mad min max range
## Nom* 1 237 117.03 67.48 116.00 116.92 85.99 1.00 234 233.00
## Edad 2 237 30.52 10.02 29.00 29.69 10.38 0.00 61 61.00
## Gen* 3 237 1.41 0.49 1.00 1.39 0.00 1.00 2 1.00
## Fecha_alta* 4 237 76.80 37.34 81.00 78.16 45.96 1.00 137 136.00
## MB* 5 237 2.83 1.04 2.00 2.75 0.00 1.00 5 4.00
## Días_trab 6 237 83.42 226.88 21.00 33.08 22.24 0.00 1966 1966.00
## Baja* 7 237 45.59 27.90 46.00 45.31 34.10 1.00 95 94.00
## PuestDes* 8 237 11.35 6.47 9.00 9.92 0.00 1.00 31 30.00
## Sal_IMSS 9 237 178.64 25.44 180.68 179.15 0.00 144.45 500 355.55
## Col* 10 237 57.98 26.64 72.00 59.83 23.72 1.00 98 97.00
## Mun* 11 237 2.76 2.83 1.00 2.27 0.00 1.00 13 12.00
## Estado* 12 237 1.97 0.20 2.00 2.00 0.00 1.00 3 2.00
## EstCiv* 13 237 2.95 1.45 3.00 2.94 2.97 1.00 5 4.00
## skew kurtosis se
## Nom* 0.01 -1.21 4.38
## Edad 0.53 0.16 0.65
## Gen* 0.37 -1.87 0.03
## Fecha_alta* -0.24 -1.11 2.43
## MB* 0.50 -1.50 0.07
## Días_trab 5.33 32.14 14.74
## Baja* 0.02 -1.18 1.81
## PuestDes* 2.00 3.09 0.42
## Sal_IMSS 9.39 111.15 1.65
## Col* -0.64 -0.85 1.73
## Mun* 1.33 0.64 0.18
## Estado* -3.53 19.31 0.01
## EstCiv* 0.05 -1.11 0.09
RHBAJAS1<-RHBAJAS
RHBAJAS1<-subset(RHBAJAS1,select = -c(Gen,Fecha_alta,MB,PuestDes,Estado,Nom,Col,Mun,Baja))
summary(RHBAJAS1)## Edad Días_trab Sal_IMSS EstCiv
## Min. : 0.00 Min. : 0.00 Min. :144.4 Length:237
## 1st Qu.:23.00 1st Qu.: 9.00 1st Qu.:180.7 Class :character
## Median :29.00 Median : 21.00 Median :180.7 Mode :character
## Mean :30.52 Mean : 83.42 Mean :178.6
## 3rd Qu.:37.00 3rd Qu.: 49.00 3rd Qu.:180.7
## Max. :61.00 Max. :1966.00 Max. :500.0
Eliminamos dos reglones que tenian como edad (0)
RHBAJAS2 <- RHBAJAS1
RHBAJAS2 <- RHBAJAS2 [RHBAJAS2$Edad> min(1), ]
summary(RHBAJAS2)## Edad Días_trab Sal_IMSS EstCiv
## Min. :18.00 Min. : 0.00 Min. :144.4 Length:235
## 1st Qu.:23.00 1st Qu.: 9.50 1st Qu.:180.7 Class :character
## Median :29.00 Median : 21.00 Median :180.7 Mode :character
## Mean :30.78 Mean : 84.07 Mean :178.6
## 3rd Qu.:37.00 3rd Qu.: 49.50 3rd Qu.:180.7
## Max. :61.00 Max. :1966.00 Max. :500.0
RH_EDAD_NORM<-scale(RHBAJAS2[1:2])fviz_nbclust(RH_EDAD_NORM, kmeans, method="wss")+
geom_vline(xintercept=4, linetype=2)+
labs(subtitle = "Elbow method") RHEDAD_Cluster1<-kmeans(RH_EDAD_NORM,4)
RHEDAD_Cluster1## K-means clustering with 4 clusters of sizes 43, 107, 5, 80
##
## Cluster means:
## Edad Días_trab
## 1 1.6031879 -0.11611923
## 2 -0.8512555 -0.17238996
## 3 1.2245019 5.86438920
## 4 0.2003094 -0.07353867
##
## Clustering vector:
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
## 4 4 2 2 4 1 4 4 1 2 2 4 2 4 4 2 2 2 2 2
## 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
## 4 3 2 4 1 2 4 2 2 2 4 2 2 2 4 2 2 4 4 2
## 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 2 2 2 2 2 2 2 2 1 1 1 1 4 1 2 2 1 2 2 3
## 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
## 2 2 4 2 2 1 2 2 4 2 2 2 4 2 4 2 4 2 2 1
## 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 98 99 100 101
## 3 2 2 4 1 2 1 2 2 2 4 1 1 2 2 4 1 4 2 4
## 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121
## 2 2 1 4 2 2 4 3 4 4 2 4 4 2 4 4 4 1 1 1
## 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141
## 2 2 2 2 2 4 2 4 1 2 4 2 1 2 4 2 4 1 4 1
## 142 143 144 145 146 147 148 150 151 152 153 154 155 156 157 158 159 160 161 162
## 4 4 1 1 1 2 4 4 4 2 2 2 4 1 1 2 4 2 4 1
## 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182
## 1 1 1 4 1 2 2 4 2 2 1 4 1 2 1 4 4 1 4 4
## 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202
## 2 2 2 4 1 3 4 2 2 4 4 4 4 4 4 4 4 2 4 4
## 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222
## 4 4 2 4 1 4 2 2 2 1 2 2 2 4 4 2 2 4 4 4
## 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237
## 2 2 4 2 2 2 4 1 4 1 2 2 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 19.40753 15.18543 18.67351 39.82387
## (between_SS / total_SS = 80.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
fviz_cluster(RHEDAD_Cluster1,data=RH_EDAD_NORM)RHBAJAS3 <- RHBAJAS2
RHBAJAS3$Clusters<-RHEDAD_Cluster1$cluster
RHBAJAS4<-RHBAJAS3 %>% group_by(Clusters) %>% summarise(Edad=max(Edad)) %>% arrange(desc(Edad))
RHBAJAS3$Cluster_Names<-factor(RHBAJAS3$Clusters,levels = c(1,2,3,4),
labels=c("Adulto", "Principiante", "Mayor", "Juvenil"))RHBAJAS6 <- RHBAJAS3 %>% group_by(Cluster_Names) %>% dplyr:: summarize(edad_años=max(Edad),
Días_trab=mean(Días_trab),
Count=n())clusters<-as.data.frame(RHBAJAS6)
clusters## Cluster_Names edad_años Días_trab Count
## 1 Adulto 57 57.62791 43
## 2 Principiante 27 44.81308 107
## 3 Mayor 61 1419.60000 5
## 4 Juvenil 39 67.32500 80
ggplot(RHBAJAS6,aes(x=reorder(Cluster_Names,Count),y=Count,fill=Cluster_Names)) +
geom_bar(stat="identity")ggplot(RHBAJAS6, aes(x=Cluster_Names,y=edad_años,fill= Cluster_Names,label=round(edad_años,digits=2))) +
geom_col() +
geom_text()ggplot(RHBAJAS6,aes(x=Cluster_Names,y=Días_trab,fill= Cluster_Names,label=round(Días_trab,digits=2))) +
geom_col() +
geom_text()ggplot(RHBAJAS3, aes(x=Cluster_Names, y=Edad, fill=Cluster_Names)) +
geom_boxplot()+
ggtitle("Edad (Dispersion)")Durante esta actividad realizamos un análisis en la base de datos de Recursos Humanos, enfocados en las variables de Edad, Salario y Días Trabajados, por lo que se decidió definir varios pasos a seguir para llegar al objetivo deseado que era finalmente llegar a la construcción de los clusters.
Tomando en cuenta los hallazgos de la edad y el salario diario, se llego a la conclusión de lo siguiente:
Hay más bajas de adultos con el rango de edades de 41 a 61, el cuál se identifico como jubilación.
Los adultos de 33-40 años ganan más con un sueldo diario de 186.16 en promedio.
De igual manera podemos observar cuatro Clusters que toman en cuenta la edad y los días laborados:
El grupo que cuenta con más días laborados es el de edad máxima,
siendo los adultos, de igual manera estos cuentan con un salario
mayor.
Por último podemos observar que en los gráficos que se analizan con
estas variables tenemos los siguientes puntos a consideración:
- Edad Máxima
- Días Laborados Máximos
- Recuento de los grupos que presentan mayor actividad en la
empresa.
- La dispersión de edad que existe entre cada uno de los grupos.
PRODUCCION: El cliente con mayor piezas programadas siendo YANFENG tiene un tiempo de calidad de 1 minuto, siendo un tiempo muy pegado al tiempo mínimo de calidad. A diferencia del cliente VL-017-1486 quien tiene casi la mitad de piezas programadas en comparación con YANFENG y tiene un tiempo de calidad muy alto lo que se puede inferir que el paquete tiene un márgen de error muy alto.
RH: En promedio la mayor parte de los colaboradores de Form tienen una edad de entre 20 y 30 años, hay empleadas que tienen un máximo de 56 años mientras que hay un empleado que pasa ya de los 60 años de edad. Entre hombres y mujeres están en un rango de 20 a 40 años de edad
El saldo promedio tanto para hombres como para mujeres ronda en un monto de 170 y 180 pesos, pero hay una empleada que llega a un salario diario de 441 pesos, duplicando el saldo promedio de la mayor parte de los empleados de la compañía.
En cuanto a solteros y casados la mujer tiene un salario más elevado que el de los hombres.
MERMA:En Mayo y Agosto se pudo identificar que eran los meses con mayor cantidad de merma, por lo que se realizó un análisis a los kilos a partir de los registros mostrados en la base de datos, por otro lado se realizó un pronostico en donde quisimos saber la futura merma que se obtendrían en los siguientes meses.
DELIVERY PLAN: Hella es aquel cliente con mayor cantidad de unidades programadas y además de eso cuenta con algunos outliers muy por encima de la median, seguido por TRMX el cual no cuenta con outliers. Con estos datos se podría realizar un modelo bastante acertado ya que se cuenta con muchos registros, los cuales probablemente si usamos TRMX sean aún más certeros para próximas unidades programadas del mismo cliente.
SCRAP: En Agosto 2021 se pudo identificar que el promedio de chatarra que se generaron estuvieron en promedio por debajo de las 20 “toneladas”
El área donde más se genera desperdicio es en SAB/Pre-Production.
Describir con tus propias palabras los términos Business Analytics y Business Intelligence. Así también, identificar y describir 3 principales diferencias entre Business Analytics y Business Intelligence.
Business Analytics: Es un enfoque de analisis de datos dentro de un empresa, el cual se enfoca en datos historcios o actuales que buscan comprender el desempeño que la empresa esta experimentando para satisfacer las necesidades del negocio, lograr metas y alcanzar objetivos.
Business Inteligence: Se enfoca principalmente en lo que es la toma de decisiones utilizando los datos recabados en el proceso de business analytics, ademas, son herramientas BI que permiten generar reportes, paneles, tablas y graficos para obtener un analisis que genere insights del rendimiento del negocio.
Diferencias:
Business intelligence se enfoca principalmente en lo que es la toma de decisiones utilizando los datos recabados en el proceso de business analytics.
Business analytics se encarga principalmente de procesos como la minería de datos en los cuales se clasifican los datos relevantes de las bases de datos.
Se realizan predicciones mediante modelos estadísticos, optimizaciones y por último la visualización de estos datos.
Describir con tus propias palabras el concepto de Indicador Clave de Rendimiento / Key Performance Indicators (KPI).
Key Performance Indicators (KPI): Los KPI’s son indicadores de rendimiento que miden el desempeño de las operaciones de cualquier empresa, en pocas palabras los KPI’s son las mediciones de salud para el negocio.
Los KPI son utilizados por diversas ventajas:
A partir del análisis de las bases de datos de las diferentes áreas de la empresa FORM, proponer y describir 3 posibles KPIs que permitan evaluar el desempeño de algunas de sus áreas.