Ana Cristina Arvizu Ponce - A01412220
2022-09-28
## Referencia Fecha Producto Cantidad
## Length:251 Length:251 Length:251 Min. : 0.00
## Class :character Class :character Class :character 1st Qu.: 1.00
## Mode :character Mode :character Mode :character Median : 2.00
## Mean : 13.34
## 3rd Qu.: 7.00
## Max. :1674.00
## Unidad.de.medida Ubicación.de.origen Ubicación.de.desecho Estado
## Length:251 Length:251 Length:251 Length:251
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## 'data.frame': 251 obs. of 8 variables:
## $ Referencia : chr "agosto 2022 (250)" "SP/08731" "SP/08730" "SP/08729" ...
## $ Fecha : chr "" "2022-08-31 14:55:40" "2022-08-31 14:49:25" "2022-08-31 13:49:29" ...
## $ Producto : chr "" "[BACKFRAME 60% CUELLO ARMADO] 18805. 60% Backframe. Cuello Armado." "[N61506747 CAJA] N61506747. Kit. Caja." "[N61506729 SEPARADOR] N61506729. Kit. Separador." ...
## $ Cantidad : num 1674 2 1 1 31 ...
## $ Unidad.de.medida : chr "" "Unidad(es)" "Unidad(es)" "Unidad(es)" ...
## $ Ubicación.de.origen : chr "" "SAB/Calidad/Entrega de PT" "SAB/Calidad/Entrega de PT" "SAB/Calidad/Entrega de PT" ...
## $ Ubicación.de.desecho: chr "" "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" ...
## $ Estado : chr "" "Hecho" "Hecho" "Hecho" ...
## vars n mean sd median trimmed mad min max
## Referencia* 1 251 126.00 72.60 126 126.00 93.40 1 251
## Fecha* 2 251 126.00 72.60 126 126.00 93.40 1 251
## Producto* 3 251 45.20 24.83 46 44.94 26.69 1 96
## Cantidad 4 251 13.34 105.90 2 3.95 1.48 0 1674
## Unidad.de.medida* 5 251 2.00 0.06 2 2.00 0.00 1 2
## Ubicación.de.origen* 6 251 3.47 0.86 4 3.60 0.00 1 4
## Ubicación.de.desecho* 7 251 2.00 0.06 2 2.00 0.00 1 2
## Estado* 8 251 2.00 0.06 2 2.00 0.00 1 2
## range skew kurtosis se
## Referencia* 250 0.00 -1.21 4.58
## Fecha* 250 0.00 -1.21 4.58
## Producto* 95 0.01 -0.80 1.57
## Cantidad 1674 15.37 237.90 6.68
## Unidad.de.medida* 1 -15.65 244.02 0.00
## Ubicación.de.origen* 3 -1.11 -0.62 0.05
## Ubicación.de.desecho* 1 -15.65 244.02 0.00
## Estado* 1 -15.65 244.02 0.00
Variable<-c("Referencia","Fecha","Producto","Cantidad","Unidad.de.medida", "Ubicación.de.origen","Ubicación.de.desecho","Estado")
Type<-c("Cualitativa","Cuantitativa continua", "Cualitativa", "Cuantitativa continua", "Cualitativa", "Cualitativa","Cualitativa","Cualitativa")
table<-data.frame(Variable,Type)
knitr::kable(table)| Variable | Type |
|---|---|
| Referencia | Cualitativa |
| Fecha | Cuantitativa continua |
| Producto | Cualitativa |
| Cantidad | Cuantitativa continua |
| Unidad.de.medida | Cualitativa |
| Ubicación.de.origen | Cualitativa |
| Ubicación.de.desecho | Cualitativa |
| Estado | Cualitativa |
Variable<-c("Referencia","Fecha","Producto","Cantidad","Unidad.de.medida", "Ubicación.de.origen","Ubicación.de.desecho","Estado")
Type<-c("Cualitativa","Cuantitativa continua", "Cualitativa", "Cuantitativa continua", "Cualitativa", "Cualitativa","Cualitativa","Cualitativa")
Escala_de_Medición <- c("Nominal","Intervalo","Nominal","Discreta","Nominal", "Nominal","Nominal", "Nominal")
table<-data.frame(Variable,Type,Escala_de_Medición)
knitr::kable(table)| Variable | Type | Escala_de_Medición |
|---|---|---|
| Referencia | Cualitativa | Nominal |
| Fecha | Cuantitativa continua | Intervalo |
| Producto | Cualitativa | Nominal |
| Cantidad | Cuantitativa continua | Discreta |
| Unidad.de.medida | Cualitativa | Nominal |
| Ubicación.de.origen | Cualitativa | Nominal |
| Ubicación.de.desecho | Cualitativa | Nominal |
| Estado | Cualitativa | Nominal |
-Técnica 1. Remover valores irrelevantes
Eliminar columnas
La base de datos contenía Referencia de Form, sin embargo, para nuestro análisis que estamos realizando no es importante por lo que utilizamos la función de subset para eliminar la columna.
## 'data.frame': 251 obs. of 7 variables:
## $ Fecha : chr "" "2022-08-31 14:55:40" "2022-08-31 14:49:25" "2022-08-31 13:49:29" ...
## $ Producto : chr "" "[BACKFRAME 60% CUELLO ARMADO] 18805. 60% Backframe. Cuello Armado." "[N61506747 CAJA] N61506747. Kit. Caja." "[N61506729 SEPARADOR] N61506729. Kit. Separador." ...
## $ Cantidad : num 1674 2 1 1 31 ...
## $ Unidad.de.medida : chr "" "Unidad(es)" "Unidad(es)" "Unidad(es)" ...
## $ Ubicación.de.origen : chr "" "SAB/Calidad/Entrega de PT" "SAB/Calidad/Entrega de PT" "SAB/Calidad/Entrega de PT" ...
## $ Ubicación.de.desecho: chr "" "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" "Virtual Locations/Scrapped" ...
## $ Estado : chr "" "Hecho" "Hecho" "Hecho" ...
-Técnica 2. Errores tipográficos y errores similares
Cantidades en enteros Es importante para nuestro análisis que la base de datos las cantidades estuvieran enteros ya que se tratan de cantidad de piezas de cierto producto por lo que para que el análisis sea congruente se deben tener enteros.
## Fecha Producto Cantidad Unidad.de.medida
## Length:251 Length:251 Min. : 0.00 Length:251
## Class :character Class :character 1st Qu.: 1.00 Class :character
## Mode :character Mode :character Median : 2.00 Mode :character
## Mean : 13.35
## 3rd Qu.: 7.00
## Max. :1675.00
## Ubicación.de.origen Ubicación.de.desecho Estado
## Length:251 Length:251 Length:251
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
Librerías requeridas
library(foreign)
library(dplyr) # data manipulation
library(forcats) # to work with categorical variables
library(ggplot2) # data visualization
library(janitor) # data exploration and cleaning
#install.packages("psych")
library(corrplot) # correlation plots
library(lmtest) # diagnostic checks - linear regression analysis
library(car) # diagnostic checks - linear regression analysis| Var1 | Freq |
|---|---|
| 1 | |
| SAB/Calidad/Entrega de PT | 58 |
| SAB/Post-Production | 13 |
| SAB/Pre-Production | 179 |
Se puede observar que la mayor parte de desecho se encuentra en Pre-producción, mientras que en Post-producción es el que tiene menor número de desecho.
pie(prop.table(table(bd2$Ubicación.de.origen)),col=c("pink","blue","orange"),main="Ubicacion de origen de merma", ylab =" ",las=1)bd3<-group_by(bd2,Cantidad)%>%tally()
plot(bd3$n, xlab = "Scrap", ylab = "N", main = "Cantidad de merma" )En esta base de datos podemos observar variables relacionadas con los
desechos (scrap) que tiene la empresa en un cierto tiempo, ademas
tenemos variables como de donde sale el desecho y donde se encuentra
dentro de la fábrica, con el análisis estadistíco que realizamos pudimos
observar que el 100% de los desechos ya se encuentran en la ubicación
donde tiene que estar por el estado de hecho, tambien
observamos que dentro de la fábrica de Form en el área donde se generan
mas desechos en pre-producción y despues en calidad y entrega.
La recomendacion para Form es implementar una
estrategia en la cual se centre en Pre-producción de como reducir el
merma y implementar un área dentro de la empresa de innovavción en
procesos para que en estas etapas se obtenga el menor desecho
posible.