ENTREGABLE 2.4 (Colaborativo). Base de datos: Scrap
#file.choose()
scrap <- read.csv("/Users/dannaperez/Desktop/Reto Evidencia 2/Base de datos/FORM1 - Scrap.csv")
Se eliminaron las variables que no nos dejan información valiosa para la empresa y solo se dejaron aquellas que sean de utilidad.
sum(is.na(scrap))
## [1] 0
No hay NA´s en la base de datos.
summary(scrap)
## Fecha Cant Ubi.origen
## Length:249 Min. : 1.000 Length:249
## Class :character 1st Qu.: 1.000 Class :character
## Mode :character Median : 2.000 Mode :character
## Mean : 6.727
## 3rd Qu.: 7.000
## Max. :96.000
scr1 <- scrap
scr1$Fecha <- as.Date(scr1$Fecha, format = "%d/%m/%Y")
summary(scr1)
## Fecha Cant Ubi.origen
## Min. :2022-08-01 Min. : 1.000 Length:249
## 1st Qu.:2022-08-11 1st Qu.: 1.000 Class :character
## Median :2022-08-19 Median : 2.000 Mode :character
## Mean :2022-08-17 Mean : 6.727
## 3rd Qu.:2022-08-25 3rd Qu.: 7.000
## Max. :2022-08-31 Max. :96.000
write.csv(scr1, file = "SCRAP_LIMPIA.csv", row.names = FALSE)
Promedio <- (mean(scr1$Cant))
Promedio
## [1] 6.726908
Moda <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
Moda1 <- Moda(scr1$Cant)
Moda1
## [1] 1
mediana <- median(scr1$Cant)
mediana
## [1] 2
varianza <- var(scr1$Cant)
varianza
## [1] 140.7477
desviacion <- sqrt(varianza)
desviacion
## [1] 11.86371
Variable <- c("Cantidad")
Promedio <- c("6.726")
Moda <- c("1")
Mediana <- c("2")
Varianza <- c("140.747")
Desviación_Estándar <- c("11.863")
tabla <-data.frame(Variable,Promedio, Moda, Mediana, Varianza, Desviación_Estándar)
knitr::kable(tabla)
| Variable | Promedio | Moda | Mediana | Varianza | Desviación_Estándar |
|---|---|---|---|---|---|
| Cantidad | 6.726 | 1 | 2 | 140.747 | 11.863 |
La tabla con estadísticas descriptivas se hizo en torno a la variable de “cantidad”. El promedio de productos por orden es de 7 unidades y la mayoría de las órdenes son de 1 unidad. La desviación estándar no es muy alta por lo que se puede inferir que las órdenes tienen un número de unidades similares entre ellas y su rango es entre 1-96 unidades.
library(ggplot2)
ggplot(scr1, aes(x=Fecha, y=Cant, colour=Ubi.origen)) + geom_point()
Al observar de primera vista la gráfica se puede ver que muchos de los pedidos están en pre-producción ya que hay una mayor cantidad de puntos azules en toda la gráfica. Los pedidos casi siempre son de menos de 25 unidades y muy pocos pedidos llegan a pasar esta cantidad de unidades. Pedidos con más de 25 unidades siempre están en pre-producció, por otro lado, Post producción y entrega de PT están en órdenes menores de 25 unidades.