ENTREGABLE 2.4 (Colaborativo). Base de datos: Scrap

#file.choose()
scrap <- read.csv("/Users/dannaperez/Desktop/Reto Evidencia 2/Base de datos/FORM1 - Scrap.csv") 

Limpieza, Transformación, y Organización de Bases de Datos

Se eliminaron las variables que no nos dejan información valiosa para la empresa y solo se dejaron aquellas que sean de utilidad.

Missing values

sum(is.na(scrap))
## [1] 0

No hay NA´s en la base de datos.

Cambio de formato a la variable de fecha

summary(scrap)
##     Fecha                Cant         Ubi.origen       
##  Length:249         Min.   : 1.000   Length:249        
##  Class :character   1st Qu.: 1.000   Class :character  
##  Mode  :character   Median : 2.000   Mode  :character  
##                     Mean   : 6.727                     
##                     3rd Qu.: 7.000                     
##                     Max.   :96.000
scr1 <- scrap
scr1$Fecha <- as.Date(scr1$Fecha, format = "%d/%m/%Y")
summary(scr1)
##      Fecha                 Cant         Ubi.origen       
##  Min.   :2022-08-01   Min.   : 1.000   Length:249        
##  1st Qu.:2022-08-11   1st Qu.: 1.000   Class :character  
##  Median :2022-08-19   Median : 2.000   Mode  :character  
##  Mean   :2022-08-17   Mean   : 6.727                     
##  3rd Qu.:2022-08-25   3rd Qu.: 7.000                     
##  Max.   :2022-08-31   Max.   :96.000

Exportar base de datos limpia

write.csv(scr1, file = "SCRAP_LIMPIA.csv", row.names = FALSE)  

Análisis Exploratorio de las Bases de Datos

Cálculos

Promedio

Promedio <- (mean(scr1$Cant))
Promedio
## [1] 6.726908

Moda

Moda <- function(x) {
  ux <- unique(x)    
  ux[which.max(tabulate(match(x, ux)))]      
}    
Moda1 <- Moda(scr1$Cant)
Moda1
## [1] 1

Mediana

mediana <- median(scr1$Cant)
mediana
## [1] 2

Varianza

varianza <- var(scr1$Cant)
varianza
## [1] 140.7477

Deviación Estándar

desviacion <- sqrt(varianza)
desviacion
## [1] 11.86371

Tabla con estadísticas descriptivas

Variable <- c("Cantidad")
Promedio <- c("6.726")
Moda <- c("1")
Mediana <- c("2")
Varianza <- c("140.747")
Desviación_Estándar <- c("11.863")
tabla <-data.frame(Variable,Promedio, Moda, Mediana, Varianza, Desviación_Estándar)
knitr::kable(tabla)
Variable Promedio Moda Mediana Varianza Desviación_Estándar
Cantidad 6.726 1 2 140.747 11.863

Análisis

La tabla con estadísticas descriptivas se hizo en torno a la variable de “cantidad”. El promedio de productos por orden es de 7 unidades y la mayoría de las órdenes son de 1 unidad. La desviación estándar no es muy alta por lo que se puede inferir que las órdenes tienen un número de unidades similares entre ellas y su rango es entre 1-96 unidades.

Dispersion plots

library(ggplot2)
ggplot(scr1, aes(x=Fecha, y=Cant, colour=Ubi.origen)) + geom_point()

Análisis de la gráficaa

Al observar de primera vista la gráfica se puede ver que muchos de los pedidos están en pre-producción ya que hay una mayor cantidad de puntos azules en toda la gráfica. Los pedidos casi siempre son de menos de 25 unidades y muy pocos pedidos llegan a pasar esta cantidad de unidades. Pedidos con más de 25 unidades siempre están en pre-producció, por otro lado, Post producción y entrega de PT están en órdenes menores de 25 unidades.

LS0tCnRpdGxlOiA8c3BhbiBzdHlsZT0iQ29sb3I6T3JhbmdlIj4gIkVudHJlZ2FibGUyLjRfU2NyYXAiCmF1dGhvcjogIkRhbmEgUGVyZXogLSBBMDAyMjcwNDEiCmRhdGU6ICIxMC8zLzIwMjIiCm91dHB1dDogCiAgaHRtbF9kb2N1bWVudDogCiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQoKLS0tCgoKKipFTlRSRUdBQkxFIDIuNCAoQ29sYWJvcmF0aXZvKS4gQmFzZSBkZSBkYXRvczogU2NyYXAqKgpgYGB7cn0KI2ZpbGUuY2hvb3NlKCkKc2NyYXAgPC0gcmVhZC5jc3YoIi9Vc2Vycy9kYW5uYXBlcmV6L0Rlc2t0b3AvUmV0byBFdmlkZW5jaWEgMi9CYXNlIGRlIGRhdG9zL0ZPUk0xIC0gU2NyYXAuY3N2IikgCmBgYAoKIyBMaW1waWV6YSwgVHJhbnNmb3JtYWNpw7NuLCB5IE9yZ2FuaXphY2nDs24gZGUgQmFzZXMgZGUgRGF0b3MKU2UgZWxpbWluYXJvbiBsYXMgdmFyaWFibGVzIHF1ZSBubyBub3MgZGVqYW4gaW5mb3JtYWNpw7NuIHZhbGlvc2EgcGFyYSBsYSBlbXByZXNhIHkgc29sbyBzZSBkZWphcm9uIGFxdWVsbGFzIHF1ZSBzZWFuIGRlIHV0aWxpZGFkLgoKIyMgTWlzc2luZyB2YWx1ZXMKYGBge3J9CnN1bShpcy5uYShzY3JhcCkpCmBgYApObyBoYXkgTkHCtHMgZW4gbGEgYmFzZSBkZSBkYXRvcy4KCiMjIENhbWJpbyBkZSBmb3JtYXRvIGEgbGEgdmFyaWFibGUgZGUgZmVjaGEKYGBge3J9CnN1bW1hcnkoc2NyYXApCnNjcjEgPC0gc2NyYXAKc2NyMSRGZWNoYSA8LSBhcy5EYXRlKHNjcjEkRmVjaGEsIGZvcm1hdCA9ICIlZC8lbS8lWSIpCnN1bW1hcnkoc2NyMSkKYGBgCgojIEV4cG9ydGFyIGJhc2UgZGUgZGF0b3MgbGltcGlhIApgYGB7cn0Kd3JpdGUuY3N2KHNjcjEsIGZpbGUgPSAiU0NSQVBfTElNUElBLmNzdiIsIHJvdy5uYW1lcyA9IEZBTFNFKSAgCmBgYAoKIyBBbsOhbGlzaXMgRXhwbG9yYXRvcmlvIGRlIGxhcyBCYXNlcyBkZSBEYXRvcwojIyBDw6FsY3Vsb3MgCiMjIyBQcm9tZWRpbwpgYGB7cn0KUHJvbWVkaW8gPC0gKG1lYW4oc2NyMSRDYW50KSkKUHJvbWVkaW8KYGBgCgojIyMgTW9kYQpgYGB7cn0KTW9kYSA8LSBmdW5jdGlvbih4KSB7CiAgdXggPC0gdW5pcXVlKHgpICAgIAogIHV4W3doaWNoLm1heCh0YWJ1bGF0ZShtYXRjaCh4LCB1eCkpKV0gICAgICAKfSAgICAKTW9kYTEgPC0gTW9kYShzY3IxJENhbnQpCk1vZGExCmBgYAoKIyMjIE1lZGlhbmEKYGBge3J9Cm1lZGlhbmEgPC0gbWVkaWFuKHNjcjEkQ2FudCkKbWVkaWFuYQpgYGAKCiMjIyBWYXJpYW56YQpgYGB7cn0KdmFyaWFuemEgPC0gdmFyKHNjcjEkQ2FudCkKdmFyaWFuemEKYGBgCgojIyMgRGV2aWFjacOzbiBFc3TDoW5kYXIKYGBge3J9CmRlc3ZpYWNpb24gPC0gc3FydCh2YXJpYW56YSkKZGVzdmlhY2lvbgpgYGAKCiMjIFRhYmxhIGNvbiBlc3RhZMOtc3RpY2FzIGRlc2NyaXB0aXZhcwpgYGB7cn0KVmFyaWFibGUgPC0gYygiQ2FudGlkYWQiKQpQcm9tZWRpbyA8LSBjKCI2LjcyNiIpCk1vZGEgPC0gYygiMSIpCk1lZGlhbmEgPC0gYygiMiIpClZhcmlhbnphIDwtIGMoIjE0MC43NDciKQpEZXN2aWFjacOzbl9Fc3TDoW5kYXIgPC0gYygiMTEuODYzIikKdGFibGEgPC1kYXRhLmZyYW1lKFZhcmlhYmxlLFByb21lZGlvLCBNb2RhLCBNZWRpYW5hLCBWYXJpYW56YSwgRGVzdmlhY2nDs25fRXN0w6FuZGFyKQprbml0cjo6a2FibGUodGFibGEpCmBgYAoKIyMgQW7DoWxpc2lzCkxhIHRhYmxhIGNvbiBlc3RhZMOtc3RpY2FzIGRlc2NyaXB0aXZhcyBzZSBoaXpvIGVuIHRvcm5vIGEgbGEgdmFyaWFibGUgZGUgImNhbnRpZGFkIi4gRWwgCnByb21lZGlvIGRlIHByb2R1Y3RvcyBwb3Igb3JkZW4gZXMgZGUgNyB1bmlkYWRlcyB5IGxhIG1heW9yw61hIGRlIGxhcyDDs3JkZW5lcyBzb24gZGUgMSB1bmlkYWQuCkxhIGRlc3ZpYWNpw7NuIGVzdMOhbmRhciBubyBlcyBtdXkgYWx0YSBwb3IgbG8gcXVlIHNlIHB1ZWRlIGluZmVyaXIgcXVlIGxhcyDDs3JkZW5lcyB0aWVuZW4gCnVuIG7Dum1lcm8gZGUgdW5pZGFkZXMgc2ltaWxhcmVzIGVudHJlIGVsbGFzIHkgc3UgcmFuZ28gZXMgZW50cmUgMS05NiB1bmlkYWRlcy4gCgojIERpc3BlcnNpb24gcGxvdHMKYGBge3J9CmxpYnJhcnkoZ2dwbG90MikKZ2dwbG90KHNjcjEsIGFlcyh4PUZlY2hhLCB5PUNhbnQsIGNvbG91cj1VYmkub3JpZ2VuKSkgKyBnZW9tX3BvaW50KCkKYGBgCgojIyBBbsOhbGlzaXMgZGUgbGEgZ3LDoWZpY2FhCkFsIG9ic2VydmFyIGRlIHByaW1lcmEgdmlzdGEgbGEgZ3LDoWZpY2Egc2UgcHVlZGUgdmVyIHF1ZSBtdWNob3MgZGUgbG9zIHBlZGlkb3MgZXN0w6FuIGVuIHByZS1wcm9kdWNjacOzbiB5YSBxdWUgaGF5IHVuYSBtYXlvciBjYW50aWRhZApkZSBwdW50b3MgYXp1bGVzIGVuIHRvZGEgbGEgZ3LDoWZpY2EuIExvcyBwZWRpZG9zIGNhc2kgc2llbXByZSBzb24gZGUgbWVub3MgZGUgMjUgdW5pZGFkZXMgeSBtdXkgcG9jb3MgcGVkaWRvcyBsbGVnYW4gYSBwYXNhciBlc3RhIApjYW50aWRhZCBkZSB1bmlkYWRlcy4gUGVkaWRvcyBjb24gbcOhcyBkZSAyNSB1bmlkYWRlcyBzaWVtcHJlIGVzdMOhbiBlbiBwcmUtcHJvZHVjY2nDsywgcG9yIG90cm8gbGFkbywgIFBvc3QgcHJvZHVjY2nDs24geSBlbnRyZWdhIGRlIFBUCmVzdMOhbiBlbiDDs3JkZW5lcyBtZW5vcmVzIGRlIDI1IHVuaWRhZGVzLiAKCgo=