“MERMA”

“Ana Arvizu- A01412220”

“2022-09-28”

JuveR

Escoger la base datos

# file.choose()
bd <- read.csv("C:\\Users\\sofia\\OneDrive\\Documentos\\RETO\\FORM - Merma.csv")
resumen <- summary(bd)
resumen
##     Fecha               Mes                Kilos     
##  Length:50          Length:50          Min.   : 790  
##  Class :character   Class :character   1st Qu.:3178  
##  Mode  :character   Mode  :character   Median :3925  
##                                        Mean   :3709  
##                                        3rd Qu.:4232  
##                                        Max.   :6140

1.¿Cuántas variables y cuántos registros tiene la base de datos?

R= 60 registros y 3 variables
# install.packages("psych")
str(bd)
## 'data.frame':    50 obs. of  3 variables:
##  $ Fecha: chr  "11/01/2022" "11/01/2022" "22/01/2022" "22/01/2022" ...
##  $ Mes  : chr  "ENERO" "ENERO" "ENERO" "ENERO" ...
##  $ Kilos: int  5080 3810 2990 2680 3650 4380 3870 3590 3410 3930 ...
library(psych)
describe(bd)
##        vars  n    mean      sd median trimmed    mad min  max range  skew
## Fecha*    1 50   22.52   12.00   24.5   22.68  14.83   1   42    41 -0.09
## Mes*      2 50    4.60    2.60    4.0    4.53   2.97   1    9     8  0.21
## Kilos     3 50 3708.52 1023.99 3925.0 3798.65 541.15 790 6140  5350 -0.94
##        kurtosis     se
## Fecha*    -1.17   1.70
## Mes*      -1.35   0.37
## Kilos      1.65 144.81

2.¿Clasifica cada variable en cualitativa, cuantitativa discreta o cuantitativa continua.?

Variable<-c("Fecha","Mes","Kilos")
Type<-c("Cuantitativa continua","Cualitativa", "Cuantitativa continua")
table<-data.frame(Variable,Type)
knitr::kable(table)
Variable Type
Fecha Cuantitativa continua
Mes Cualitativa
Kilos Cuantitativa continua

3. Elige la escala de medición de cada variable.

Variable<-c("Fecha","Mes","Kilos")
Type<-c("Cuantitativa continua","Cualitativa", "Cuantitativa continua")
Escala_de_Medición <- c("Razon","Ordinal","Razon")
table<-data.frame(Variable,Type,Escala_de_Medición)
knitr::kable(table)
Variable Type Escala_de_Medición
Fecha Cuantitativa continua Razon
Mes Cualitativa Ordinal
Kilos Cuantitativa continua Razon

Técnicas de limpieza

-Técnica 1. Convertir tipos de datos.

Convertir de caracter a fecha

library(tibble)
bd1 <- bd
bd1$Fecha <- as.Date(bd1$Fecha, format = "%d/%m/%Y")
tibble (bd1)
## # A tibble: 50 × 3
##    Fecha      Mes     Kilos
##    <date>     <chr>   <int>
##  1 2022-01-11 ENERO    5080
##  2 2022-01-11 ENERO    3810
##  3 2022-01-22 ENERO    2990
##  4 2022-01-22 ENERO    2680
##  5 2022-02-18 FEBRERO  3650
##  6 2022-02-18 FEBRERO  4380
##  7 2022-02-18 FEBRERO  3870
##  8 2022-02-18 FEBRERO  3590
##  9 2022-02-18 FEBRERO  3410
## 10 2022-02-24 FEBRERO  3930
## # … with 40 more rows

-Técnica 2. Remover valores irrelevantes.

Eliminar columnas

bd2 <- bd1
bd2 <- subset (bd2, select = -c (Mes))
summary (bd2)
##      Fecha                Kilos     
##  Min.   :2022-01-11   Min.   : 790  
##  1st Qu.:2022-03-12   1st Qu.:3178  
##  Median :2022-05-24   Median :3925  
##  Mean   :2022-05-25   Mean   :3709  
##  3rd Qu.:2022-08-10   3rd Qu.:4232  
##  Max.   :2022-09-21   Max.   :6140

Borar todos los registros NA de una tabla

bd3 <- bd2
bd3 <- na.omit(bd3)
summary(bd3)
##      Fecha                Kilos     
##  Min.   :2022-01-11   Min.   : 790  
##  1st Qu.:2022-03-12   1st Qu.:3178  
##  Median :2022-05-24   Median :3925  
##  Mean   :2022-05-25   Mean   :3709  
##  3rd Qu.:2022-08-10   3rd Qu.:4232  
##  Max.   :2022-09-21   Max.   :6140

Análisis estadístico descriptivo.

Librerías requeridas

library(foreign)
library(dplyr)        # data manipulation 
library(forcats)      # to work with categorical variables
library(ggplot2)      # data visualization 
library(janitor)      # data exploration and cleaning 
#install.packages("psych")
library(corrplot)     # correlation plots
library(lmtest)       # diagnostic checks - linear regression analysis 
library(car)          # diagnostic checks - linear regression analysis

Grafica de frecuencia

bd3$Fecha<- as.Date(bd3$Fecha,format = "%d/%m/%Y")
plot(bd3$Fecha, bd3$Kilos)

Gráficos de datos cualitativos y cuantitativos

Kilos <- data.frame(bd3$Fecha,bd3$Kilos)
colnames(Kilos)<-c('Fecha','Kilos')

ggplot(data = Kilos, aes (x=Fecha, y=Kilos)) +
  geom_bar(stat = "identity", fill="Orange") + scale_fill_grey() + 
  labs(title = "Cantidad en kg de merma", 
       x = "2022")

Gráficos de dispersión

qqnorm(bd3$Kilos, main="Grafica de dispersion", ylab="KG de merma",col='Orange')
qqline(bd3$Kilos, col='Orange')

Reflexión

En esta base de datos, se presentaban los kilogramos de merma que se han producido durante el 2022, lo que se analizó con los gráficos estadísticos fueron que el mes en el que se presentó mas merma fue en marzo, al contrario del mes de abril que fue el mes menos merma tuvo.
La propuesta para Form, es realizar una estrategia con los colaboradores en ciertos meses como marzo con mayor merma, incentivar a todos los colaboradores a ahorrar lo más posible, asi como implemntar KPI’S específicos para este tema, ya que asi ayudará a la empresa a generar mayores ingresos y menores pérdidas.