General
Sucursal
|
Volatilidad SLA
|
Máx SLA
|
Mín SLA
|
Mediana
|
BHI
|
0.1968333
|
0.981
|
0.337
|
0.8090
|
COR
|
0.1284420
|
0.991
|
0.388
|
0.9690
|
RAF
|
0.0163998
|
0.999
|
0.909
|
0.9900
|
RCU
|
0.0851386
|
0.999
|
0.339
|
0.9840
|
RDI
|
0.0375445
|
0.997
|
0.747
|
0.9850
|
ROS
|
0.0855564
|
0.997
|
0.465
|
0.9905
|
SFN
|
0.0589408
|
0.997
|
0.581
|
0.9840
|
VMA
|
0.1146156
|
0.997
|
0.260
|
0.9885
|
ZUL
|
0.0144724
|
0.999
|
0.903
|
0.9930
|
Según los datos de SLA del último trimestre, se observa volatilidad
en los niveles de servicio en Bahía Blanca (BHI),
Córdoba (COR) y Villa María (VMA). Al
ser las sucursales con mayor desvío operativo hace que
el riesgo de incumplimiento sea alto en fechas de alta demanda. Entre
estas tres Sucursales se concentra el 37% de la distribución de Mercado
Libre, COR representa un share de 19%, BHI 12% y VMA 6%
respectivamente.
Por otro lado, estan las sucursales de Azul (ZUL),
Rafaela (RAF) y Sarandí (GBAS) cuyo
nivel de varianza en los niveles de servicio es bajo, por lo que
estan en mejor condición de afrontar eventos de mayor
demanda. Estas sucursales concentran un 24% de participación:
RDI 11%, ZUL 7% y RAF 6%.
Se pasara a un detalle por sucursal de las principales casuísticas de
desvíos a través de los distintos indicadores que hoy acompañan a la
operación para control de los interno del SLA de Meli.

Árboles de Casuística
1. Córdoba (COR)
El Ausentismo es el indicador que mejor explica la variabilidad en el
SLA en COR, para lograr un SLA óptimo del 98% este indicador el
Ausentismo NP no debe superar el 3.3% y Reencaminado debe ser menor al
1.5%. A su vez, Un Ausentismo por encima del punto de corte (20%) deriva
en un SLA promedio de 59%.
1.1. Ranking de Indicadores
1.2. Estimación del árbol
2. Bahía Blanca (BHI)

2.1. Ranking de Indicadores
2.2. Estimación del árbol
3. Villa María (VMA)

3.1. Ranking de Indicadores
3.2. Estimación del árbol
4. Río Cuarto (RCU)

4.1. Ranking de Indicadores
5. Rosario (ROS)

5.1. Ranking de Indicadores
6. Rafaela (RAF)

6.1. Ranking de Indicadores
7. Azul (ZUL)

7.1. Ranking de Indicadores
8. Sarandí (RDI)

8.1. Ranking de Indicadores
8.2. Estimación del árbol
9. Santa Fe (SFN)

9.1. Ranking de Indicadores
9.2. Estimación del árbol
GridSearch
## [,1]
## error_cor 0.06161054
## error_bhi 0.26891462
## error_vma 0.14440632
## error_rcu 0.12776663
## error_ros 0.14954527
## error_raf 0.13876944
## error_zul 0.14139168
## error_rdi 0.13513099
## error_sfn 0.13092494

---
title: "Análisis de Sucursales Meli"
author: "Customer Intelligence"
output:
  html_document:
    toc: yes
    code_folding: show
    toc_float: yes
    df_print: paged
    theme: united
    code_download: yes
  pdf_document:
    toc: yes
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
setwd("C:/Users/ander/Desktop")
```

<br>
<br>

# General

<br>

```{r, echo=FALSE, warning=FALSE,message=FALSE, include=FALSE}
t0  <- Sys.time()
dataset <- read.csv("https://docs.google.com/spreadsheets/d/e/2PACX-1vToHtN27DYPhSu4Lhr_58wu1-5YT527CB0FRtx1ysM0T18yFTHHAgFwRXYxsEEzcnjz7sJkuwpTd0H3/pub?gid=325123974&single=true&output=csv")
t1  <- Sys.time()
delta  <- as.numeric(  t1 - t0, units = "secs")  #calculo la diferencia de tiempos
print(delta) #imprimo
```

```{r, echo=FALSE, warning=FALSE,message=FALSE, include=FALSE}

library( "data.table") 
library(MASS)
library("leaps") 
library(stringr)
library(zoo)


df <- fread("https://docs.google.com/spreadsheets/d/e/2PACX-1vToHtN27DYPhSu4Lhr_58wu1-5YT527CB0FRtx1ysM0T18yFTHHAgFwRXYxsEEzcnjz7sJkuwpTd0H3/pub?gid=325123974&single=true&output=csv")


df2 <- data.frame(t(df)) #Trasponer Dataset
colnames(df2) <- df2[2,] #Tomar la 2da fila como nombre de columnas
df2 <- df2[-1:-2,] #sacar 1ra y 2da columna


df2 <- df2[111:nrow(df2),] #filtrar desde la fila 111 
colnames(df2)[1] <- "Fecha" #cambiar nombre de 1ra columna
colnames(df2)[2] <- "new_col2" #cambiar nombre de 2dacolumna
df2 <- as.data.table(df2) #convertir objeto en un data table



df2[ ,filtrar := ifelse (new_col2 %like% "Total",1,0)]
df2 <-  df2[filtrar==0]

#==Eliminar columnas inutiles======================================


df2[ ,':='(new_col2 = NULL, KPI = NULL, "CITACION TRANSPORTISTAS" = NULL,"ERROR ABSOLUTO FORECAST" = NULL,"ISSUE LOG" = NULL,Troncales = NULL, "Caidas sap.tms otros." = NULL, Gremios = NULL,"Corte luz, internet otros." = NULL,DESPACHOS = NULL,"% Vehiculos despachados por hora"=NULL, TRONCALES=NULL,"Cantidad de troncales totales"=NULL, "% USO POD" = NULL, "Hora espera promedio"= NULL, "Total troncales Ocasa con envíos Meli"=NULL,   "Troncales Ocasa demorados (envíos Meli)"=NULL, "Adhesión a la programacion"=NULL, "DESVIO CAPACIDAD vs RECIBIDO"=NULL, "DESVIO FORECAST vs VOL. RECIBIDO"=NULL,"PROBABILIDAD DE FLOTA"=NULL,
"EQUIPOS POR RECORRIDO"=NULL,"CAPACIDAD AJUSTADA"=NULL, `AdhesiC3n a la programacion`=NULL)] 



#==Eliminar registros vacios========================================


df2 <- df2[ ,1:18]
df2 <- df2[!(SLA==""|SLA=="-"),]
df2 <- df2[SUCURSAL!=""]
df2 <- df2[Fecha!=""]

#==Formato de numeros================================================

df2[ ,SLA:=as.numeric(str_c("0.",str_sub(SLA,1,2),str_sub(SLA,4,5)))]
df2[ ,':='( FORECAST = as.numeric(FORECAST),
            CAPACIDAD = as.numeric(CAPACIDAD),
           `VOLUMEN RECIBIDO`= as.numeric(`VOLUMEN RECIBIDO`),
           `ENTREGADO FV`= as.numeric(str_c("0.",str_sub(`ENTREGADO FV`,1,2),str_sub(`ENTREGADO FV`,4,5))), 
            BACKLOG = as.numeric(BACKLOG),
            Citados=as.numeric(Citados), `No citados`= as.numeric(`No citados`), Confirmados = as.numeric(Confirmados),
            Ausentismo = as.numeric(str_sub(Ausentismo,1,3))/100,
           `Ausentismo NP` = as.numeric(str_sub(`Ausentismo NP`,1,3))/100,
           `Parada Media`= as.numeric(`Parada Media`),
           `Horas trabajadas`= as.numeric(str_sub(`Horas trabajadas`,1,1)) + as.numeric(str_sub(`Horas trabajadas`,-2,-1))/60,
           `Bultos por parada`= as.numeric(`Bultos por parada`),
           `Km por parada`= as.numeric(`Km por parada`),
            Reencaminado=as.numeric(str_sub(Reencaminado,1,3))/100)]

#--Feature--------------------------------

df2[is.na(df2)] = 0
df2[ , desvio_capacidad := (`VOLUMEN RECIBIDO`/CAPACIDAD)]
df2[ , desvio_forecast := (`VOLUMEN RECIBIDO`/FORECAST)]
df2[ , ID := index(df2)]
#df2[ , Volumen_No_Citado := (`VOLUMEN RECIBIDO`/`No citados`)]
#df2[ , Volumen_Presentes := (`VOLUMEN RECIBIDO`/Confirmados)]
#df2[ , Volumen_Presentes := (`VOLUMEN RECIBIDO`/Citados)]
#df2[ , Presentes := (Citados*Ausentismo)]
df2[ , `Horas trabajadas vs Km` := (`Km por parada`/`Horas trabajadas`)]
df2[ , Fecha := as.Date((str_c("2022",str_sub(Fecha,4,5),str_sub(Fecha,1,2))), "%Y%m%d")]
df2[ ,':='(CAPACIDAD=NULL,FORECAST=NULL)]
df2[ ,':='(Confirmados=NULL,'No citados'=NULL, Citados=NULL)]

#--Lags----------------------------------------


cols_lagueables  <- copy(  setdiff( colnames(df2), c("Fecha", "SUCURSAL","ID")  ) )

#ordeno el dataset por <numero_de_cliente, foto_mes> para poder hacer lags
#  es MUY  importante esta linea
setorder( df2, SUCURSAL, ID )

#creo los campos lags de orden 1
df2[ , paste0( cols_lagueables, " (t-1)") := shift(.SD, 1, NA, "lag"),
           .SDcols= cols_lagueables ]


#df2[, SLA_clase := ifelse(SLA>=0.97,"SLA>0.97", 
#                          ifelse(SLA<0.97&SLA>=0.90,"SLA>=0.90", 
#                                 ifelse(SLA<0.90,"SLA<=0.89",0)))]

df2[, SLA_clase := ifelse(SLA>=0.97,"Cumplimiento (SLA 0.97)","Incumplimiento")]
#df2[, SLA_clase := ifelse(SLA>=0.97,"SLA>0.97", "SLA<0.97")]
df2[, SLA_lag1:= (`SLA (t-1)`=NULL)]


dir.create( "C:/Users/ander/Desktop",  showWarnings = FALSE ) 
dir.create( "./exp/FE7150/", showWarnings = FALSE )
setwd("C:/Users/ander/Desktop")
fwrite( df2,
        "dataset_7130.csv",
        logical01= TRUE,
        sep= "," )

as.data.frame(colnames(df2))

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5}

# Libraries
library(tidyverse)
library(hrbrthemes)
library(viridis)
library(plotly)
#install.packages("kableExtra")
library(kableExtra)


# create a dataset
data <- as.data.frame(df2[SUCURSAL!="LPG"])
colnames(data)[2]<- "Sucursal"

tab01<- data %>% group_by(Sucursal) %>% summarise('Volatilidad SLA'=sd(SLA), 'Máx SLA' = max(SLA),'Mín SLA' = min(SLA), Mediana=median(SLA)) %>% arrange(desc('Volatilidad SLA'))

# Tabla

kbl(tab01) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "responsive"),
    full_width = F,
    position = "float_right"
  ) %>%
  column_spec(1, color = "black", bold = TRUE) %>%
  column_spec(
    2,
    color = "white",
    background = spec_color(1:10, end = 0.9, option = "3", direction = 1),
    popover = paste(tab01[, 1])
  )

```

Según los datos de SLA del último trimestre, se observa volatilidad en los niveles de servicio en **Bahía Blanca (BHI)**, **Córdoba (COR)** y **Villa María (VMA)**. Al ser las **sucursales con mayor desvío operativo** hace que el riesgo de incumplimiento sea alto en fechas de alta demanda. Entre estas tres Sucursales se concentra el 37% de la distribución de Mercado Libre, COR representa un share de 19%, BHI 12% y VMA 6% respectivamente.

Por otro lado, estan las sucursales de **Azul (ZUL)**, **Rafaela (RAF)** y **Sarandí (GBAS)** cuyo nivel de varianza en los niveles de servicio es bajo, por lo que **estan en mejor condición de afrontar eventos de mayor demanda**. Estas sucursales concentran un 24% de participación: RDI 11%, ZUL 7% y RAF 6%.

Se pasara a un detalle por sucursal de las principales casuísticas de desvíos a través de los distintos indicadores que hoy acompañan a la operación para control de los interno del SLA de Meli.

<br> 
<br>

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=11, fig.height=6}
# Multi-linea

data <- as.data.frame(df2[SUCURSAL!="LPG"])
tmp <- data %>%
  mutate(name2=SUCURSAL)

    ggplot(tmp, aes(x=ID, y=SLA)) +
    geom_line( data=tmp %>% dplyr::select(-SUCURSAL), aes(group=name2), color="grey", size=0.7, alpha=0.5) +
    geom_line( aes(color = SUCURSAL), color= "#2caf92", size=1.03 )+
    scale_color_viridis(discrete = TRUE) +
    #theme_bw() +
    labs(title = "Trend diario del SLA", subtitle = "Periodo 18 Ago - 6 Dic") +
    theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none") +
 
   xlab( " Tendencia diaria SLA")+
   
    facet_wrap(~SUCURSAL)

```

<br>

```{r, echo=FALSE, warning=FALSE,message=FALSE,fig.width=10, fig.height=5, include=FALSE}

library(ggridges)
library(ggplot2)
library(viridis)
library(hrbrthemes)

# Plot
g<-ggplot(data, aes(x = SLA, y = SUCURSAL, fill = SLA)) +
  geom_density_ridges_gradient(scale = 3, rel_min_height = 0.001)+
   ggtitle("Dispersión por Sucursal del SLA (ago:nov)") +
   scale_fill_viridis_c() +
  theme_ipsum(grid_col = "grey") +
    theme(
      legend.position="none",
      panel.spacing = unit(0.2, "lines"),
      strip.text.x = element_text(size = 2)
    ) 
  
g
```

```{r, echo=FALSE, warning=FALSE,message=FALSE}

#cargo librerias
library("data.table")
library("ROCR")
library("rpart")
library("rpart.plot")
library("caret")


sucursal = c("COR","BHI","VMA","ROS","RDI","RCU","SFN","RAF", "ZUL")

cor <- df2[SUCURSAL=="COR",]
cor <- cor[2:nrow(cor) ,1:ncol(cor) ]
cor <- as.data.frame(cor[ , ':=' ( ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


bhi <- df2[SUCURSAL=="BHI",]
bhi <- bhi[2:nrow(bhi) ,1:ncol(bhi) ]
bhi <- as.data.frame(bhi[ , ':=' ( ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


vma <- df2[SUCURSAL=="VMA",]
vma <- vma[2:nrow(vma) ,1:ncol(vma) ]
vma <- as.data.frame(vma[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


ros <- df2[SUCURSAL=="ROS",]
ros <- ros[2:nrow(ros) ,1:ncol(ros) ]
ros <- as.data.frame(ros[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


rdi <- df2[SUCURSAL=="RDI",]
rdi <- rdi[2:nrow(rdi) ,1:ncol(rdi) ]
rdi <- as.data.frame(rdi[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


rcu <- df2[SUCURSAL=="RCU",]
rcu <- rcu[2:nrow(rcu) ,1:ncol(rcu) ]
rcu <- as.data.frame(rcu[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


sfn <- df2[SUCURSAL=="SFN",]
sfn <- sfn[2:nrow(sfn) ,1:ncol(sfn) ]
sfn <- as.data.frame(sfn[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


raf <- df2[SUCURSAL=="RAF",]
raf <- raf[2:nrow(raf) ,1:ncol(raf) ]
raf <- as.data.frame(raf[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


zul <- df2[SUCURSAL=="ZUL",]
zul <- zul[2:nrow(zul) ,1:ncol(zul) ]
zul <- as.data.frame(zul[ , ':=' (ID=NULL, "SLA_clase"=NULL,"BACKLOG"=NULL, "SLA (t-1)"=NULL)])


```

<br>

<br>

# Árboles de Casuística

## 1.  Córdoba (COR)

<br>

El Ausentismo es el indicador que mejor explica la variabilidad en el SLA en COR, para lograr un SLA óptimo del 98% este indicador el Ausentismo NP no debe superar el 3.3% y Reencaminado  debe ser menor al 1.5%. A su vez, Un Ausentismo por encima del punto de corte (20%) deriva en un SLA promedio de 59%. 

<br>

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-cor
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_cor<- sqrt(mean(prediccion$Error2))
```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```
<br>

#### **1.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **1.2.** Estimación del árbol



```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```




```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```
<br>
<br>





## 2. Bahía Blanca (BHI)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-bhi
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  6 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_bhi<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **2.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **2.2.** Estimación del árbol



```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```

<br>
<br>

## 3. Villa María (VMA)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-vma
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_vma<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **3.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **3.2.**  Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```

<br>
<br>

## 4. Río Cuarto (RCU)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-rcu
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_rcu<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **4.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **4.2.**Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```

<br>
<br>

## 5. Rosario (ROS)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-ros
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  4 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_ros<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **5.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **5.2.**Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```

<br>
<br>

## 6. Rafaela (RAF)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-raf
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_raf<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **6.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **6.2.**Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```

<br>
<br>

## 7. Azul (ZUL)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-zul
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_zul<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **7.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **7.2.**Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```

<br>
<br>

## 8. Sarandí (RDI)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-rdi
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_rdi<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **8.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **8.2.** Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```


<br>
<br>

## 9. Santa Fe (SFN)

```{r, echo=FALSE, warning=FALSE,message=FALSE}


data <-sfn
data_model <- data[3:ncol(data)]

modelo   <-  rpart( "SLA~ .", #quiero predecir clase_ternaria a partir de el resto de las variables
             data = data_model,  #los datos donde voy a entrenar
             xval=      0,
             cp=        0,   #esto significa no limitar la complejidad de los splits
             minsplit=  4,     #minima cantidad de registros para que se haga el split
             minbucket= 4,     #tamaño minimo de una hoja
             maxdepth=  5 )    #profundidad maxima del arbol




prediccion <- predict(modelo, data)
prediccion <- as.data.frame(prediccion)
prediccion <- as.data.frame(cbind(prediccion,data$Fecha,data$SLA, (prediccion-cor$SLA)^2))
colnames(prediccion)[2] <- "Fecha"
colnames(prediccion)[3] <- "SLA_real"
colnames(prediccion)[4] <- "Error2"

error_sfn<- sqrt(mean(prediccion$Error2))

```


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=5.5}

#-   Error promedio:$`r sqrt(mean(prediccion$Error2))`$

library(tibble)
library(ggplot2)


#  Arbol generado

rpart.plot(modelo, 
                    # show fitted class, probs, percentages
           box.palette = "GnBu", # color scheme
           branch.lty = 3,       # dotted branch lines
           shadow.col = "grey",  # shadows under the node boxes
           nn = TRUE)            # display the node numbers 



```


#### **9.1.** Ranking de Indicadores


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=8, fig.height=4.5}
# Importancia
importancia_pred <- modelo$variable.importance %>%
                    enframe(name = "predictor", value = "importancia")

# Gráfico
p2<- ggplot(
  data = importancia_pred,
  aes(x    = reorder(predictor, importancia),
      y    = importancia,
      fill = importancia)
) +  theme(panel.grid = element_blank(),
          axis.text.x = element_blank(),
          axis.ticks.x = element_blank(),
          panel.background = element_blank(),
          panel.grid.major = element_blank(),
          legend.position="none")+
geom_col() +
coord_flip() +
theme_classic() + 
labs(x = NULL, y="Importancia")


ggplotly(p2)

```

<br>


#### **9.2.** Estimación del árbol


```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}

#--Graficos de Linea-----------------------------

plot_ly() %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$SLA_real, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~prediccion$Fecha, y = ~prediccion$prediccion, name = "SLA Predict", fill = 'tozeroy',color="1") %>%
  layout(xaxis = list(title = 'Fecha (Dia)'),
         yaxis = list(title = 'SLA'))
      

```

```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=10, fig.height=2.5}


#--Graficos de densidad-----------------------------

SLA <- prediccion$SLA_real
SLA_predict <- prediccion$prediccion
densidad.SLA <- density(prediccion$SLA_real, na.rm = TRUE)
densidad.SLA_predict<- density(prediccion$prediccion, na.rm = TRUE)


plot_ly() %>%
  add_lines(x = ~densidad.SLA$x, y = ~densidad.SLA$y, name = "SLA real", fill = 'tozeroy',color="9") %>%
  add_lines(x = ~densidad.SLA_predict$x, y = ~densidad.SLA_predict$y, name = "SLA Predict", fill = 'tozeroy',color="1")%>%
  layout(xaxis = list(title = 'SLA'),
         yaxis = list(title = 'Densidad'))

```


## GridSearch

```{r echo=FALSE, message=FALSE, warning=FALSE}


#==Funcion de costos===============================================================


data <- bhi
dtrain <-data[3:ncol(data)]
dtest <-data[3:ncol(data)]


# Funcion que entrena el arbol y luego determina la ganancia sobre el set de test
modelo_rpart_ganancia = function( ptrain, ptest, pmaxdepth, pminbucket, pminsplit, pcp )
{

  modelo   <-  rpart("SLA ~ .",   data = ptrain,  xval=0, maxdepth=pmaxdepth, minbucket=pminbucket, minsplit=pminsplit, cp=pcp)

  #aplico el modelo a datos nuevos
  testing_prediccion  <- predict(modelo, ptest)
  testing_prediccion <- as.data.frame(testing_prediccion)
  testing_prediccion <- as.data.frame(cbind(testing_prediccion,data$Fecha,data$SLA, (testing_prediccion-data$SLA)^2))
  colnames(testing_prediccion)[2] <- "Fecha"
  colnames(testing_prediccion)[3] <- "SLA_real"
  colnames(testing_prediccion)[4] <- "Error2"
    
  return(sqrt(mean(testing_prediccion$Error2)))
  

}
     

#--GridSearch--------------------------------------------------------

#Cuenta los modelos probados
linea <- 1

#Establece una ganancia inicial muy baja a superar
min_error <- 0.3

#For anidados para grid search 
for( vcp in c( 0, 0.01, 0.001)) #Complexity Factor
for( vmaxdepth in  2:15 ) #max Depth
for( vminsplit in  4:15 ) #Min Split
for( vminbucket  in 4:15 ) #Min Bucket
{ 

    #Muestra los parametros a testear
    #message(paste('Intentando',vcp,vminsplit,vminbucket,vmaxdepth))
    #Llama a la funcion que entrena el modelo y calcula la ganancia para esos parametros
    res <- modelo_rpart_ganancia( dtrain, dtest, 
                                  pmaxdepth=vmaxdepth, pminbucket=vminbucket, pminsplit=vminsplit, pcp=vcp )

  
    #Verifica si se supero la mejor ganancia hasta el momento. En caso de haberla superado graba los hiperparametros nuevos
    if (res<min_error) {
      min_error <- res
      message(paste("Nuevo Error Min: ", res*100, vcp,vminsplit,vminbucket,vmaxdepth))
      pcp<-vcp
      pminsplit<-vminsplit
      pminbucket<-vminbucket
      pmaxdepth<-vmaxdepth
  }
  #Muestra al ganancia de la iteracion
  #message(paste('Error:',res*100,'Error Minimo',min_error*100))
    
  linea <- linea+1


}
         
#paste("Nuevo Error Min: ", res*100, vcp,vminsplit,vminbucket,vmaxdepth)
```

```{r echo=FALSE, message=FALSE, warning=FALSE}

error <- rbind(error_cor,error_bhi,error_vma,error_rcu,error_ros,error_raf,error_zul,error_rdi,error_sfn)
error
```
```{r, echo=FALSE, warning=FALSE,message=FALSE, fig.width=15, fig.height=15}
# Data: numeric variables of the native mtcars dataset
data <- as.data.table(df2[ , c(3:18)])
data <- data[, ':='(ID=NULL, `SLA (t-1)`=NULL)]
data <- as.data.frame(data)

# Plot
library(PerformanceAnalytics)

chart.Correlation(data, histogram = TRUE, method = "pearson")
```

