background-image: url(img/background_pointer.png) background-size: contain ??? Comentarios --- # Preliminar Variables consideradas - Litros consumidos - Gasto de Combustible por Tiempo de Operación (l/hr) - Rendimiento (km/l) - Tiempo de Ralentí durante la Operación - Eventos de Aceleración - CO2 Emitido Estimado (g/km) - EcoScore Filtros aplicados - Tiempo de Operacion > 0 & LitrosConsumidos > 0 - Rendimiento > 0.1 y Rendimiento < 12 --- # Correlación entre las variables <img src="img/pearson_correlation.png" style="width: 70%" /> ??? Vemos que las variables CO2 Estimado y Rendimiento tienen una alta correlación, que tiene sentido, ya que el CO2 estimado depende de los litros consumidos y los kilometros recorridos Lo conveniente es remover una del análisis, ya que explican lo mismo. En este caso se quitó Rendimiento, ya que la otra variable queda --- # Modelado Se trabajó para generar un modelo de regresión lineal enfocado en dos variables - Litros consumidos - Gasto de Combustible por Tiempo de Operación Después de varios ajustes y pruebas, se llegó a un modelo que explicara `Litros Consumidos` sin tomar en cuenta la variable de `Rendimiento`. Este resultó con una R = 0.7532899 ??? ¿A qué me refiero con esto? Como son variables similares, busqué generar un modelo que simulara su comportamiento --- # Importancia de las variables Hasta ahora, se estuvo trabajando para entender la información y el comportamiento del consumo de litros. Pero la meta final es generar un Score que no permita mostrar esto usando las variables del modelo. R cuenta con un algoritmo que nos dice la importancia de cada variable explicativa en un modelo. En este caso, tenemos la siguiente tabla
??? Cabe mencionar que estos valores están escalados, la variable más importante va a tener 100 y la menos importante va a tener 0, pero sigue importando en el modelo Estos valores se toman en cuenta para el cálculo de peso de la fórmula --- # Fórmula Puntos que se siguieron para crear la fórmula - Las variables con importancia menor a 5 se les asignó un peso de 10 - El resto de las variables se siguio la siguiente fórmula `$$W_i = 80\frac{I_i}{\sum_{i=1}^n}$$` `\(i\)` es el índice de la variable y `\(n\)` es el total de variables, en este caso son 3. Se pone 80 porque se le asignó un peso de 10 a dos variables, con importancia menor a 5 ---
--- class: center, middle Lo que nos dejaría con la fórmula siguiente `$$ES = 43.24(CO_2) + 18.5(GC) + 18.26(EA) + 10(ES_S) + 10(R)$$` o si prefieren, podemos ajustar un poco la fórmula a `$$ES_A = 40(CO_2) + 20(GC) + 20(EA) + 10(ES_S) + 10(R)$$` ??? CO2: CO2 emitido estimado por km GC: Score de gasto de combustible por tiempo de operación EA: Score de eventos de aceleración ES_S: Eco Score de la sábana R: Ralentí obtenido durante la operación --- class: middle Las variables que ven en la fórmula serían los scores de estas, por ejemplo: - Para `\(CO_2\)`, vamos a tomar las normas establecidas, que dictan que no se debe de emitir más de 160 g de dióxido de carbono por kilometro recorrido - Entonces las unidades que estén por debajo irán teniendo calificaciones menores a 6 (reprobados) y las que no pasen el límite tendrán calificaciones aprobatorias - Se multiplica por 40 esa calificación y de ahí obtemos el 40% del total del Eco Score