Análisis de matriz de confusión e indicadores del modelo
El presente análisis tiene como objetivo evaluar una técnica de clasificación aplicada al dataset Taxi Kal. La variable objetivo utilizada fue Output1, donde el valor 0 representa taxis en estado Funcionando y el valor 1 representa taxis con Fallas.
Para evaluar el desempeño del modelo se elaboró una matriz de confusión, la cual compara los valores reales con los valores predichos por la clasificación.
| Real / Predicho | Predicho 0 Funcionando |
Predicho 1 Fallas |
|---|---|---|
| Real 0 Funcionando |
276 | 31 |
| Real 1 Fallas |
64 | 28 |
76.19%
47.46%
30.43%
37.09%
La matriz de confusión muestra que el modelo clasificó correctamente 276 taxis como funcionando y 28 taxis como fallas. Estos valores se encuentran en la diagonal principal de la matriz, por lo que representan las predicciones correctas.
Por otro lado, el modelo cometió 31 falsos positivos, es decir, taxis que realmente estaban funcionando, pero fueron clasificados como fallas. También se presentaron 64 falsos negativos, que corresponden a taxis que realmente tenían fallas, pero fueron clasificados como funcionando.
El indicador Accuracy fue de 76.19%, lo cual significa que el modelo clasificó correctamente aproximadamente 76 de cada 100 registros. Sin embargo, el Recall fue de 30.43%, indicando que el modelo todavía tiene dificultad para identificar correctamente todos los taxis que presentan fallas.
En conclusión, el modelo de clasificación presenta un desempeño aceptable a nivel general, ya que obtiene un accuracy de 76.19%. Sin embargo, se observa que el modelo identifica mejor los taxis que se encuentran funcionando que aquellos que presentan fallas. Por ello, sería recomendable mejorar la regla de clasificación o aplicar una técnica más avanzada para reducir los falsos negativos, ya que estos representan un riesgo operativo al clasificar como funcionando a taxis que realmente presentan fallas.