Análisis con Árbol de Decisión sobre el dataset Taxi_Kal.xlsx. Matriz de confusión e indicadores de precisión.
El modelo predijo Funcionando y el vehículo realmente funcionaba. Aciertos en la clase negativa.
El modelo predijo Fallas pero el vehículo funcionaba correctamente. Error de tipo I.
El modelo predijo Funcionando pero el vehículo tenía fallas. Error de tipo II — el más crítico operativamente.
El modelo predijo Fallas y el vehículo efectivamente las tenía. Aciertos en la clase de interés.
El modelo acierta en casi 8 de cada 10 predicciones. Sin embargo, este valor puede ser engañoso porque el dataset es desbalanceado (307 Funcionando vs. 92 Fallas). Un modelo que prediga siempre "Funcionando" ya tendría ~77% de exactitud.
El modelo no detecta 17 de los 26 vehículos con fallas reales (Falsos Negativos). Operativamente, esto significa que un taxi con problemas mecánicos pasa desapercibido, lo cual es el error más costoso y peligroso en este contexto.
El modelo identifica correctamente el 91.5% de los vehículos que funcionan bien. Solo 8 de 94 casos sin fallas fueron clasificados erróneamente como problemáticos (Falsos Positivos).
El F1-Score bajo refleja que el modelo tiene dificultad para la clase minoritaria (Fallas). Se recomienda aplicar técnicas de balanceo de clases (SMOTE, class_weight='balanced') o ajustar el umbral de decisión para mejorar la detección de fallas.