Criterio 4 · Caso aplicado en clase

Clasificación de
Fallas en Taxis

Análisis con Árbol de Decisión sobre el dataset Taxi_Kal.xlsx. Matriz de confusión e indicadores de precisión.

Algoritmo: Decision Tree
Variable objetivo: Output1 (Fallas)
Split: 70% train / 30% test
n = 399 registros
399
Total registros
6
Variables predictoras
279
Train (70%)
120
Test (30%)
307
Funcionando
92
Con Fallas
A — Matriz de Confusión
Valor Real
PRED: 0
Funcionando
PRED: 1
Fallas
REAL: 0
Func.
86
VN — Verdadero Negativo
8
FP — Falso Positivo
REAL: 1
Fallas
17
FN — Falso Negativo
9
VP — Verdadero Positivo
Valor Predicho por el Modelo
VN = 86 — Verdadero Negativo

El modelo predijo Funcionando y el vehículo realmente funcionaba. Aciertos en la clase negativa.

FP = 8 — Falso Positivo

El modelo predijo Fallas pero el vehículo funcionaba correctamente. Error de tipo I.

FN = 17 — Falso Negativo

El modelo predijo Funcionando pero el vehículo tenía fallas. Error de tipo II — el más crítico operativamente.

VP = 9 — Verdadero Positivo

El modelo predijo Fallas y el vehículo efectivamente las tenía. Aciertos en la clase de interés.

B — Indicadores de Precisión del Clasificador
Exactitud (Accuracy)
79.2%
Proporción de predicciones correctas sobre el total. (VN+VP)/(VN+FP+FN+VP)
Precisión (Precision)
52.9%
De los vehículos predichos con fallas, ¿cuántos realmente fallaban? VP/(VP+FP)
Sensibilidad (Recall)
34.6%
De todos los vehículos con fallas reales, ¿cuántos detectó el modelo? VP/(VP+FN)
Especificidad
91.5%
Capacidad de identificar correctamente los vehículos sin fallas. VN/(VN+FP)
F1-Score
41.9%
Media armónica entre Precisión y Sensibilidad. Balance entre ambos errores. 2·P·R/(P+R)
Exactitud = (86 + 9) / (86 + 8 + 17 + 9) = 95/120 = 0.7917
Precisión = 9 / (9 + 8) = 9/17 = 0.5294
Sensibilidad = 9 / (9 + 17) = 9/26 = 0.3462
Especificidad = 86 / (86 + 8) = 86/94 = 0.9149
F1-Score = 2 · 0.5294 · 0.3462 / (0.5294 + 0.3462) = 0.4186
Interpretación de los Resultados

Exactitud Global Alta (79.2%)

El modelo acierta en casi 8 de cada 10 predicciones. Sin embargo, este valor puede ser engañoso porque el dataset es desbalanceado (307 Funcionando vs. 92 Fallas). Un modelo que prediga siempre "Funcionando" ya tendría ~77% de exactitud.

Recall Bajo (34.6%) — El Mayor Riesgo

El modelo no detecta 17 de los 26 vehículos con fallas reales (Falsos Negativos). Operativamente, esto significa que un taxi con problemas mecánicos pasa desapercibido, lo cual es el error más costoso y peligroso en este contexto.

Especificidad Excelente (91.5%)

El modelo identifica correctamente el 91.5% de los vehículos que funcionan bien. Solo 8 de 94 casos sin fallas fueron clasificados erróneamente como problemáticos (Falsos Positivos).

F1-Score Bajo (41.9%) — Desequilibrio

El F1-Score bajo refleja que el modelo tiene dificultad para la clase minoritaria (Fallas). Se recomienda aplicar técnicas de balanceo de clases (SMOTE, class_weight='balanced') o ajustar el umbral de decisión para mejorar la detección de fallas.