Criterio 4 · Caso aplicado en clase

Clasificación de
Fallas en Taxis

Análisis con Árbol de Decisión sobre el dataset Taxi_Kal.xlsx. Matriz de confusión e indicadores de precisión.

Algoritmo: Decision Tree

Variable objetivo: Output1 (Fallas)

Split: 70% train / 30% test

n = 399 registros

399

Total registros

Variables predictoras

279

Train (70%)

120

Test (30%)

307

Funcionando

Con Fallas

A — Matriz de Confusión

Valor Real

PRED: 0
Funcionando

PRED: 1
Fallas

REAL: 0
Func.

VN — Verdadero Negativo

FP — Falso Positivo

REAL: 1
Fallas

FN — Falso Negativo

VP — Verdadero Positivo

Valor Predicho por el Modelo

VN = 86 — Verdadero Negativo

El modelo predijo Funcionando y el vehículo realmente funcionaba. Aciertos en la clase negativa.

FP = 8 — Falso Positivo

El modelo predijo Fallas pero el vehículo funcionaba correctamente. Error de tipo I.

FN = 17 — Falso Negativo

El modelo predijo Funcionando pero el vehículo tenía fallas. Error de tipo II — el más crítico operativamente.

VP = 9 — Verdadero Positivo

El modelo predijo Fallas y el vehículo efectivamente las tenía. Aciertos en la clase de interés.

B — Indicadores de Precisión del Clasificador

Exactitud (Accuracy)

79.2%

Proporción de predicciones correctas sobre el total. (VN+VP)/(VN+FP+FN+VP)

Precisión (Precision)

52.9%

De los vehículos predichos con fallas, ¿cuántos realmente fallaban? VP/(VP+FP)

Sensibilidad (Recall)

34.6%

De todos los vehículos con fallas reales, ¿cuántos detectó el modelo? VP/(VP+FN)

Especificidad

91.5%

Capacidad de identificar correctamente los vehículos sin fallas. VN/(VN+FP)

F1-Score

41.9%

Media armónica entre Precisión y Sensibilidad. Balance entre ambos errores. 2·P·R/(P+R)

Exactitud = (86 + 9) / (86 + 8 + 17 + 9) = 95/120 = 0.7917
Precisión = 9 / (9 + 8) = 9/17 = 0.5294
Sensibilidad = 9 / (9 + 17) = 9/26 = 0.3462
Especificidad = 86 / (86 + 8) = 86/94 = 0.9149
F1-Score = 2 · 0.5294 · 0.3462 / (0.5294 + 0.3462) = 0.4186

Interpretación de los Resultados

Exactitud Global Alta (79.2%)

El modelo acierta en casi 8 de cada 10 predicciones. Sin embargo, este valor puede ser engañoso porque el dataset es desbalanceado (307 Funcionando vs. 92 Fallas). Un modelo que prediga siempre "Funcionando" ya tendría ~77% de exactitud.

Recall Bajo (34.6%) — El Mayor Riesgo

El modelo no detecta 17 de los 26 vehículos con fallas reales (Falsos Negativos). Operativamente, esto significa que un taxi con problemas mecánicos pasa desapercibido, lo cual es el error más costoso y peligroso en este contexto.

Especificidad Excelente (91.5%)

El modelo identifica correctamente el 91.5% de los vehículos que funcionan bien. Solo 8 de 94 casos sin fallas fueron clasificados erróneamente como problemáticos (Falsos Positivos).

F1-Score Bajo (41.9%) — Desequilibrio

El F1-Score bajo refleja que el modelo tiene dificultad para la clase minoritaria (Fallas). Se recomienda aplicar técnicas de balanceo de clases (SMOTE, class_weight='balanced') o ajustar el umbral de decisión para mejorar la detección de fallas.

Clasificación deFallas en Taxis

Exactitud Global Alta (79.2%)

Recall Bajo (34.6%) — El Mayor Riesgo

Especificidad Excelente (91.5%)

F1-Score Bajo (41.9%) — Desequilibrio

Clasificación de
Fallas en Taxis