Introducción

El presente documento expone los resultados del análisis predictivo realizado para la flota de vehículos Taxi Kal. Se utilizó un modelo de Árbol de Decisión para clasificar el estado de los vehículos en dos categorías: Funcionando (0) y Fallas (1).


A) Presentar la matriz de confusión en excel

A partir del modelo de clasificación en Excel, se obtuvo la siguiente matriz de confusión basada en los datos de prueba:

Real  Predicho Funcionando (0) Fallas (1) Total Real
Funcionando (0) 86 8 94
Fallas (1) 17 9 26
Total Predicho 103 17 120

Leyenda de Resultados:

  • Verdaderos Negativos (VN): 86 (Clasificaciones correctas de vehículos funcionando).
  • Verdaderos Positivos (VP): 9 (Clasificaciones correctas de vehículos con fallas).
  • Falsos Negativos (FN): 17 (Error Tipo II: Tenían fallas pero se predijo que funcionaban).
  • Falsos Positivos (FP): 8 (Error Tipo I: Funcionaban pero se predijo que tenían fallas).

B) Presentar al menos dos indicadores de precisión de su algoritmo de clasificación e interprételos

Para evaluar el desempeño del Árbol de Decisión, se calcularon los siguientes indicadores a partir de la matriz de confusión (Total de registros = 120):

Indicador Valor Interpretación
Exactitud (Accuracy) 79.2% El modelo clasifica correctamente el 79.2% de todos los vehículos del conjunto de prueba.
Precisión (Precision) 52.9% Cuando predice ‘Fallas’, acierta el 52.9% de las veces. Bajo nivel de falsas alarmas.
Sensibilidad (Recall) 34.6% Detecta el 34.6% de los vehículos realmente con fallas. Capacidad de encontrar los casos positivos.
Especificidad 91.5% Identifica correctamente el 91.5% de los vehículos que realmente funcionan bien.
F1-Score 41.9% Media armónica entre Precisión y Recall = 0.4186. Útil ante clases desbalanceadas.