Se analiza el dataset Taxi_Kal, compuesto por 399 vehículos de taxi, con el objetivo de clasificar si un vehículo presenta Fallas o está Funcionando correctamente, a partir de variables como tiempo del vehículo, consumo mensual, uso medio diario, proveedor local, zona de recorrido y tecnología del motor.
Se utilizó el algoritmo K-Nearest Neighbors (KNN) con k = 5, un método de aprendizaje supervisado basado en similitud.
¿Cómo funciona?
Configuración del modelo:
| Parámetro | Valor |
|---|---|
| Algoritmo | K-Nearest Neighbors |
| K (vecinos) | 5 |
| División de datos | 70% entrenamiento / 30% prueba |
| Observaciones entrenamiento | 279 |
| Observaciones prueba | 120 |
| Variable objetivo | Output2 (Fallas / Funcionando) |
| Predicho: Fallas | Predicho: Funcionando | |
|---|---|---|
| Real: Fallas | 10 (TP) | 16 (FN) |
| Real: Funcionando | 10 (FP) | 84 (TN) |
Interpretación:
\[Accuracy = \frac{TP + TN}{TP + TN + FP + FN} = \frac{10 + 84}{120} = 0.7833\]
Interpretación: El modelo clasifica correctamente el 78.33% de los vehículos. De cada 10 taxis evaluados, acierta en aproximadamente 8. Sin embargo, el desbalance de clases (307 Funcionando vs 92 Fallas) puede inflar este valor.
\[Recall = \frac{TP}{TP + FN} = \frac{10}{10 + 16} = 0.3846\]
Interpretación: El modelo detecta solo el 38.46% de los vehículos con fallas reales. De cada 10 taxis con fallas, solo alerta en 4 y deja pasar 6 sin detectar. Esto es crítico en el contexto de mantenimiento de taxis.
| Indicador | Valor | Evaluación |
|---|---|---|
| Exactitud (Accuracy) | 78.33% | Aceptable |
| Precisión (Precision) | 50.00% | Moderada |
| Sensibilidad (Recall) | 38.46% | Baja |
| F1-Score | 43.48% | Moderada |
El modelo KNN con k=5 presenta exactitud global aceptable pero un recall muy bajo para detectar fallas. Se recomienda aplicar balanceo de clases (SMOTE), probar distintos valores de k, o evaluar algoritmos como Random Forest o SVM.