El objetivo fue aplicar una técnica de clasificación al dataset Taxi Kal para predecir si una unidad se encuentra en estado de Funcionando o presenta Fallas.
La técnica utilizada fue K-Nearest Neighbors (KNN) con k = 3.
| Elemento | Detalle |
|---|---|
| Técnica aplicada | K-Nearest Neighbors, KNN |
| Valor de k | 3 |
| Variable objetivo | Output1 / Output2 |
| Clase 0 | Funcionando |
| Clase 1 | Fallas |
| Datos de entrenamiento | 279 registros, equivalente al 70% |
| Datos de prueba | 120 registros, equivalente al 30% |
| Normalización | Min-Max sobre datos de entrenamiento |
Las variables predictoras utilizadas fueron:
La matriz de confusión compara los valores reales contra los valores predichos por el modelo.
| Real / Predicho | Predicho: Funcionando (0) | Predicho: Fallas (1) | Total real |
|---|---|---|---|
| Real: Funcionando (0) | 90 | 2 | 92 |
| Real: Fallas (1) | 5 | 23 | 28 |
| Total predicho | 95 | 25 | 120 |
94.2%
92.0%
82.1%
86.8%
| Indicador | Fórmula | Resultado | Interpretación |
|---|---|---|---|
| Accuracy | (TP + TN) / Total | 94.2% | El modelo clasificó correctamente el 94.2% de los casos de prueba. |
| Precisión clase Fallas | TP / (TP + FP) | 92.0% | Cuando el modelo predice una falla, acierta en el 92.0% de los casos. |
| Recall clase Fallas | TP / (TP + FN) | 82.1% | El modelo detecta el 82.1% de las fallas reales. |
| F1-score clase Fallas | 2 × Precisión × Recall / (Precisión + Recall) | 86.8% | Resume el equilibrio entre precisión y recall con un valor de 86.8%. |
El modelo KNN tuvo un desempeño alto, con una exactitud global de 94.2%. Esto significa que la mayoría de unidades fueron clasificadas correctamente.
La precisión de la clase Fallas fue 92.0%, por lo que el modelo es confiable cuando indica que una unidad presenta fallas.
El recall fue 82.1%, lo cual indica que el modelo logró detectar la mayor parte de fallas reales, aunque todavía dejó sin detectar 5 casos.
Conclusión: El modelo KNN es útil para clasificar el estado de las unidades del dataset Taxi Kal. Sin embargo, para un contexto operativo real, sería importante reducir los falsos negativos, ya que representan fallas que el modelo no detectó.
Se construyó un modelo de clasificación con KNN, se evaluó su desempeño mediante una matriz de confusión y se calcularon indicadores de precisión. Los resultados muestran que el algoritmo tiene buen rendimiento general y puede apoyar la identificación de unidades con posibles fallas.