1. Objetivo

El objetivo fue aplicar una técnica de clasificación al dataset Taxi Kal para predecir si una unidad se encuentra en estado de Funcionando o presenta Fallas.

La técnica utilizada fue K-Nearest Neighbors (KNN) con k = 3.

2. Descripción del modelo

Elemento Detalle
Técnica aplicada K-Nearest Neighbors, KNN
Valor de k 3
Variable objetivo Output1 / Output2
Clase 0 Funcionando
Clase 1 Fallas
Datos de entrenamiento 279 registros, equivalente al 70%
Datos de prueba 120 registros, equivalente al 30%
Normalización Min-Max sobre datos de entrenamiento

Las variables predictoras utilizadas fueron:

3. Matriz de confusión

La matriz de confusión compara los valores reales contra los valores predichos por el modelo.

Real / Predicho Predicho: Funcionando (0) Predicho: Fallas (1) Total real
Real: Funcionando (0) 90 2 92
Real: Fallas (1) 5 23 28
Total predicho 95 25 120

Interpretación de la matriz

  • Verdaderos negativos (TN): 90 unidades que realmente funcionaban y fueron clasificadas correctamente como funcionando.
  • Falsos positivos (FP): 2 unidades que funcionaban, pero el modelo las clasificó como fallas.
  • Falsos negativos (FN): 5 unidades con fallas reales que el modelo no detectó.
  • Verdaderos positivos (TP): 23 unidades con fallas que fueron correctamente detectadas.

4. Indicadores de precisión del algoritmo

Accuracy

94.2%

Precisión

92.0%

Recall

82.1%

F1-score

86.8%

Indicador Fórmula Resultado Interpretación
Accuracy (TP + TN) / Total 94.2% El modelo clasificó correctamente el 94.2% de los casos de prueba.
Precisión clase Fallas TP / (TP + FP) 92.0% Cuando el modelo predice una falla, acierta en el 92.0% de los casos.
Recall clase Fallas TP / (TP + FN) 82.1% El modelo detecta el 82.1% de las fallas reales.
F1-score clase Fallas 2 × Precisión × Recall / (Precisión + Recall) 86.8% Resume el equilibrio entre precisión y recall con un valor de 86.8%.

5. Análisis de resultados

El modelo KNN tuvo un desempeño alto, con una exactitud global de 94.2%. Esto significa que la mayoría de unidades fueron clasificadas correctamente.

La precisión de la clase Fallas fue 92.0%, por lo que el modelo es confiable cuando indica que una unidad presenta fallas.

El recall fue 82.1%, lo cual indica que el modelo logró detectar la mayor parte de fallas reales, aunque todavía dejó sin detectar 5 casos.

Conclusión: El modelo KNN es útil para clasificar el estado de las unidades del dataset Taxi Kal. Sin embargo, para un contexto operativo real, sería importante reducir los falsos negativos, ya que representan fallas que el modelo no detectó.

6. Conclusión final

Se construyó un modelo de clasificación con KNN, se evaluó su desempeño mediante una matriz de confusión y se calcularon indicadores de precisión. Los resultados muestran que el algoritmo tiene buen rendimiento general y puede apoyar la identificación de unidades con posibles fallas.