1. Objetivo
2. Descripción del modelo
3. Matriz de confusión
- Interpretación de la matriz
4. Indicadores de precisión del algoritmo
5. Análisis de resultados
6. Conclusión final

1. Objetivo

El objetivo fue aplicar una técnica de clasificación al dataset Taxi Kal para predecir si una unidad se encuentra en estado de Funcionando o presenta Fallas.

La técnica utilizada fue K-Nearest Neighbors (KNN) con k = 3.

2. Descripción del modelo

Elemento	Detalle
Técnica aplicada	K-Nearest Neighbors, KNN
Valor de k	3
Variable objetivo	Output1 / Output2
Clase 0	Funcionando
Clase 1	Fallas
Datos de entrenamiento	279 registros, equivalente al 70%
Datos de prueba	120 registros, equivalente al 30%
Normalización	Min-Max sobre datos de entrenamiento

Las variables predictoras utilizadas fueron:

Tiempo_Vehiculo
Consumo_Mensual
Uso_Medio_Diario
Proveedor_Local
Zona_recorrido
Tecnologia_motor

3. Matriz de confusión

La matriz de confusión compara los valores reales contra los valores predichos por el modelo.

Real / Predicho	Predicho: Funcionando (0)	Predicho: Fallas (1)	Total real
Real: Funcionando (0)	90	2	92
Real: Fallas (1)	5	23	28
Total predicho	95	25	120

Interpretación de la matriz

Verdaderos negativos (TN): 90 unidades que realmente funcionaban y fueron clasificadas correctamente como funcionando.
Falsos positivos (FP): 2 unidades que funcionaban, pero el modelo las clasificó como fallas.
Falsos negativos (FN): 5 unidades con fallas reales que el modelo no detectó.
Verdaderos positivos (TP): 23 unidades con fallas que fueron correctamente detectadas.

4. Indicadores de precisión del algoritmo

Accuracy

94.2%

Precisión

92.0%

Recall

82.1%

F1-score

86.8%

Indicador	Fórmula	Resultado	Interpretación
Accuracy	(TP + TN) / Total	94.2%	El modelo clasificó correctamente el 94.2% de los casos de prueba.
Precisión clase Fallas	TP / (TP + FP)	92.0%	Cuando el modelo predice una falla, acierta en el 92.0% de los casos.
Recall clase Fallas	TP / (TP + FN)	82.1%	El modelo detecta el 82.1% de las fallas reales.
F1-score clase Fallas	2 × Precisión × Recall / (Precisión + Recall)	86.8%	Resume el equilibrio entre precisión y recall con un valor de 86.8%.

5. Análisis de resultados

El modelo KNN tuvo un desempeño alto, con una exactitud global de 94.2%. Esto significa que la mayoría de unidades fueron clasificadas correctamente.

La precisión de la clase Fallas fue 92.0%, por lo que el modelo es confiable cuando indica que una unidad presenta fallas.

El recall fue 82.1%, lo cual indica que el modelo logró detectar la mayor parte de fallas reales, aunque todavía dejó sin detectar 5 casos.

Conclusión: El modelo KNN es útil para clasificar el estado de las unidades del dataset Taxi Kal. Sin embargo, para un contexto operativo real, sería importante reducir los falsos negativos, ya que representan fallas que el modelo no detectó.

6. Conclusión final

Se construyó un modelo de clasificación con KNN, se evaluó su desempeño mediante una matriz de confusión y se calcularon indicadores de precisión. Los resultados muestran que el algoritmo tiene buen rendimiento general y puede apoyar la identificación de unidades con posibles fallas.

Clasificación KNN - Dataset Taxi Kal

FRANSHESKA MAZA CABRERA

03 de junio de 2026