1 Imputación de barrios con KNN

Hay un poco más de 20000 observaciones que no tienen asignado un barrio, de manera que para imputarlos, se utilizó el algoritmo KNN en Python utilizando las observaciones que sí tenían barrio para entrenar y validar el modelo. El conjunto de entrada X son las observaciones respecto a las variables año, clase de accidente, comuna, hora, longitud y latitud., y el conjunto de salida corresponde a los barrios de dichas observaciones. Luego de entrenar y evaluar el modelo, se realiza la predicción utilizando las observaciones que no tienen barrio y de esta manera se imputan los barrios. Para más detalle visitar el archivo “imputación_de_barrios.py”.

En la tabla anterior se puede ver que ya no existe algún barrio vacío por lo que la imputación fue un éxito.