1 INTRODUCCIÓN

La población habitante de calle constituye uno de los grupos sociales más vulnerables y excluidos dentro de la sociedad. Su situación refleja profundas desigualdades estructurales derivadas de factores como la pobreza, la violencia intrafamiliar, la falta de acceso a la educación, el desempleo y los problemas de salud física y mental. Lejos de ser un fenómeno aislado, la vida en la calle es el resultado de procesos sociales y económicos complejos que afectan a miles de personas en distintas ciudades del país y del mundo.

Comprender las características, condiciones y trayectorias de la población habitante de calle es fundamental en Colombia para la formulación de políticas públicas y estrategias de intervención social efectivas. A través de la recopilación y el análisis de datos sobre sus experiencias, es posible identificar patrones, necesidades prioritarias y factores que inciden en su permanencia o salida de la calle.

En el año 2019, el Departamento Administrativo Nacional de Estadística (DANE) realizó el Censo de Habitantes de Calle (CHC) a nivel nacional, en el cual se recolectaron las principales características socioeconómicas y demográficas de esta población. A partir de este censo, se busca analizar qué factores influyen en el desconocimiento de los programas ofrecidos por las alcaldías, orientados a brindar apoyo y acompañamiento a esta población vulnerable.

Según el DANE, el 53,5% de los habitantes de calle no tiene conocimiento sobre los programas ofrecidos por las alcaldías. Este desconocimiento constituye uno de los elementos que contribuyen a la permanencia de las personas en situación de calle. Por ello, resulta fundamental analizar las variables que inciden en este fenómeno, con el fin de orientar acciones que permitan llegar de manera más efectiva a los sectores más afectados y ofrecerles la ayuda correspondiente.

Adicionalmente el aprendizaje supervisado es una técnica de la inteligencia artificial y la ciencia de datos que permite entrenar un modelo a partir de un conjunto de datos previamente etiquetado. En este proceso, el algoritmo aprende la relación entre las variables de entrada (características o predictores) y una variable de salida (respuesta o etiqueta), con el fin de realizar predicciones sobre nuevos casos (Géron, 2019).

Este enfoque resulta especialmente útil cuando se busca clasificar o predecir comportamientos dentro de una población, ya que permite identificar patrones y tendencias a partir de la información disponible.

El presente informe aplica dos modelos de aprendizaje supervisado, K-Nearest Neighbors (KNN) y Regresión Logística (Logit), utilizando los datos recolectados en el CHC. El propósito es predecir qué parte de la población habitante de calle, según determinadas características sociodemográficas, es más propensa a desconocer las ayudas ofrecidas por la alcaldía. De esta manera, se busca contribuir a la identificación de los grupos más vulnerables y facilitar intervenciones más pertinentes y efectivas por parte de las instituciones responsables de su atención.

2 METODOLOGÍA

2.1 MÉTODOS UTILIZADOS

El estudio se inició con la búsqueda de una base de datos adecuada para aplicar el modelo de aprendizaje supervisado. Tras revisar la página de bases de datos del DANE, se seleccionó el CHC del año 2019 como objeto de análisis. A partir del glosario de variables, se eligieron aquellas más representativas para el estudio: conocimiento de los programas de la alcaldía, edad, sexo, nivel educativo, capacidad de lectura y escritura, y tiempo de permanencia en la calle. Posteriormente, se realizó un proceso de limpieza de datos con el fin de eliminar los registros vacíos o inconsistentes que no aportaban información útil al modelo.

Después de la depuración, se llevó a cabo un análisis descriptivo de las variables seleccionadas con el propósito de observar su comportamiento general. Este análisis incluyó gráficos de frecuencia, medidas de tendencia central (media, mediana y moda) y la identificación de valores atípicos.

Finalmente, para la implementación del modelo de aprendizaje supervisado, se establecieron como variables de entrada (inputs) el sexo, la edad, el nivel educativo, el tiempo de permanencia en la calle y la capacidad de lectura y escritura. Como variable de salida (output) se definió el conocimiento sobre los programas ofrecidos por la alcaldía.

Una vez establecidos los inputs y outputs, se procedió a la ejecución del primer modelo, el KNN. Para ello, la base de datos se dividió en dos grupos: un conjunto de entrenamiento (75%) y un conjunto de prueba o testeo (25%). Posteriormente, se determinó el número de vecinos (k) más óptimo para la predicción del modelo, realizando comparativas de rendimiento mediante gráficos de precisión.

Con el valor óptimo de k obtenido, se llevó a cabo el entrenamiento del modelo KNN, analizando sus resultados a través de métricas de desempeño como la precisión. Luego, se construyó la matriz de confusión, con el fin de examinar los valores de verdaderos positivos, falsos positivos, verdaderos negativos y falsos negativos. Finalmente, se generó la curva ROC, que permitió visualizar el área bajo la curva (AUC), indicador fundamental para evaluar la capacidad predictiva y la utilidad del modelo KNN en este estudio.

Posteriormente, se realizó el mismo análisis utilizando el modelo Logit, manteniendo la misma proporción de división de los datos: un conjunto de entrenamiento (75%) y un conjunto de prueba o testeo (25%). Con esta separación establecida, se procedió al entrenamiento del modelo, obteniendo inicialmente una primera matriz de confusión. Luego, se determinó un punto de corte óptimo con el fin de mejorar la clasificación y generar una nueva matriz de confusión más precisa, en la cual se examinaron los valores de verdaderos positivos, falsos positivos, verdaderos negativos y falsos negativos. Finalmente, se elaboró la curva ROC, con el propósito de evaluar la precisión y utilidad del modelo Logit en el contexto del presente estudio.

2.2 VARIABLES

Las variables utilizadas en el analisis se dividen en dos grupos: inptus (Y) y outputs (X):

# TABLA DE VARIABLES
variables_modelo <- data.frame(
  Variable = c("ProgramasAlcaldia", "Edad", "Sexo", "NivelEducacion", "TiempoCalle", "LeeEscribe"),
  Descripción = c(
    "Si el entrevistado conoce sobre los programas que ofrece la alcaldía",
    "Edad del entrevistado",
    "Sexo del entrevistado",
    "Nivel de educación alcanzado por el entrevistado",
    "Tiempo que lleva viviendo en la calle el entrevistado",
    "Si el entrevistado sabe leer o escribir"
  ),
  Tipo_Variable = c(
    "Binaria (Outpt)",
    "Cuantitativa (Input)",
    "Cualitativa (Input)",
    "Categórica (Input)",
    "Cuantitativa (Input)",
    "Cuantitativa (Input)"
  ),
  Ejemplos_Notas = c(
    "Si/No",
    "En años",
    "Masculino/Femenino",
    "Preescolar, Básica primaria, Básica secundaria, Media académica, media técnica o normalista, Técnica profesional o tegnológica, Universitario o Posgrado, Ninguno" ,
    "En años",
    "Si/No"
  )
)


tabla <- kable(variables_modelo, 
               format = "html",
               col.names = c("Variable", "Descripción", "Tipo de Variable", "Notas"),
               align = c('l', 'l', 'l', 'l'),
               caption = "Tabla de Variables del Modelo de aprendizaje supervisado") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 14,
    position = "center"
  ) %>%
  row_spec(0, background = "#2b6cb0", color = "white", bold = TRUE) %>%
  column_spec(1, bold = TRUE, width = "3cm") %>%
  column_spec(2, width = "4cm") %>%  # Cambiado de 2:8 a columnas específicas
  column_spec(3, width = "3cm") %>%
  column_spec(4, width = "3.5cm") %>%
  footnote(
    general = "",
    general_title = "",
    footnote_as_chunk = TRUE
  )

tabla
Tabla de Variables del Modelo de aprendizaje supervisado
Variable Descripción Tipo de Variable Notas
ProgramasAlcaldia Si el entrevistado conoce sobre los programas que ofrece la alcaldía Binaria (Outpt) Si/No
Edad Edad del entrevistado Cuantitativa (Input) En años
Sexo Sexo del entrevistado Cualitativa (Input) Masculino/Femenino
NivelEducacion Nivel de educación alcanzado por el entrevistado Categórica (Input) Preescolar, Básica primaria, Básica secundaria, Media académica, media técnica o normalista, Técnica profesional o tegnológica, Universitario o Posgrado, Ninguno
TiempoCalle Tiempo que lleva viviendo en la calle el entrevistado Cuantitativa (Input) En años
LeeEscribe Si el entrevistado sabe leer o escribir Cuantitativa (Input) Si/No

ProgramasAlcaldía: Esta variable corresponde a la pregunta sobre si el entrevistado conoce los programas de ayuda ofrecidos por la alcaldía. Se utiliza como variable de salida (output) en el modelo, ya que permite analizar y predecir los factores asociados al desconocimiento de dichos programas por parte de la población habitante de calle.

Edad: Esta variable representa la edad del entrevistado. Se incluyó en el modelo debido a que se considera que la edad puede influir en el nivel de información o conocimiento que las personas tienen sobre los programas de ayuda ofrecidos por la alcaldía.

Sexo: Esta variable indica el sexo del entrevistado. Se incluyó en el modelo considerando que pueden existir diferencias en el acceso a la información y a los programas de ayuda entre hombres y mujeres, lo que podría deberse a una estigmación

NivelEducacion: Esta variable representa el nivel educativo alcanzado por el entrevistado. Se incluyó en el modelo bajo la hipótesis de que las personas con un mayor nivel educativo pueden tener un acceso y comprensión más amplios sobre la información y los mecanismos de participación en los programas ofrecidos por la alcaldía.

TiempoCalle: Esta variable representa la cantidad de años que el entrevistado ha vivido en situación de calle. Se incluyó en el modelo considerando que, a mayor tiempo en esta condición, pueden cambiar las actitudes, expectativas y niveles de interés del individuo frente a los programas de ayuda, así como su predisposición a participar en procesos de reintegración social.

LeeEscribe: Esta variable indica si el entrevistado posee habilidades básicas de lectura y escritura. Se incluyó en el modelo considerando que una persona analfabeta podría tener mayores dificultades para informarse y comprender los canales de acceso o los procedimientos relacionados con los programas ofrecidos por la alcaldía.

A continuación, se presenta la base de datos utilizada, junto con las variables seleccionadas para el análisis.

Base de datos Habitantes de Calle
ProgramasAlcaldia Edad Sexo NivelEducacion TiempoCalle LeeEscribe
1 No 46 Hombre Básica secundaria 34 Si
2 Si 58 Hombre Media académica, media técnica o normalista 20 Si
3 Si 37 Hombre Media académica, media técnica o normalista 23 Si
4 Si 28 Mujer Básica primaria 7 Si
5 Si 33 Hombre Media académica, media técnica o normalista 22 Si
6 Si 26 Hombre Básica secundaria 9 Si
7 Si 34 Hombre Preescolar 21 No
8 No 70 Hombre Básica secundaria 35 Si
9 No 29 Hombre Básica secundaria 2 Si
10 No 33 Hombre Básica secundaria 5 Si
11 Si 29 Hombre Básica secundaria 12 Si
12 Si 28 Hombre Básica primaria 20 Si
13 Si 58 Hombre Básica primaria 14 Si
14 Si 58 Hombre Ninguno 10 Si
15 Si 43 Hombre Básica secundaria 29 Si
16 Si 37 Mujer Básica primaria 12 Si
17 Si 56 Hombre Media académica, media técnica o normalista 25 Si
18 No 54 Hombre Básica primaria 25 Si
19 No 30 Mujer Ninguno 1 No
20 Si 59 Hombre Básica secundaria 40 Si
21 Si 53 Hombre Básica secundaria 20 Si
22 Si 63 Hombre Básica primaria 19 Si
23 Si 33 Mujer Ninguno 20 No
24 No 40 Hombre Básica secundaria 15 Si
25 Si 47 Hombre Básica secundaria 20 Si
26 Si 26 Mujer Básica secundaria 6 Si
27 Si 42 Hombre Básica secundaria 11 Si
28 Si 40 Mujer Básica primaria 25 Si
29 Si 57 Hombre Básica primaria 35 Si
30 Si 61 Hombre Básica primaria 25 Si
31 Si 74 Hombre Ninguno 1 Si
32 Si 67 Hombre Básica primaria 3 Si
33 No 31 Hombre Técnica profesional o tegnológica 4 Si
34 NA NA NA NA NA NA
35 No 53 Hombre Básica secundaria 20 Si
36 Si 32 Hombre Básica secundaria 9 Si
37 NA NA NA NA NA NA
38 Si 39 Hombre Básica primaria 7 Si
39 Si 34 Hombre Universitario o Posgrado 9 Si
40 Si 43 Hombre Básica secundaria 25 Si
41 Si 49 Hombre Básica secundaria 2 Si
42 Si 39 Mujer Básica primaria 10 Si
43 Si 69 Hombre Preescolar 49 No
44 Si 50 Hombre Básica primaria 20 Si
45 Si 59 Hombre Básica secundaria 30 Si
46 No 41 Hombre Media académica, media técnica o normalista 4 Si
47 No 35 Mujer Básica secundaria 4 Si
48 No 53 Hombre Básica secundaria 12 Si
49 Si 64 Hombre Básica secundaria 20 Si
50 Si 29 Mujer Básica secundaria 4 Si
51 No 30 Hombre Básica secundaria 4 Si
52 No 23 Mujer Básica secundaria 5 Si
53 Si 51 Hombre Media académica, media técnica o normalista 12 Si
54 Si 24 Hombre Básica primaria 14 Si
55 Si 36 Hombre Básica secundaria 31 Si
56 Si 55 Hombre Básica primaria 46 Si
57 Si 41 Hombre Básica primaria 28 Si
58 Si 33 Hombre Básica secundaria 15 Si
59 No 56 Hombre Ninguno 20 No
60 No 24 Hombre Básica secundaria 3 Si
61 NA NA NA NA NA NA
62 Si 58 Hombre Media académica, media técnica o normalista 25 Si
63 No 21 Mujer Básica secundaria 6 Si
64 No 55 Hombre Básica primaria 20 Si
65 No 25 Hombre Básica secundaria 2 Si
66 NA NA NA NA NA NA
67 NA NA NA NA NA NA
68 NA NA NA NA NA NA
69 Si 26 Hombre Básica secundaria 4 Si
70 Si 62 Hombre Básica secundaria 14 Si
71 NA NA NA NA NA NA
72 Si 74 Hombre Básica primaria 20 Si
73 No 44 Hombre Básica secundaria 15 Si
74 No 37 Hombre Básica primaria 10 Si
75 Si 38 Hombre Básica secundaria 25 Si
76 Si 40 Hombre Básica secundaria 6 Si
77 No 31 Hombre Técnica profesional o tegnológica 15 Si
78 Si 31 Hombre Básica primaria 7 Si
79 No 36 Hombre Universitario o Posgrado 22 Si
80 Si 22 Hombre Media académica, media técnica o normalista 6 Si
81 NA NA NA NA NA NA
82 No 35 Hombre Básica secundaria 5 Si
83 Si 46 Hombre Básica primaria 2 Si
84 No 39 Hombre Básica secundaria 25 Si
85 Si 26 Hombre Media académica, media técnica o normalista 0 Si
86 No 56 Hombre Básica secundaria 5 Si
87 Si 53 Hombre Media académica, media técnica o normalista 20 Si
88 No 41 Mujer Ninguno 37 No
89 Si 28 Mujer Básica primaria 15 Si
90 Si 28 Hombre Básica secundaria 2 Si
91 Si 40 Hombre Básica secundaria 22 Si
92 Si 50 Hombre Básica secundaria 15 Si
93 No 29 Hombre Básica primaria 28 No
94 No 21 Hombre Básica secundaria 0 Si
95 No 57 Hombre Media académica, media técnica o normalista 20 Si
96 No 52 Hombre Básica primaria 32 Si
97 No 30 Hombre Básica secundaria 11 Si
98 Si 35 Mujer Básica secundaria 5 Si
99 Si 36 Hombre Básica secundaria 1 Si
100 Si 35 Hombre Media académica, media técnica o normalista 1 Si
101 NA NA NA NA NA NA
102 No 52 Hombre Ninguno 0 No
103 Si 32 Hombre Media académica, media técnica o normalista 4 Si
104 NA 25 Hombre NA NA NA
105 No 39 Hombre Básica secundaria 12 Si
106 NA NA NA NA NA NA
107 No 39 Hombre Media académica, media técnica o normalista 0 Si
108 NA NA NA NA NA NA
109 No 63 Hombre Básica primaria 30 Si
110 No 37 Hombre Básica secundaria 4 Si
111 Si 38 Mujer Básica secundaria 12 Si
112 No 25 Mujer Media académica, media técnica o normalista 10 Si
113 Si 66 Hombre Universitario o Posgrado 38 Si
114 No 59 Mujer Básica secundaria 10 Si
115 No 27 Hombre Media académica, media técnica o normalista 0 Si
116 No 25 Hombre Básica secundaria 13 Si
117 No 20 Hombre Media académica, media técnica o normalista 5 Si
118 Si 60 Hombre Básica primaria 10 Si
119 Si 62 Hombre Técnica profesional o tegnológica 45 Si
120 No 21 Hombre Básica primaria 10 No
121 Si 44 Hombre Básica secundaria 29 Si
122 No 23 Hombre Básica primaria 1 Si
123 Si 55 Hombre Básica primaria 12 Si
124 No 40 Mujer Media académica, media técnica o normalista 19 Si
125 Si 60 Hombre Básica primaria 1 Si
126 No 41 Hombre Básica primaria 12 Si
127 Si 43 Hombre Básica secundaria 10 Si
128 No 28 Hombre Básica secundaria 2 Si
129 Si 32 Mujer Básica secundaria 1 Si
130 No 21 Hombre Básica primaria 5 No
131 Si 45 Hombre Ninguno 27 No
132 Si 31 Hombre Básica primaria 18 Si
133 No 21 Hombre Básica secundaria 0 Si
134 No 44 Hombre Básica secundaria 1 Si
135 Si 70 Hombre Básica secundaria 20 Si
136 Si 55 Hombre Ninguno 47 Si
137 Si 57 Hombre Media académica, media técnica o normalista 30 Si
138 Si 44 Hombre Básica secundaria 3 Si
139 No 22 Hombre Media académica, media técnica o normalista 3 Si
140 NA NA NA NA NA NA
141 No 51 Hombre Básica primaria 40 Si
142 Si 34 Hombre Básica primaria 25 Si
143 No 38 Hombre Básica secundaria 0 Si
144 Si 27 Hombre Básica secundaria 14 Si
145 Si 58 Hombre Básica primaria 55 Si
146 Si 52 Hombre Básica primaria 30 Si
147 No 31 Hombre Media académica, media técnica o normalista 0 Si
148 Si 63 Hombre Media académica, media técnica o normalista 30 Si
149 NA NA NA NA NA NA
150 Si 49 Hombre Universitario o Posgrado 15 Si
151 No 58 Hombre Básica primaria 40 Si
152 No 75 Hombre Básica primaria 2 Si
153 Si 16 Hombre Ninguno 1 No
154 Si 26 Hombre Básica primaria 1 Si
155 Si 40 Hombre Media académica, media técnica o normalista 15 Si
156 No 15 Hombre Básica primaria 1 Si
157 Si 40 Hombre Media académica, media técnica o normalista 30 Si
158 Si 58 Hombre Básica secundaria 20 Si
159 Si 42 Hombre Básica secundaria 19 Si
160 Si 60 Hombre Media académica, media técnica o normalista 5 Si
161 Si 29 Hombre Básica secundaria 10 Si
162 Si 32 Hombre Básica primaria 12 Si
163 No 18 Mujer Básica primaria 4 Si
164 Si 27 Hombre Media académica, media técnica o normalista 6 Si
165 No 46 Hombre Básica secundaria 0 Si
166 No 36 Hombre Básica secundaria 4 Si
167 Si 44 Hombre Básica primaria 25 Si
168 Si 53 Hombre Básica primaria 30 Si
169 NA NA NA NA NA NA
170 No 30 Hombre Básica secundaria 5 Si
171 No 49 Hombre Media académica, media técnica o normalista 15 Si
172 Si 28 Hombre Básica primaria 8 Si
173 Si 57 Hombre Media académica, media técnica o normalista 5 Si
174 Si 27 Hombre Media académica, media técnica o normalista 4 Si
175 No 21 Hombre Básica secundaria 3 Si
176 Si 52 Hombre Universitario o Posgrado 38 Si
177 No 50 Hombre Básica primaria 45 Si
178 No 53 Hombre Básica secundaria 10 Si
179 Si 45 Hombre Básica secundaria 14 Si
180 No 54 Mujer Media académica, media técnica o normalista 12 Si
181 Si 47 Hombre Técnica profesional o tegnológica 36 Si
182 Si 62 Hombre Básica primaria 3 Si
183 Si 28 Hombre Media académica, media técnica o normalista 13 Si
184 No 40 Hombre Básica secundaria 10 Si
185 No 32 Hombre Universitario o Posgrado 4 Si
186 Si 56 Mujer Ninguno 8 No
187 NA NA NA NA NA NA
188 No 24 Hombre Básica secundaria 8 Si
189 Si 47 Hombre Básica secundaria 26 Si
190 No 38 Hombre Media académica, media técnica o normalista 10 Si
191 Si 61 Mujer Media académica, media técnica o normalista 5 Si
192 Si 58 Hombre Básica secundaria 22 Si
193 No 46 Hombre Básica primaria 10 Si
194 No 34 Hombre Media académica, media técnica o normalista 0 Si
195 Si 34 Hombre Básica secundaria 12 Si
196 Si 25 Hombre Básica primaria 8 Si
197 No 49 Hombre Básica secundaria 30 Si
198 Si 58 Hombre Media académica, media técnica o normalista 39 Si
199 Si 65 Hombre Ninguno 35 Si
200 No 47 Hombre Básica primaria 6 Si
201 Si 52 Hombre Básica primaria 20 Si
202 No 55 Hombre Ninguno 30 No
203 Si 70 Hombre Básica secundaria 12 Si
204 No 29 Hombre Básica primaria 20 Si
205 Si 50 Mujer Media académica, media técnica o normalista 27 Si
206 No 33 Hombre Ninguno 15 No
207 No 38 Hombre Media académica, media técnica o normalista 13 Si
208 Si 48 Mujer Básica secundaria 16 Si
209 Si 41 Hombre Básica secundaria 7 Si
210 Si 56 Hombre Básica secundaria 50 Si
211 Si 22 Hombre Básica primaria 10 Si
212 Si 21 Hombre Básica primaria 6 Si
213 No 51 Hombre Básica primaria 20 Si
214 Si 46 Hombre Media académica, media técnica o normalista 10 Si
215 Si 31 Hombre Media académica, media técnica o normalista 1 Si
216 Si 72 Hombre Básica primaria 55 Si
217 NA NA NA NA NA NA
218 No 23 Hombre Media académica, media técnica o normalista 1 Si
219 No 31 Hombre Básica primaria 7 Si
220 Si 29 Hombre Básica secundaria 7 Si
221 NA NA NA NA NA NA
222 No 41 Hombre Básica secundaria 5 Si
223 Si 55 Hombre Básica primaria 25 Si
224 Si 60 Hombre Básica secundaria 2 Si
225 Si 36 Mujer Básica primaria 14 Si
226 Si 26 Mujer Básica secundaria 5 Si
227 Si 60 Hombre Universitario o Posgrado 48 Si
228 No 23 Hombre Media académica, media técnica o normalista 1 Si
229 No 58 Hombre Media académica, media técnica o normalista 20 Si
230 No 28 Hombre Básica secundaria 12 Si
231 Si 57 Hombre Básica secundaria 4 Si
232 Si 41 Hombre Básica primaria 28 No
233 No 23 Hombre Básica secundaria 9 Si
234 No 32 Hombre Media académica, media técnica o normalista 0 Si
235 Si 58 Hombre Básica primaria 10 Si
236 Si 29 Hombre Básica secundaria 3 Si
237 No 38 Hombre Universitario o Posgrado 6 Si
238 Si 31 Hombre Media académica, media técnica o normalista 1 Si
239 Si 39 Hombre Básica secundaria 12 Si
240 Si 47 Hombre Básica secundaria 4 Si
241 NA NA NA NA NA NA
242 No 66 Mujer Universitario o Posgrado 17 Si
243 Si 36 Hombre Básica secundaria 15 Si
244 NA NA NA NA NA NA
245 NA NA NA NA NA NA
246 Si 55 Hombre Básica secundaria 30 Si
247 No 21 Mujer Básica secundaria 0 Si
248 No 23 Hombre Básica secundaria 5 Si
249 Si 40 Hombre Básica primaria 20 Si
250 No 56 Hombre Básica primaria 30 No
251 No 50 Hombre Básica secundaria 8 Si
252 Si 34 Hombre Técnica profesional o tegnológica 16 Si
253 Si 44 Hombre Básica secundaria 10 Si
254 NA NA NA NA NA NA
255 No 58 Hombre Básica secundaria 15 Si
256 No 67 Hombre Básica primaria 7 No
257 Si 56 Hombre Básica secundaria 40 Si
258 Si 49 Hombre Básica secundaria 8 Si
259 No 38 Hombre Básica secundaria 0 Si
260 Si 33 Hombre Media académica, media técnica o normalista 15 Si
261 Si 30 Hombre Básica primaria 10 Si
262 No 48 Mujer Básica primaria 8 Si
263 Si 27 Hombre Básica secundaria 4 Si
264 Si 36 Hombre Básica secundaria 17 Si
265 Si 36 Mujer Media académica, media técnica o normalista 5 Si
266 Si 55 Hombre Básica primaria 12 Si
267 Si 18 Hombre Básica primaria 4 Si
268 NA NA NA NA NA NA
269 No 23 Mujer Básica primaria 2 Si
270 NA NA NA NA NA NA
271 Si 44 Hombre Básica primaria 5 Si
272 Si 35 Mujer Media académica, media técnica o normalista 10 Si
273 Si 28 Hombre Básica primaria 17 Si
274 No 37 Hombre Básica primaria 15 Si
275 Si 23 Hombre Básica secundaria 13 Si
276 Si 49 Hombre Media académica, media técnica o normalista 36 Si
277 Si 68 Hombre Básica primaria 51 Si
278 Si 65 Hombre Media académica, media técnica o normalista 20 Si
279 No 56 Hombre Básica secundaria 12 Si
280 Si 23 Hombre Ninguno 15 No
281 No 23 Hombre Básica secundaria 1 Si
282 Si 39 Hombre Básica secundaria 9 Si
283 Si 25 Mujer Básica secundaria 13 Si
284 No 55 Hombre Básica primaria 49 Si
285 NA NA NA NA NA NA
286 No 34 Mujer Básica secundaria 33 Si
287 No 22 Mujer Básica secundaria 4 Si
288 Si 26 Hombre Básica primaria 6 Si
289 Si 48 Hombre Básica primaria 38 Si
290 No 33 Hombre Básica secundaria 4 Si
291 No 53 Hombre Básica secundaria 30 Si
292 Si 51 Hombre Básica secundaria 20 Si
293 No 39 Hombre Básica secundaria 22 Si
294 Si 35 Hombre Básica secundaria 2 Si
295 No 38 Mujer Media académica, media técnica o normalista 3 Si
296 NA NA NA NA NA NA
297 No 32 Hombre Ninguno 25 No
298 No 23 Mujer Media académica, media técnica o normalista 4 Si
299 No 23 Hombre Básica primaria 15 Si
300 No 57 Hombre Media académica, media técnica o normalista 9 Si
301 NA NA NA NA NA NA
302 Si 33 Hombre Media académica, media técnica o normalista 6 Si
303 No 58 Hombre Básica primaria 45 Si
304 No 39 Hombre Básica secundaria 12 Si
305 No 39 Hombre Básica secundaria 11 Si
306 Si 39 Hombre Media académica, media técnica o normalista 3 Si
307 No 41 Mujer Media académica, media técnica o normalista 10 Si
308 Si 58 Hombre Universitario o Posgrado 7 Si
309 No 35 Hombre Universitario o Posgrado 3 Si
310 Si 54 Hombre Universitario o Posgrado 8 Si
311 Si 36 Mujer Básica secundaria 11 Si
312 Si 21 Mujer Básica secundaria 3 Si
313 Si 43 Hombre Básica primaria 20 Si
314 No 42 Hombre Media académica, media técnica o normalista 5 Si
315 Si 20 Hombre Media académica, media técnica o normalista 0 Si
316 Si 30 Hombre Básica secundaria 15 Si
317 No 25 Hombre Básica secundaria 2 Si
318 No 38 Hombre Básica primaria 28 No
319 No 43 Hombre Básica secundaria 8 Si
320 No 19 Hombre Ninguno 8 No
321 No 24 Hombre Media académica, media técnica o normalista 7 Si
322 Si 33 Hombre Básica secundaria 1 Si
323 Si 57 Hombre Básica primaria 20 Si
324 No 63 Hombre Básica primaria 3 Si
325 NA NA NA NA NA NA
326 No 59 Hombre Básica secundaria 30 Si
327 No 25 Hombre Ninguno 5 No
328 No 49 Hombre Básica primaria 30 Si
329 Si 35 Hombre Básica primaria 25 Si
330 Si 26 Hombre Media académica, media técnica o normalista 12 Si
331 Si 30 Hombre Básica secundaria 0 Si
332 No 55 Mujer Básica primaria 20 Si
333 No 29 Hombre Básica primaria 10 Si
334 No 38 Hombre Básica secundaria 25 Si
335 Si 16 Hombre Básica secundaria 1 Si
336 Si 41 Hombre Básica secundaria 17 Si
337 No 30 Mujer Ninguno 5 Si
338 Si 24 Hombre Media académica, media técnica o normalista 0 Si
339 Si 50 Hombre Básica primaria 30 Si
340 Si 53 Hombre Básica primaria 32 Si
341 NA NA NA NA NA NA
342 No 41 Hombre Ninguno 17 No
343 Si 22 Hombre Básica secundaria 1 Si
344 Si 40 Mujer Básica secundaria 24 Si
345 Si 19 Hombre Básica primaria 5 Si
346 No 29 Hombre Ninguno 5 No
347 No 45 Hombre Básica primaria 15 Si
348 Si 58 Mujer Básica primaria 3 Si
349 No 39 Hombre Ninguno 28 No
350 Si 36 Mujer Técnica profesional o tegnológica 4 Si
351 Si 40 Hombre Básica secundaria 13 Si
352 Si 32 Hombre Básica primaria 20 Si
353 No 37 Hombre Media académica, media técnica o normalista 10 Si
354 NA NA NA NA NA NA
355 No 40 Hombre Básica secundaria 15 Si
356 Si 48 Hombre Básica primaria 35 Si
357 No 37 Mujer Básica primaria 10 No
358 Si 36 Hombre Media académica, media técnica o normalista 6 Si
359 No 37 Mujer Básica secundaria 20 Si
360 Si 38 Hombre Ninguno 20 No
361 Si 62 Hombre Básica primaria 8 Si
362 Si 25 Hombre Media académica, media técnica o normalista 5 Si
363 Si 37 Hombre Básica primaria 10 Si
364 No 26 Hombre Básica secundaria 0 Si
365 Si 50 Mujer Básica secundaria 10 Si
366 NA NA NA NA NA NA
367 No 26 Hombre Media académica, media técnica o normalista 10 Si
368 No 32 Hombre Básica secundaria 20 Si
369 Si 19 Mujer Básica secundaria 5 Si
370 No 32 Hombre Media académica, media técnica o normalista 1 Si
371 No 49 Hombre Básica primaria 3 Si
372 No 31 Hombre Media académica, media técnica o normalista 8 Si
373 NA NA NA NA NA NA
374 Si 63 Hombre Básica secundaria 5 Si
375 Si 31 Hombre Universitario o Posgrado 9 Si
376 Si 35 Hombre Básica primaria 13 Si
377 Si 21 Hombre Básica secundaria 1 Si
378 Si 38 Mujer Básica secundaria 20 Si
379 No 19 Hombre Básica primaria 6 Si
380 No 56 Hombre Básica secundaria 18 Si
381 Si 22 Hombre Básica primaria 9 Si
382 Si 51 Hombre Básica primaria 16 Si
383 No 49 Hombre Básica secundaria 6 Si
384 No 35 Hombre Básica primaria 8 Si
385 Si 36 Mujer Básica primaria 24 Si
386 Si 24 Hombre Técnica profesional o tegnológica 4 Si
387 Si 35 Hombre Básica primaria 10 Si
388 Si 61 Hombre Básica secundaria 30 Si
389 NA NA NA NA NA NA
390 Si 39 Hombre Media académica, media técnica o normalista 17 Si
391 NA NA NA NA NA NA
392 No 34 Mujer Básica secundaria 20 Si
393 NA NA NA NA NA NA
394 No 35 Hombre Media académica, media técnica o normalista 10 Si
395 Si 37 Hombre Básica primaria 16 Si
396 No 26 Hombre Media académica, media técnica o normalista 0 Si
397 Si 41 Mujer Básica primaria 14 Si
398 Si 28 Hombre Básica primaria 15 Si
399 Si 33 Mujer Básica secundaria 0 Si
400 NA NA NA NA NA NA
401 No 37 Mujer Básica primaria 20 Si
402 Si 27 Hombre Media académica, media técnica o normalista 2 Si
403 Si 25 Hombre Media académica, media técnica o normalista 3 Si
404 No 42 Hombre Ninguno 8 No
405 No 33 Hombre Básica primaria 24 No
406 No 46 Mujer Media académica, media técnica o normalista 0 Si
407 No 37 Hombre Media académica, media técnica o normalista 6 Si
408 No 48 Hombre Básica primaria 2 Si
409 Si 36 Hombre Ninguno 23 No
410 No 37 Hombre Básica primaria 13 No
411 NA NA NA NA NA NA
412 Si 34 Hombre Básica primaria 24 Si
413 No 33 Mujer Media académica, media técnica o normalista 10 Si
414 Si 37 Hombre Básica secundaria 8 Si
415 Si 42 Hombre Básica secundaria 18 Si
416 No 27 Hombre Media académica, media técnica o normalista 13 Si
417 Si 31 Mujer Técnica profesional o tegnológica 2 Si
418 Si 22 Mujer Básica secundaria 2 Si
419 No 20 Hombre Básica primaria 5 No
420 Si 49 Mujer Básica secundaria 6 Si
421 Si 58 Hombre Básica secundaria 35 Si
422 Si 32 Hombre Básica secundaria 8 Si
423 NA NA NA NA NA NA
424 No 34 Hombre Básica primaria 20 Si
425 NA NA NA NA NA NA
426 No 41 Mujer Preescolar 32 Si
427 Si 29 Hombre Media académica, media técnica o normalista 4 Si
428 No 27 Hombre Básica primaria 0 Si
429 Si 66 Mujer Básica primaria 30 Si
430 No 31 Hombre Básica secundaria 18 Si
431 Si 55 Mujer Básica primaria 20 Si
432 Si 60 Hombre Universitario o Posgrado 3 Si
433 No 48 Mujer Preescolar 40 Si
434 NA NA NA NA NA NA
435 Si 24 Hombre Básica secundaria 6 Si
436 Si 26 Mujer Media académica, media técnica o normalista 13 Si
437 Si 32 Hombre Media académica, media técnica o normalista 4 Si
438 No 35 Hombre Básica secundaria 20 Si
439 Si 38 Hombre Básica secundaria 15 Si
440 No 29 Hombre Media académica, media técnica o normalista 6 Si
441 NA NA NA NA NA NA
442 No 36 Hombre Básica primaria 6 Si
443 Si 53 Hombre Básica primaria 6 Si
444 Si 35 Hombre Básica secundaria 8 Si
445 NA NA NA NA NA NA
446 No 38 Hombre Básica secundaria 5 Si
447 No 60 Hombre Básica primaria 0 Si
448 No 27 Hombre Básica secundaria 6 Si
449 No 49 Hombre Media académica, media técnica o normalista 1 Si
450 NA NA NA NA NA NA
451 Si 30 Hombre Media académica, media técnica o normalista 5 Si
452 Si 26 Hombre Básica secundaria 1 Si
453 No 36 Hombre Básica secundaria 19 Si
454 Si 22 Hombre Básica secundaria 5 Si
455 No 52 Hombre Media académica, media técnica o normalista 12 Si
456 Si 27 Mujer Básica primaria 7 Si
457 NA NA NA NA NA NA
458 NA NA NA NA NA NA
459 No 38 Hombre Media académica, media técnica o normalista 1 Si
460 NA NA NA NA NA NA
461 NA NA NA NA NA NA
462 NA NA NA NA NA NA
463 Si 35 Mujer Básica primaria 20 No
464 No 25 Hombre Básica secundaria 2 Si
465 No 29 Hombre Media académica, media técnica o normalista 6 Si
466 NA NA NA NA NA NA
467 No 30 Hombre Básica primaria 3 No
468 No 61 Hombre Básica primaria 51 Si
469 No 57 Hombre Básica primaria 5 Si
470 No 22 Hombre Básica secundaria 3 Si
471 No 47 Hombre Básica secundaria 7 Si
472 Si 28 Hombre Media académica, media técnica o normalista 0 Si
473 Si 69 Hombre Básica primaria 5 Si
474 Si 55 Hombre Básica secundaria 25 Si
475 NA NA NA NA NA NA
476 No 36 Hombre Básica secundaria 6 Si
477 No 26 Hombre Ninguno 20 No
478 NA NA NA NA NA NA
479 NA NA NA NA NA NA
480 Si 40 Hombre Básica secundaria 14 Si
481 Si 34 Hombre Básica secundaria 9 Si
482 Si 41 Hombre Básica secundaria 35 Si
483 Si 75 Hombre Básica primaria 60 Si
484 Si 46 Hombre Básica secundaria 13 Si
485 No 36 Hombre Básica primaria 30 No
486 NA NA NA NA NA NA
487 Si 33 Mujer Básica secundaria 1 Si
488 Si 36 Hombre Básica secundaria 15 Si
489 Si 39 Hombre Media académica, media técnica o normalista 5 Si
490 No 42 Hombre Básica primaria 14 Si
491 Si 46 Hombre Básica primaria 27 Si
492 Si 75 Hombre Básica secundaria 40 Si
493 No 65 Hombre Básica secundaria 37 Si
494 Si 29 Hombre Ninguno 17 No
495 NA NA NA NA NA NA
496 No 28 Hombre Media académica, media técnica o normalista 1 Si
497 No 25 Mujer Universitario o Posgrado 1 Si
498 Si 55 Hombre Básica primaria 20 Si
499 No 44 Mujer Básica primaria 30 Si
500 NA NA NA NA NA NA
501 No 32 Hombre Media académica, media técnica o normalista 2 Si
502 Si 29 Mujer Media académica, media técnica o normalista 7 Si
503 Si 50 Hombre Básica primaria 4 Si
504 No 18 Hombre Básica primaria 7 No
505 Si 24 Hombre Básica primaria 2 Si
506 No 21 Mujer Básica secundaria 7 Si
507 No 47 Hombre Básica primaria 6 Si
508 Si 24 Hombre Media académica, media técnica o normalista 4 Si
509 Si 41 Hombre Básica secundaria 0 Si
510 Si 24 Hombre Media académica, media técnica o normalista 4 Si
511 Si 30 Hombre Básica secundaria 7 Si
512 No 31 Hombre Básica secundaria 17 Si
513 No 35 Hombre Básica secundaria 10 Si
514 No 42 Hombre Ninguno 32 No
515 No 42 Hombre Básica secundaria 15 Si
516 Si 27 Hombre Básica secundaria 9 Si
517 No 75 Hombre Básica primaria 0 Si
518 Si 38 Mujer Básica primaria 5 Si
519 NA NA NA NA NA NA
520 Si 35 Hombre Básica secundaria 24 Si
521 Si 36 Hombre Básica secundaria 5 Si
522 Si 25 Mujer Básica secundaria 1 Si
523 Si 30 Hombre Básica primaria 2 Si
524 Si 24 Hombre Básica secundaria 8 Si
525 NA NA NA NA NA NA
526 Si 28 Hombre Básica primaria 3 Si
527 Si 39 Hombre Básica secundaria 2 Si
528 NA NA NA NA NA NA
529 No 34 Hombre Básica primaria 15 Si
530 Si 48 Hombre Básica secundaria 4 Si
531 Si 58 Hombre Básica primaria 50 No
532 Si 18 Hombre Básica secundaria 3 Si
533 Si 63 Hombre Universitario o Posgrado 25 Si
534 Si 44 Hombre Básica secundaria 8 Si
535 No 39 Hombre Básica secundaria 0 Si
536 Si 34 Mujer Básica secundaria 1 Si
537 Si 63 Hombre Básica primaria 20 Si
538 Si 15 Hombre Media académica, media técnica o normalista 0 Si
539 No 21 Mujer Básica primaria 2 Si
540 Si 35 Hombre Básica primaria 3 Si
541 No 25 Hombre Media académica, media técnica o normalista 20 Si
542 Si 32 Hombre Media académica, media técnica o normalista 6 Si
543 Si 22 Hombre Básica primaria 1 No
544 Si 26 Hombre Media académica, media técnica o normalista 5 Si
545 No 36 Hombre Media académica, media técnica o normalista 3 Si
546 Si 40 Hombre Básica primaria 30 Si
547 No 26 Hombre Básica primaria 8 Si
548 Si 31 Hombre Básica secundaria 4 Si
549 No 61 Hombre Básica primaria 20 Si
550 Si 55 Hombre Media académica, media técnica o normalista 7 Si
551 No 35 Mujer Media académica, media técnica o normalista 3 Si
552 No 31 Hombre Media académica, media técnica o normalista 4 Si
553 Si 29 Hombre Universitario o Posgrado 2 Si
554 Si 64 Hombre Básica primaria 47 Si
555 Si 31 Hombre Básica secundaria 6 Si
556 No 44 Hombre Básica primaria 30 Si
557 No 55 Hombre Básica primaria 25 No
558 No 59 Hombre Básica primaria 45 Si
559 No 45 Hombre Básica secundaria 5 Si
560 Si 25 Hombre Básica secundaria 2 Si
561 No 39 Hombre Básica secundaria 17 Si
562 NA NA NA NA NA NA
563 Si 64 Hombre Básica primaria 20 Si
564 No 75 Mujer Ninguno 7 Si
565 Si 59 Hombre Media académica, media técnica o normalista 6 Si
566 No 28 Hombre Básica secundaria 11 Si
567 NA NA NA NA NA NA
568 Si 65 Hombre Universitario o Posgrado 16 Si
569 Si 37 Hombre Básica secundaria 1 Si
570 NA NA NA NA NA NA
571 No 33 Hombre Básica secundaria 3 Si
572 Si 56 Hombre Básica secundaria 8 Si
573 No 48 Hombre Básica secundaria 30 Si
574 NA NA NA NA NA NA
575 NA NA NA NA NA NA
576 Si 45 Hombre Media académica, media técnica o normalista 0 Si
577 No 30 Hombre Media académica, media técnica o normalista 10 Si
578 Si 29 Mujer Básica secundaria 4 Si
579 No 49 Hombre Básica primaria 34 Si
580 Si 43 Hombre Media académica, media técnica o normalista 25 Si
581 NA NA NA NA NA NA
582 No 53 Hombre Básica primaria 3 Si
583 Si 56 Hombre Básica primaria 2 Si
584 No 47 Hombre Básica secundaria 5 Si
585 Si 58 Hombre Básica secundaria 6 Si
586 Si 51 Hombre Básica primaria 7 Si
587 No 53 Hombre Básica secundaria 34 Si
588 Si 57 Hombre Básica primaria 30 Si
589 No 49 Hombre Media académica, media técnica o normalista 14 Si
590 Si 40 Hombre Media académica, media técnica o normalista 2 Si
591 Si 31 Hombre Básica secundaria 15 Si
592 Si 23 Hombre Básica primaria 1 No
593 Si 22 Hombre Básica secundaria 1 Si
594 Si 49 Hombre Media académica, media técnica o normalista 0 Si
595 No 32 Hombre Media académica, media técnica o normalista 19 Si
596 Si 54 Hombre Básica primaria 30 No
597 Si 27 Hombre Básica primaria 10 No
598 No 31 Mujer Básica primaria 2 Si
599 NA NA NA NA NA NA
600 No 31 Hombre Media académica, media técnica o normalista 9 Si
601 NA NA NA NA NA NA
602 No 75 Hombre Ninguno 6 No
603 No 22 Mujer Básica primaria 6 Si
604 Si 49 Hombre Media académica, media técnica o normalista 33 Si
605 Si 26 Hombre Básica secundaria 9 Si
606 Si 25 Hombre Básica primaria 2 Si
607 No 26 Hombre Básica secundaria 10 Si
608 NA NA NA NA NA NA
609 No 51 Hombre Media académica, media técnica o normalista 30 Si
610 NA NA NA NA NA NA
611 NA NA NA NA NA NA
612 No 75 Hombre Básica primaria 17 Si
613 No 40 Hombre Básica secundaria 5 Si
614 Si 22 Mujer Media académica, media técnica o normalista 1 Si
615 No 46 Mujer Básica primaria 20 Si
616 No 44 Hombre Básica secundaria 30 Si
617 NA NA NA NA NA NA
618 No 36 Hombre Básica primaria 9 Si
619 No 75 Hombre Básica primaria 0 No
620 Si 61 Hombre Básica secundaria 1 Si
621 Si 63 Hombre Universitario o Posgrado 9 Si
622 Si 34 Hombre Básica secundaria 20 Si
623 Si 33 Hombre Media académica, media técnica o normalista 5 Si
624 Si 41 Hombre Básica primaria 20 Si
625 No 46 Hombre Básica primaria 2 No
626 No 44 Hombre Universitario o Posgrado 10 Si
627 NA NA NA NA NA NA
628 Si 30 Mujer Básica secundaria 5 Si
629 No 66 Hombre Básica primaria 12 Si
630 No 63 Hombre Básica secundaria 10 Si
631 Si 34 Hombre Básica secundaria 24 Si
632 No 29 Hombre Media académica, media técnica o normalista 1 Si
633 Si 27 Hombre Básica secundaria 2 Si
634 No 37 Mujer Media académica, media técnica o normalista 22 Si
635 No 32 Hombre Básica secundaria 2 Si
636 No 35 Hombre Básica primaria 20 No
637 Si 37 Mujer Básica secundaria 24 Si
638 NA NA NA NA NA NA
639 No 20 Hombre Básica secundaria 10 Si
640 No 31 Hombre Media académica, media técnica o normalista 3 Si
641 No 34 Hombre Media académica, media técnica o normalista 8 Si
642 Si 28 Hombre Básica secundaria 4 Si
643 No 58 Hombre Básica primaria 15 No
644 Si 42 Hombre Básica secundaria 15 Si
645 No 44 Hombre Básica primaria 22 Si
646 No 36 Hombre Media académica, media técnica o normalista 8 Si
647 Si 32 Hombre Básica primaria 16 Si
648 No 36 Hombre Básica primaria 9 Si
649 Si 37 Hombre Básica primaria 27 Si
650 No 47 Mujer Preescolar 33 No
651 Si 32 Hombre Básica secundaria 10 Si
652 No 56 Hombre Ninguno 30 No
653 Si 49 Hombre Básica secundaria 8 Si
654 Si 27 Hombre Básica secundaria 2 Si
655 Si 27 Hombre Básica secundaria 19 Si
656 Si 56 Mujer Básica secundaria 20 Si
657 No 28 Hombre Básica secundaria 5 Si
658 Si 25 Hombre Básica primaria 14 Si
659 No 38 Hombre Básica secundaria 0 Si
660 Si 63 Hombre Media académica, media técnica o normalista 12 Si
661 No 54 Hombre Básica primaria 10 Si
662 No 35 Hombre Básica secundaria 5 Si
663 No 53 Hombre Básica primaria 17 Si
664 No 25 Hombre Básica secundaria 10 Si
665 Si 35 Hombre Básica secundaria 3 Si
666 No 63 Hombre Básica primaria 40 Si
667 No 30 Mujer Media académica, media técnica o normalista 10 Si
668 Si 25 Hombre Básica secundaria 11 Si
669 No 27 Hombre Básica primaria 6 Si
670 No 23 Hombre Básica secundaria 18 Si
671 Si 56 Mujer Básica secundaria 0 Si
672 Si 61 Hombre Básica secundaria 2 Si
673 NA NA NA NA NA NA
674 Si 59 Hombre Básica primaria 6 Si
675 Si 36 Hombre Básica secundaria 26 Si
676 No 60 Hombre Media académica, media técnica o normalista 40 Si
677 Si 63 Mujer Ninguno 12 No
678 No 25 Hombre Media académica, media técnica o normalista 0 Si
679 No 29 Hombre Media académica, media técnica o normalista 6 Si
680 Si 23 Mujer Básica primaria 2 Si
681 No 26 Hombre Básica secundaria 4 Si
682 Si 51 Mujer Universitario o Posgrado 0 Si
683 No 29 Hombre Básica secundaria 2 Si
684 No 60 Hombre Ninguno 50 No
685 No 49 Hombre Básica secundaria 1 Si
686 Si 62 Hombre Básica primaria 20 Si
687 Si 65 Hombre Básica primaria 40 Si
688 No 41 Hombre Básica primaria 19 Si
689 No 21 Hombre Básica secundaria 2 Si
690 Si 60 Hombre Básica primaria 2 Si
691 Si 52 Hombre Ninguno 20 No
692 Si 25 Hombre Básica secundaria 4 Si
693 No 26 Hombre Básica secundaria 10 Si
694 Si 43 Hombre Media académica, media técnica o normalista 23 Si
695 Si 37 Hombre Media académica, media técnica o normalista 27 Si
696 Si 51 Hombre Básica secundaria 12 Si
697 No 62 Hombre Básica primaria 1 Si
698 NA NA NA NA NA NA
699 No 23 Mujer Media académica, media técnica o normalista 4 Si
700 No 42 Hombre Básica secundaria 35 Si
701 Si 60 Hombre Ninguno 22 No
702 Si 49 Mujer Ninguno 44 No
703 Si 31 Hombre Básica primaria 9 Si
704 No 42 Hombre Básica primaria 30 Si
705 Si 32 Hombre Básica primaria 3 Si
706 No 54 Hombre Media académica, media técnica o normalista 2 Si
707 No 38 Hombre Básica primaria 22 Si
708 No 20 Hombre Básica primaria 0 Si
709 Si 25 Hombre Media académica, media técnica o normalista 2 Si
710 Si 33 Hombre Media académica, media técnica o normalista 15 Si
711 No 23 Hombre Media académica, media técnica o normalista 3 Si
712 Si 62 Hombre Universitario o Posgrado 12 Si
713 No 51 Hombre Básica primaria 13 Si
714 Si 31 Hombre Básica secundaria 8 Si
715 No 44 Hombre Básica primaria 15 Si
716 No 62 Hombre Preescolar 10 No
717 No 55 Hombre Media académica, media técnica o normalista 25 Si
718 No 16 Hombre Básica primaria 10 Si
719 No 25 Hombre Ninguno 5 No
720 Si 40 Hombre Ninguno 27 No
721 No 46 Hombre Básica secundaria 18 Si
722 Si 45 Hombre Básica secundaria 7 Si
723 No 63 Hombre Básica secundaria 10 Si
724 No 56 Hombre Básica primaria 20 Si
725 No 22 Hombre Básica primaria 14 No
726 No 39 Hombre Universitario o Posgrado 5 Si
727 Si 72 Hombre Básica primaria 7 Si
728 Si 51 Hombre Básica secundaria 15 Si
729 No 39 Hombre Básica secundaria 10 Si
730 Si 45 Hombre Básica secundaria 30 Si
731 No 38 Mujer Básica secundaria 7 Si
732 No 33 Hombre Técnica profesional o tegnológica 12 Si
733 Si 24 Hombre Básica primaria 11 Si
734 NA NA NA NA NA NA
735 Si 48 Mujer Básica secundaria 11 Si
736 Si 40 Hombre Media académica, media técnica o normalista 2 Si
737 No 27 Mujer Media académica, media técnica o normalista 3 Si
738 No 54 Hombre Básica primaria 8 Si
739 No 47 Hombre Básica secundaria 30 Si
740 Si 35 Hombre Básica primaria 25 Si
741 No 50 Mujer Básica secundaria 20 Si
742 No 61 Mujer Ninguno 2 No
743 Si 22 Hombre Media académica, media técnica o normalista 1 Si
744 Si 56 Hombre Media académica, media técnica o normalista 0 Si
745 NA NA NA NA NA NA
746 Si 35 Hombre Básica secundaria 22 Si
747 No 31 Hombre Básica secundaria 2 Si
748 Si 75 Hombre Básica primaria 30 Si
749 Si 58 Hombre Básica primaria 6 No
750 Si 71 Hombre Básica primaria 20 No
751 Si 31 Hombre Básica secundaria 5 Si
752 Si 38 Mujer Básica primaria 20 Si
753 Si 28 Hombre Básica secundaria 16 Si
754 No 53 Hombre Básica secundaria 6 Si
755 NA NA NA NA NA NA
756 Si 53 Hombre Ninguno 45 No
757 No 62 Hombre Básica primaria 8 No
758 Si 43 Hombre Básica secundaria 2 Si
759 Si 33 Hombre Básica secundaria 10 Si
760 Si 33 Hombre Básica secundaria 7 Si
761 Si 48 Hombre Preescolar 37 Si
762 No 46 Hombre Básica primaria 2 Si
763 No 51 Hombre Técnica profesional o tegnológica 2 Si
764 No 44 Hombre Básica secundaria 6 Si
765 Si 75 Hombre Básica primaria 5 Si
766 No 59 Hombre Básica secundaria 20 Si
767 Si 37 Hombre Media académica, media técnica o normalista 27 Si
768 No 35 Mujer Media académica, media técnica o normalista 2 Si
769 Si 44 Hombre Media académica, media técnica o normalista 5 Si
770 No 36 Hombre Básica secundaria 12 Si
771 No 23 Hombre Básica primaria 15 Si
772 No 47 Mujer Técnica profesional o tegnológica 2 Si
773 Si 53 Hombre Básica secundaria 15 Si
774 Si 29 Hombre Básica secundaria 3 Si
775 Si 60 Hombre Básica primaria 7 Si
776 Si 29 Hombre Media académica, media técnica o normalista 17 Si
777 Si 20 Hombre Media académica, media técnica o normalista 4 Si
778 No 20 Hombre Básica secundaria 6 Si
779 Si 60 Hombre Básica primaria 30 Si
780 Si 30 Hombre Ninguno 4 No
781 No 59 Hombre Básica primaria 20 Si
782 No 26 Hombre Media académica, media técnica o normalista 10 Si
783 No 25 Hombre Básica secundaria 8 Si
784 Si 35 Hombre Media académica, media técnica o normalista 11 Si
785 Si 39 Hombre Media académica, media técnica o normalista 21 Si
786 NA NA NA NA NA NA
787 Si 54 Mujer Ninguno 40 Si
788 No 41 Hombre Básica primaria 10 Si
789 No 54 Hombre Media académica, media técnica o normalista 45 Si
790 Si 37 Mujer Media académica, media técnica o normalista 10 Si
791 Si 44 Hombre Básica primaria 2 Si
792 Si 43 Hombre Técnica profesional o tegnológica 6 Si
793 Si 58 Hombre Básica secundaria 5 Si
794 Si 36 Hombre Básica primaria 26 Si
795 Si 47 Hombre Básica primaria 4 Si
796 Si 25 Hombre Básica secundaria 5 Si
797 NA NA NA NA NA NA
798 Si 24 Hombre Universitario o Posgrado 5 Si
799 Si 63 Hombre Básica primaria 53 Si
800 Si 58 Hombre Básica secundaria 5 Si
801 No 62 Hombre Básica primaria 8 Si
802 Si 54 Hombre Media académica, media técnica o normalista 1 Si
803 No 67 Hombre Básica primaria 22 Si
804 No 50 Hombre Media académica, media técnica o normalista 20 Si
805 Si 39 Hombre Media académica, media técnica o normalista 16 Si
806 No 25 Hombre Básica secundaria 10 Si
807 No 55 Hombre Ninguno 35 No
808 Si 30 Hombre Básica secundaria 5 Si
809 Si 55 Hombre Media académica, media técnica o normalista 16 Si
810 No 40 Hombre Básica secundaria 25 Si
811 No 40 Mujer Ninguno 0 No
812 Si 48 Hombre Básica primaria 41 Si
813 No 69 Hombre Básica primaria 6 Si
814 Si 28 Hombre Media académica, media técnica o normalista 0 Si
815 No 31 Mujer Ninguno 17 No
816 No 27 Mujer Media académica, media técnica o normalista 5 Si
817 Si 37 Hombre Técnica profesional o tegnológica 3 Si
818 Si 37 Hombre Media académica, media técnica o normalista 10 Si
819 Si 55 Hombre Básica secundaria 15 Si
820 Si 58 Hombre Media académica, media técnica o normalista 10 Si
821 No 57 Hombre Básica primaria 8 Si
822 No 20 Hombre Preescolar 0 No
823 No 54 Hombre Básica primaria 30 Si
824 No 21 Mujer Media académica, media técnica o normalista 0 Si
825 Si 36 Hombre Básica primaria 26 Si
826 No 39 Mujer Ninguno 4 No
827 No 42 Hombre Media académica, media técnica o normalista 30 Si
828 Si 57 Hombre Básica primaria 2 Si
829 Si 27 Hombre Básica primaria 10 Si
830 No 31 Hombre Básica primaria 15 Si
831 No 25 Mujer Media académica, media técnica o normalista 7 Si
832 Si 38 Hombre Básica secundaria 7 Si
833 No 43 Hombre Media académica, media técnica o normalista 2 Si
834 No 28 Hombre Básica primaria 2 Si
835 No 38 Hombre Básica secundaria 15 Si
836 No 35 Hombre Básica primaria 27 Si
837 Si 52 Hombre Básica primaria 25 Si
838 Si 22 Hombre Básica secundaria 10 Si
839 Si 38 Hombre Básica secundaria 8 Si
840 No 63 Hombre Universitario o Posgrado 30 Si
841 No 36 Hombre Básica secundaria 15 Si
842 Si 56 Hombre Básica secundaria 6 Si
843 No 52 Hombre Básica primaria 7 Si
844 Si 40 Hombre Básica primaria 19 Si
845 No 39 Hombre Ninguno 30 No
846 No 62 Hombre Básica secundaria 20 Si
847 No 49 Hombre Básica secundaria 35 Si
848 No 42 Hombre Básica primaria 8 Si
849 No 50 Hombre Media académica, media técnica o normalista 15 Si
850 Si 40 Hombre Media académica, media técnica o normalista 15 Si
851 No 27 Hombre Básica primaria 10 Si
852 Si 52 Hombre Básica primaria 3 Si
853 Si 48 Hombre Básica secundaria 20 Si
854 No 29 Hombre Media académica, media técnica o normalista 7 Si
855 No 38 Hombre Básica secundaria 23 Si
856 Si 27 Hombre Básica primaria 14 Si
857 No 33 Hombre Básica primaria 10 Si
858 No 63 Hombre Media académica, media técnica o normalista 15 Si
859 Si 17 Hombre Básica primaria 13 No
860 No 65 Hombre Básica primaria 20 No
861 NA NA NA NA NA NA
862 No 33 Hombre Básica primaria 12 Si
863 Si 19 Hombre Media académica, media técnica o normalista 4 Si
864 Si 54 Hombre Media académica, media técnica o normalista 34 Si
865 Si 54 Hombre Técnica profesional o tegnológica 12 Si
866 Si 26 Hombre Media académica, media técnica o normalista 15 Si
867 Si 63 Hombre Básica primaria 15 Si
868 No 47 Hombre Básica primaria 17 Si
869 No 57 Hombre Básica secundaria 10 Si
870 Si 28 Hombre Media académica, media técnica o normalista 12 Si
871 No 40 Mujer Básica primaria 31 Si
872 No 31 Hombre Preescolar 25 No
873 No 29 Hombre Media académica, media técnica o normalista 1 Si
874 No 31 Hombre Media académica, media técnica o normalista 17 Si
875 No 73 Hombre Básica secundaria 19 Si
876 Si 39 Mujer Universitario o Posgrado 10 Si
877 Si 52 Hombre Media académica, media técnica o normalista 10 Si
878 No 37 Mujer Básica secundaria 9 Si
879 NA NA NA NA NA NA
880 Si 63 Hombre Universitario o Posgrado 28 Si
881 No 46 Hombre Preescolar 38 No
882 NA NA NA NA NA NA
883 Si 53 Hombre Básica primaria 40 Si
884 No 67 Hombre Ninguno 17 No
885 Si 31 Mujer Básica secundaria 18 Si
886 NA NA NA NA NA NA
887 Si 34 Hombre Básica secundaria 21 Si
888 Si 29 Hombre Básica secundaria 1 Si
889 Si 34 Hombre Básica primaria 5 Si
890 Si 41 Hombre Básica primaria 28 No
891 Si 36 Mujer Básica secundaria 12 Si
892 Si 38 Hombre Media académica, media técnica o normalista 4 Si
893 No 30 Mujer Ninguno 20 No
894 No 36 Mujer Básica primaria 12 Si
895 Si 32 Hombre Media académica, media técnica o normalista 22 Si
896 No 34 Hombre Básica secundaria 14 Si
897 No 36 Hombre Media académica, media técnica o normalista 15 Si
898 No 31 Hombre Básica primaria 16 Si
899 No 40 Hombre Básica primaria 32 Si
900 Si 49 Hombre Básica secundaria 0 Si
901 No 28 Hombre Media académica, media técnica o normalista 1 Si
902 Si 39 Hombre Básica primaria 20 Si
903 Si 58 Hombre Básica primaria 25 Si
904 Si 45 Hombre Ninguno 36 Si
905 Si 26 Hombre Básica primaria 13 Si
906 No 26 Hombre Básica secundaria 1 Si
907 Si 64 Hombre Media académica, media técnica o normalista 10 Si
908 Si 24 Mujer Media académica, media técnica o normalista 17 Si
909 No 61 Hombre Básica primaria 20 Si
910 Si 69 Hombre Universitario o Posgrado 54 Si
911 No 56 Hombre Básica primaria 32 Si
912 No 33 Hombre Universitario o Posgrado 4 Si
913 No 46 Hombre Universitario o Posgrado 3 Si
914 Si 23 Hombre Básica primaria 1 Si
915 Si 42 Hombre Básica secundaria 10 Si
916 Si 56 Hombre Media académica, media técnica o normalista 20 Si
917 Si 40 Hombre Básica secundaria 8 Si
918 No 42 Mujer Básica primaria 30 Si
919 Si 49 Hombre Básica secundaria 12 Si
920 No 30 Mujer Preescolar 13 No
921 No 56 Hombre Básica primaria 50 Si
922 Si 61 Hombre Básica secundaria 15 Si
923 Si 32 Hombre Media académica, media técnica o normalista 11 Si
924 No 33 Hombre Básica primaria 20 Si
925 Si 43 Hombre Básica primaria 35 Si
926 Si 62 Hombre Media académica, media técnica o normalista 0 Si
927 No 73 Hombre Básica primaria 12 Si
928 Si 29 Hombre Preescolar 17 No
929 Si 32 Hombre Básica secundaria 11 Si
930 Si 26 Hombre Media académica, media técnica o normalista 2 Si
931 Si 55 Mujer Básica secundaria 30 Si
932 Si 37 Hombre Media académica, media técnica o normalista 10 Si
933 No 26 Hombre Básica primaria 17 Si
934 No 42 Hombre Básica secundaria 16 Si
935 Si 63 Hombre Básica primaria 50 Si
936 Si 57 Hombre Media académica, media técnica o normalista 6 Si
937 No 45 Hombre Básica primaria 20 Si
938 NA NA NA NA NA NA
939 Si 58 Hombre Media académica, media técnica o normalista 45 Si
940 Si 61 Hombre Básica secundaria 8 Si
941 Si 27 Hombre Media académica, media técnica o normalista 13 Si
942 No 43 Hombre Básica secundaria 6 Si
943 No 34 Hombre Básica secundaria 18 Si
944 No 37 Hombre Básica secundaria 15 Si
945 Si 39 Hombre Media académica, media técnica o normalista 20 Si
946 NA NA NA NA NA NA
947 NA NA NA NA NA NA
948 Si 40 Hombre Básica secundaria 30 Si
949 No 50 Hombre Básica secundaria 12 Si
950 Si 17 Hombre Básica secundaria 10 Si
951 No 38 Hombre Técnica profesional o tegnológica 3 Si
952 No 37 Hombre Básica secundaria 21 Si
953 Si 51 Mujer Básica primaria 28 Si
954 No 34 Hombre Básica secundaria 9 Si
955 Si 42 Hombre Media académica, media técnica o normalista 18 Si
956 No 61 Hombre Ninguno 25 No
957 NA NA NA NA NA NA
958 NA NA NA NA NA NA
959 Si 34 Hombre Media académica, media técnica o normalista 14 Si
960 NA NA NA NA NA NA
961 No 23 Hombre Básica secundaria 2 Si
962 No 48 Hombre Básica secundaria 7 Si
963 NA NA NA NA NA NA
964 Si 46 Hombre Media académica, media técnica o normalista 19 Si
965 No 30 Hombre Básica secundaria 1 Si
966 Si 43 Hombre Media académica, media técnica o normalista 25 Si
967 No 58 Hombre Básica primaria 51 Si
968 NA NA NA NA NA NA
969 No 37 Hombre Básica secundaria 20 Si
970 Si 36 Hombre Básica primaria 7 Si
971 No 31 Hombre Básica secundaria 7 Si
972 No 43 Hombre Básica primaria 30 Si
973 NA NA NA NA NA NA
974 NA NA NA NA NA NA
975 No 47 Hombre Media académica, media técnica o normalista 8 Si
976 No 32 Hombre Básica primaria 4 Si
977 NA NA NA NA NA NA
978 NA NA NA NA NA NA
979 No 30 Hombre Media académica, media técnica o normalista 0 Si
980 NA 34 Hombre NA NA NA
981 Si 65 Hombre Ninguno 8 Si
982 No 40 Hombre Básica primaria 10 Si
983 NA NA NA NA NA NA
984 Si 30 Mujer Básica primaria 20 Si
985 No 15 Hombre Básica secundaria 1 Si
986 Si 30 Mujer Básica secundaria 5 Si
987 No 54 Hombre Básica secundaria 20 Si
988 No 31 Mujer Básica primaria 5 No
989 Si 62 Hombre Media académica, media técnica o normalista 25 Si
990 No 54 Hombre Universitario o Posgrado 20 Si
991 No 75 Hombre Ninguno 60 No
992 No 40 Hombre Ninguno 10 No
993 NA NA NA NA NA NA
994 NA 48 Mujer NA 6 NA
995 NA NA NA NA NA NA
996 NA NA NA NA NA NA
997 NA NA NA NA NA NA
998 Si 23 Hombre Básica primaria 2 Si
999 Si 46 Hombre Media académica, media técnica o normalista 35 Si
1000 NA NA NA NA NA NA

2.3 MODELOS UTILIZADOS

En el desarrollo del presente estudio se aplicaron dos modelos de aprendizaje supervisado: K-Nearest Neighbors (KNN) y Regresión Logística (Logit), con el propósito de predecir qué parte de la población habitante de calle es más propensa a desconocer los programas de ayuda ofrecidos por la alcaldía, a partir de un conjunto de variables sociodemográficas y educativas.

El modelo K-Nearest Neighbors (KNN) se utilizó como un método no paramétrico de clasificación, cuyo principio radica en asignar una categoría a cada individuo según la similitud con sus “vecinos” más cercanos dentro del conjunto de datos. Este modelo permitió identificar patrones de comportamiento y agrupar a las personas según características comunes que influyen en el conocimiento o desconocimiento de los programas institucionales. Para su implementación, se realizó una división del conjunto de datos en grupos de entrenamiento (75%) y prueba (25%), lo que permitió evaluar la capacidad predictiva del modelo y determinar el número óptimo de vecinos que ofreciera la mayor precisión.

Por su parte, el modelo Logit se empleó con el fin de analizar la relación estadística entre las variables independientes y la probabilidad de que un individuo conozca o no los programas ofrecidos por la alcaldía. Este enfoque permitió cuantificar la influencia de cada factor en la variable dependiente, proporcionando una interpretación más profunda sobre los determinantes que explican el desconocimiento de los programas sociales. Al igual que con el KNN, se realizó una partición de los datos y posteriormente se evaluó la capacidad del modelo mediante métricas de desempeño y la construcción de la curva ROC.

La utilización conjunta de ambos modelos permitió contrastar los resultados desde dos perspectivas complementarias: mientras el KNN se centra en la similitud empírica entre individuos, el modelo Logit ofrece una interpretación probabilística y explicativa del fenómeno, lo que contribuye a una comprensión integral del comportamiento de la población habitante de calle frente a las estrategias de apoyo institucional.

3 RESULTADOS DESCRIPTIVOS

3.1 TABLA DE ESTADISTICAS DESCRIPTIVAS

Variable Desv_Estandar Media Mediana Moda Minimo Maximo
1 Edad 13.85187 41.07292 39 36 15 75
2 TiempoCalle 11.52097 13.02444 10 20 0 60

En la anterior tabla se presentan las descripciones estadísticas de las variables Edad y Tiempo en la Calle. Se observa que la edad de los participantes presenta una media de 41,07 años, con una mediana de 39 y una moda de 36, lo que indica que la mayoría de las personas se concentra en edades cercanas a los 40 años. El valor mínimo registrado es de 15 años y el máximo de 75, lo que evidencia una amplia variedad etaria dentro de la población. Asimismo, la desviación estándar de 13,85 muestra una dispersión considerable, lo que sugiere que el grupo está conformado por individuos tanto jóvenes como mayores.

Por otro lado, el tiempo que las personas han permanecido en la calle presenta una media de 13,02 años, una mediana de 10 y una moda de 20, lo que refleja que la mayoría lleva entre 10 y 20 años viviendo en la calle. Los valores observados van desde 0 hasta 60 años, mostrando una alta variabilidad en la duración de vida en la calle. La desviación estándar de 11,52 confirma esta dispersión, indicando diferencias notables entre los entrevistados en cuanto al tiempo de permanencia en esta condición.

3.2 BOXPLOT DE LAS VARIABLES CUANTITATIVAS

# Preparar los datos
HabitantesCalle <- HabitantesCalle %>%
  mutate(
    Edad = as.numeric(Edad),
    TiempoCalle = as.numeric(TiempoCalle)
  )

# Crear data frame combinado
data_box <- HabitantesCalle %>%
  select(Edad, TiempoCalle) %>%
  pivot_longer(cols = c(Edad, TiempoCalle), names_to = "Variable", values_to = "Valor") %>%
  filter(!is.na(Valor))

# Crear boxplots con facetas
g_facetas <- ggplot(data_box, aes(x = Variable, y = Valor, fill = Variable)) +
  geom_boxplot(alpha = 0.8, outlier.color = "red") +
  facet_wrap(~Variable, scales = "free") +
  theme_minimal() +
  labs(
    x = "",
    y = "",
    title = "DISTRIBUCIÓN DE LA EDAD Y TIEMPO VIVIDO EN LA CALLE"
  ) +
  scale_fill_manual(values = c("Edad" = "#F7A7C0", "TiempoCalle" = "#B5EAD7")) +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    strip.text = element_text(size = 14)
  )

# Convertir el gráfico ggplot a plotly
plot_facetas <- ggplotly(g_facetas)

# Ajustar el título en plotly
plot_facetas <- plot_facetas %>%
  layout(
    title = list(
      text = "DISTRIBUCIÓN DE LA EDAD Y TIEMPO VIVIDO EN LA CALLE",
      x = 0.5,  # Centrado horizontalmente
      xanchor = "center",
      font = list(size = 18, family = "Palatino Linotype")
    ),
    margin = list(t = 80)  # Espacio superior para que no se corte
  )

plot_facetas

A partir de los boxplots de las variables Edad y Tiempo en la Calle, se puede confirmar lo observado en el análisis descriptivo de las medidas de dispersión. La distribución de la edad en la población analizada muestra una clara concentración en la adultez media, con valores que oscilan entre los 20 y los 60 años. La mediana, situada en 39 años, indica que la mitad de los individuos tiene menos de esa edad y la otra mitad más. El rango intercuartílico, comprendido aproximadamente entre 30 y 52 años, refleja que la mayoría de los casos se agrupan en ese intervalo, mientras que la moda sugiere la existencia de una edad particularmente frecuente dentro del conjunto. La ausencia de valores atípicos y la simetría del boxplot permiten inferir una distribución relativamente homogénea, sin extremos pronunciados. En conjunto, estos resultados evidencian que la población está compuesta principalmente por adultos, con una dispersión moderada que refleja diversidad generacional, aunque sin presencia significativa de jóvenes o adultos mayores extremos.

En contraste, la variable Tiempo en la Calle presenta una distribución más dispersa y asimétrica. Aunque el valor mínimo es cero indicando la presencia de personas que recientemente ingresaron a esta condición, el valor máximo alcanza los 60 años, lo que evidencia casos de exclusión social prolongada. La mediana de 10 años señala que la mitad de los individuos ha vivido en la calle por menos de una década, mientras que el rango intercuartílico, entre 4 y 20 años, junto con una moda en 20 años, revela un grupo considerable con experiencias prolongadas en esta situación. La presencia de valores que superan la cerca superior del boxplot indica la existencia de outliers, es decir, personas que han permanecido en la calle por periodos significativamente mayores que el resto.

3.3 GRÁFICOS DE TORTAS

# RECODIFICACIÓN DE LA VARIABLE ProgramasAlcaldia
df_pie_programas <- HabitantesCalle2 %>%
  mutate(
    ProgramasAlcaldia = as.character(ProgramasAlcaldia),
    ProgramasAlcaldia = recode(ProgramasAlcaldia, "1" = "Si", "2" = "No", .default = ProgramasAlcaldia)
  ) %>%
  filter(!is.na(ProgramasAlcaldia) & ProgramasAlcaldia != "" & ProgramasAlcaldia %in% c("Si", "No")) %>%
  count(ProgramasAlcaldia) %>%
  mutate(
    pct = n / sum(n) * 100,
    etiqueta_pct = paste0(ProgramasAlcaldia, " ", round(pct, 1), "%"),
    hovertext = paste0(
      ProgramasAlcaldia, "<br>",
      "Cantidad: ", format(n, big.mark = ".", decimal.mark = ","), "<br>",
      "Porcentaje: ", round(pct, 1), "%"
    )
  )

# GRÁFICO DE TORTAS - PROGRAMAS DE LA ALCALDÍA
plot_ly(
  df_pie_programas,
  labels = ~ProgramasAlcaldia,
  values = ~n,
  type = 'pie',
  text = ~etiqueta_pct,
  textinfo = 'text',
  textposition = 'inside',
  textfont = list(size = 18, family = "Arial", color = "black"),
  hoverinfo = 'text',
  hovertext = ~hovertext,
  marker = list(colors = c('#7BB8E6', '#F7A7C0'))  
) %>%
  layout(
    title = list(
      text = "PARTICIPACIÓN EN PROGRAMAS DE LA ALCALDÍA",
      x = 0.5,
      y = 1.05,
      xanchor = "center",
      yanchor = "top",
      font = list(size = 22, family = "Palatino Linotype", color = "#222222")
    ),
    margin = list(t = 100)
  )

La distribución de participación en los programas de la alcaldía muestra una división relativamente equilibrada entre las personas que han accedido a estos servicios y aquellas que no. Si bien se observa una ligera mayoría que no ha participado, el porcentaje de quienes sí lo han hecho es considerable, lo que evidencia un alcance significativo de las iniciativas gubernamentales. Este equilibrio resulta particularmente favorable para el análisis predictivo, ya que, al tratarse de la variable dependiente de salida, una distribución balanceada contribuye a un entrenamiento más estable y representativo de los modelos aplicados, evitando sesgos hacia una de las categorías.

# RECODIFICACIÓN DE LA VARIABLE SEXO
df_pie_sexo <- HabitantesCalle2 %>%
  mutate(
    Sexo = as.character(Sexo),
    Sexo = recode(Sexo, "1" = "Hombre", "2" = "Mujer", .default = Sexo)
  ) %>%
  filter(!is.na(Sexo) & Sexo != "" & Sexo %in% c("Hombre", "Mujer")) %>%
  count(Sexo) %>%
  mutate(
    pct = n / sum(n) * 100,
    etiqueta_pct = paste0(round(pct, 1), "%"),
    hovertext = paste0(
      Sexo, "<br>",
      "Cantidad: ", format(n, big.mark = ".", decimal.mark = ","), "<br>",
      "Porcentaje: ", round(pct, 1), "%"
    )
  )

# GRÁFICO DE TORTAS - SEXO CON TÍTULO
plot_ly(
  df_pie_sexo,
  labels = ~Sexo,
  values = ~n,
  type = 'pie',
  text = ~paste0(Sexo, " ", etiqueta_pct),
  textinfo = 'text',
  textposition = 'inside',
  textfont = list(size = 18, family = "Arial"),
  hoverinfo = 'text',
  hovertext = ~hovertext,
  marker = list(colors = c('#7BB8E6', '#F7A7C0'))
) %>%
  layout(
    title = list(
      text = "DISTRIBUCIÓN POR EL SEXO DE HABITANTES",
      x = 0.5,  
      xanchor = "center",
      yanchor = "top",
      font = list(size = 22, family = "Palatino Linotype", color = "#222222")
    ),
    margin = list(t = 100)
  )

La composición por sexo evidencia una marcada predominancia masculina dentro de la población analizada. El porcentaje de mujeres es considerablemente menor, lo que podría estar asociado a factores estructurales, sociales o a dinámicas específicas de exclusión. Esta diferencia en la representación por género podría influir en el desempeño del modelo supervisado, ya que un desequilibrio entre clases podría generar sesgos en la predicción sobre el conocimiento de los programas de ayuda ofrecidos por la alcaldía.

# RECODIFICACIÓN DE LA VARIABLE LeeEscribe
df_pie_lee <- HabitantesCalle2 %>%
  mutate(
    LeeEscribe = as.character(LeeEscribe),
    LeeEscribe = recode(LeeEscribe, "1" = "Si", "2" = "No", .default = LeeEscribe)
  ) %>%
  filter(!is.na(LeeEscribe) & LeeEscribe != "" & LeeEscribe %in% c("Si", "No")) %>%
  count(LeeEscribe) %>%
  mutate(
    pct = n / sum(n) * 100,
    etiqueta_pct = paste0(LeeEscribe, " ", round(pct, 1), "%"),
    hovertext = paste0(
      LeeEscribe, "<br>",
      "Cantidad: ", format(n, big.mark = ".", decimal.mark = ","), "<br>",
      "Porcentaje: ", round(pct, 1), "%"
    )
  )


# GRÁFICO DE TORTA - LECTURA Y ESCRITURA
plot_ly(
  df_pie_lee,
  labels = ~LeeEscribe,
  values = ~n,
  type = 'pie',
  text = ~etiqueta_pct,
  textinfo = 'text',
  textposition = 'inside',
  textfont = list(size = 18, family = "Arial", color = "black"),
  hoverinfo = 'text',
  hovertext = ~hovertext,
  marker = list(colors = c('#F7A7C0', '#7BB8E6'))
) %>%
  layout(
    title = list(
      text = "DISTRIBUCIÓN POR LA CAPACIDAD DE LECTURA Y ESCRITURA",
      x = 0.5,
      y = 2.5,  
      xanchor = "center",
      yanchor = "top",
      font = list(size = 20, family = "Palatino Linotype", color = "#222222")
    ),
    margin = list(t = 100)  
  )

La gran mayoría de los entrevistados cuenta con habilidades básicas de lectura y escritura, lo cual podría influir en el modelo al introducir un ligero sesgo. Sin embargo, el porcentaje restante que no posee estas capacidades representa un grupo especialmente vulnerable, por lo que es fundamental considerarlo al momento de realizar las predicciones. El analfabetismo podría ser un factor altamente influyente en el desconocimiento de los programas de ayuda ofrecidos por la alcaldía.

3.4 GRÁFICO DE BARRAS

# GRAFICO DE BARRAS NIVEL DE EDUCACIÓN

# CONVERSIÓN DE VARIABLES CON as.character y factor
HabitantesCalle <- HabitantesCalle %>%
  mutate(
    NivelEducacion = as.character(NivelEducacion),
    NivelEducacion = recode(NivelEducacion,
      "1" = "Preescolar",
      "2" = "Básica primaria",
      "3" = "Básica secundaria",
      "4" = "Media académica / técnica / normalista",
      "5" = "Técnica profesional o tecnológica",
      "6" = "Universitario o Posgrado",
      "13" = "Ninguno",
      .default = NA_character_
    ),
    NivelEducacion = ifelse(is.na(NivelEducacion), "No responde", NivelEducacion),
    NivelEducacion = factor(NivelEducacion, levels = c(
      "Preescolar",
      "Básica primaria",
      "Básica secundaria",
      "Media académica / técnica / normalista",
      "Técnica profesional o tecnológica",
      "Universitario o Posgrado",
      "Ninguno",
      "No responde"
    ))
  )

# Contar niveles educativos
df_bar_edu <- HabitantesCalle %>%
  count(NivelEducacion) %>%
  mutate(
    hovertext = paste0(
      "Nivel educativo: ", NivelEducacion, "<br>",
      "Cantidad: ", n
    )
  )

# Gráfico con colores pastel y etiquetas
g_nivel <- plot_ly(
  df_bar_edu,
  x = ~NivelEducacion,
  y = ~n,
  type = 'bar',
  text = ~n,
  textposition = 'outside',
  hovertext = ~hovertext,
  hoverinfo = 'text',
  marker = list(
    color = c(
      "#FADADD",  # Preescolar
      "#B5EAD7",  # Básica primaria
      "#C7CEEA",  # Básica secundaria
      "#FFDAC1",  # Media académica / técnica / normalista
      "#E2F0CB",  # Técnica profesional o tecnológica
      "#B5E5CF",  # Universitario o Posgrado
      "#F6C5C0",  # Ninguno
      "#D3D3D3"   # No responde
    )
  )
) %>%
  layout(
    title = "NIVEL DE EDUCACIÓN ALCANZADO",
    xaxis = list(title = "NIVEL EDUCATIVO"),
    yaxis = list(title = "CANTIDAD")
  )

g_nivel

La distribución del nivel académico muestra que la mayoría de los habitantes de calle cuentan con estudios básicos, principalmente hasta la secundaria. En contraste, los niveles educativos más altos presentan una participación muy baja. Este resultado es útil para el modelo, ya que permite verificar si las personas con menor nivel educativo tienen una mayor probabilidad de desconocer los programas de ayuda ofrecidos por la alcaldía.

4 CONSTRUCCIÓN DE LOS MODELOS

El modelo KNN se implementó con el propósito de clasificar la variable binaria ProgramasAlcaldia, que indica si una persona conoce o no los programas de la Alcaldía. El método se basa en la similitud entre observaciones: cada caso nuevo se clasifica según la categoría más frecuente entre sus k vecinos más cercanos en el espacio de las variables predictoras.

4.1 MODELO 1: KNN

4.1.1 Resultados del modelo

#Establecer semilla
set.seed(28)

#Codigo para usar todos los núcleos menos 1 (evita saturar el PC y que cargue mas rapido)
cl <- makeCluster(parallel::detectCores() - 1)
registerDoParallel(cl)

#Definir valores de k optimas
grid <- expand.grid(k = seq(1, 500, by = 2))  # 26 valores impares de k

modelo_knn <- train(
  ProgramasAlcaldia ~ .,
  data = datos_entrena,
  method = "knn",
  preProcess = c("center", "scale"),
  tuneGrid = grid,
  trControl = trainControl(method = "cv", number = 10) # 10 pliegues
)

stopCluster(cl)


modelo_knn
k-Nearest Neighbors 

7552 samples
   5 predictor
   2 classes: 'No', 'Si' 

Pre-processing: centered (10), scaled (10) 
Resampling: Cross-Validated (10 fold) 
Summary of sample sizes: 6797, 6797, 6796, 6797, 6797, 6796, ... 
Resampling results across tuning parameters:

  k    Accuracy   Kappa     
    1  0.5254259  0.04604400
    3  0.5313813  0.05576875
    5  0.5350913  0.06206536
    7  0.5377398  0.06613415
    9  0.5389308  0.06767187
   11  0.5386678  0.06710607
   13  0.5380083  0.06508549
   15  0.5362872  0.06140650
   17  0.5384041  0.06474063
   19  0.5433039  0.07473500
   21  0.5372131  0.06171924
   23  0.5336368  0.05373176
   25  0.5374766  0.06101493
   27  0.5409200  0.06859812
   29  0.5388013  0.06349471
   31  0.5430390  0.07160367
   33  0.5475413  0.08044963
   35  0.5486002  0.08252699
   37  0.5467467  0.07814724
   39  0.5468795  0.07878504
   41  0.5521760  0.08865687
   43  0.5541627  0.09263925
   45  0.5517786  0.08767867
   47  0.5507194  0.08552375
   49  0.5484674  0.08074926
   51  0.5499224  0.08360515
   53  0.5516439  0.08695347
   55  0.5497891  0.08296029
   57  0.5501868  0.08309567
   59  0.5503185  0.08287299
   61  0.5544234  0.09115849
   63  0.5520414  0.08590420
   65  0.5523054  0.08600615
   67  0.5533626  0.08808784
   69  0.5533626  0.08837342
   71  0.5528345  0.08709283
   73  0.5527028  0.08672577
   75  0.5492589  0.08009429
   77  0.5495254  0.07958882
   79  0.5501862  0.08117807
   81  0.5519077  0.08464785
   83  0.5533645  0.08756121
   85  0.5538934  0.08898860
   87  0.5488626  0.07845139
   89  0.5487295  0.07810098
   91  0.5458159  0.07186524
   93  0.5462122  0.07243151
   95  0.5464776  0.07284853
   97  0.5454198  0.06989701
   99  0.5466122  0.07230858
  101  0.5454212  0.06998179
  103  0.5463469  0.07248738
  105  0.5462140  0.07251677
  107  0.5438302  0.06706219
  109  0.5443607  0.06814876
  111  0.5452877  0.07021270
  113  0.5434334  0.06640047
  115  0.5455515  0.07034902
  117  0.5459487  0.07163401
  119  0.5425064  0.06419609
  121  0.5423745  0.06395652
  123  0.5439616  0.06720128
  125  0.5448894  0.06904817
  127  0.5421083  0.06338557
  129  0.5391955  0.05738871
  131  0.5398576  0.05925560
  133  0.5410489  0.06200578
  135  0.5417101  0.06322969
  137  0.5391943  0.05807684
  139  0.5394593  0.05887287
  141  0.5419771  0.06405225
  143  0.5411828  0.06223105
  145  0.5430360  0.06649670
  147  0.5397251  0.06009844
  149  0.5415785  0.06433986
  151  0.5415782  0.06462499
  153  0.5402553  0.06144123
  155  0.5395916  0.06051122
  157  0.5417108  0.06505985
  159  0.5426378  0.06715642
  161  0.5423736  0.06662903
  163  0.5407845  0.06378495
  165  0.5405202  0.06324976
  167  0.5390629  0.06016396
  169  0.5402540  0.06224725
  171  0.5422410  0.06654565
  173  0.5409172  0.06375869
  175  0.5393278  0.06059963
  177  0.5394614  0.06052570
  179  0.5395941  0.06062395
  181  0.5406537  0.06273066
  183  0.5411828  0.06377653
  185  0.5409184  0.06329913
  187  0.5411836  0.06367008
  189  0.5415806  0.06457023
  191  0.5419789  0.06554428
  193  0.5399921  0.06140757
  195  0.5418459  0.06528990
  197  0.5419790  0.06567422
  199  0.5417148  0.06514568
  201  0.5422446  0.06620716
  203  0.5423757  0.06659260
  205  0.5433025  0.06824934
  207  0.5456861  0.07326068
  209  0.5434349  0.06869514
  211  0.5452882  0.07243942
  213  0.5447586  0.07117226
  215  0.5452894  0.07211289
  217  0.5454201  0.07247220
  219  0.5458192  0.07335716
  221  0.5466138  0.07462179
  223  0.5458192  0.07304321
  225  0.5450247  0.07128626
  227  0.5443619  0.06987013
  229  0.5430378  0.06693090
  231  0.5425088  0.06615986
  233  0.5427727  0.06634126
  235  0.5419778  0.06455116
  237  0.5427722  0.06618802
  239  0.5439646  0.06830882
  241  0.5451568  0.07069582
  243  0.5446270  0.06949047
  245  0.5439647  0.06800874
  247  0.5429050  0.06563233
  249  0.5439647  0.06789085
  251  0.5427725  0.06510575
  253  0.5430372  0.06572485
  255  0.5429050  0.06539702
  257  0.5423755  0.06456536
  259  0.5431692  0.06601757
  261  0.5426397  0.06490699
  263  0.5430374  0.06580801
  265  0.5425078  0.06465285
  267  0.5444946  0.06910511
  269  0.5446261  0.06892552
  271  0.5433027  0.06624009
  273  0.5433028  0.06620264
  275  0.5438319  0.06736269
  277  0.5430374  0.06572868
  279  0.5438314  0.06710273
  281  0.5459506  0.07136964
  283  0.5454208  0.06996090
  285  0.5451561  0.06944060
  287  0.5451556  0.06930528
  289  0.5467457  0.07244675
  291  0.5444928  0.06769721
  293  0.5443600  0.06736018
  295  0.5467445  0.07237761
  297  0.5460824  0.07094184
  299  0.5454205  0.06913663
  301  0.5450231  0.06859816
  303  0.5447584  0.06776909
  305  0.5448907  0.06797254
  307  0.5462147  0.07042927
  309  0.5463462  0.07066321
  311  0.5440958  0.06593183
  313  0.5448893  0.06756476
  315  0.5452873  0.06818585
  317  0.5447579  0.06661679
  319  0.5446254  0.06643758
  321  0.5462148  0.06941502
  323  0.5468762  0.07066565
  325  0.5472734  0.07145757
  327  0.5484653  0.07381988
  329  0.5458175  0.06837298
  331  0.5460817  0.06884944
  333  0.5492603  0.07537725
  335  0.5492614  0.07512100
  337  0.5499229  0.07604355
  339  0.5505852  0.07744616
  341  0.5512471  0.07886523
  343  0.5497905  0.07567363
  345  0.5495271  0.07481507
  347  0.5488640  0.07360002
  349  0.5475404  0.07046655
  351  0.5488647  0.07315674
  353  0.5472758  0.06954218
  355  0.5483351  0.07171814
  357  0.5471427  0.06929090
  359  0.5476720  0.07060608
  361  0.5495263  0.07413861
  363  0.5492621  0.07337704
  365  0.5476737  0.07004451
  367  0.5480704  0.07097931
  369  0.5483349  0.07148310
  371  0.5495270  0.07416853
  373  0.5496587  0.07449895
  375  0.5511153  0.07732634
  377  0.5492619  0.07352968
  379  0.5497912  0.07471577
  381  0.5493938  0.07382775
  383  0.5486002  0.07211366
  385  0.5500568  0.07527778
  387  0.5497924  0.07462380
  389  0.5507183  0.07651225
  391  0.5497931  0.07448763
  393  0.5488649  0.07246260
  395  0.5485998  0.07213152
  397  0.5499238  0.07463695
  399  0.5482021  0.07126727
  401  0.5470099  0.06850632
  403  0.5480676  0.07085109
  405  0.5492608  0.07310952
  407  0.5499227  0.07434925
  409  0.5480690  0.07067485
  411  0.5482021  0.07091421
  413  0.5482023  0.07077743
  415  0.5479377  0.07003590
  417  0.5476735  0.06955659
  419  0.5497910  0.07394244
  421  0.5492612  0.07288651
  423  0.5487314  0.07165768
  425  0.5509827  0.07616841
  427  0.5492619  0.07232308
  429  0.5496587  0.07307788
  431  0.5492619  0.07218257
  433  0.5497920  0.07308999
  435  0.5504541  0.07425895
  437  0.5503218  0.07389110
  439  0.5505864  0.07437147
  441  0.5497915  0.07284910
  443  0.5489977  0.07112913
  445  0.5496599  0.07248283
  447  0.5491301  0.07144892
  449  0.5499243  0.07301898
  451  0.5495263  0.07225451
  453  0.5504538  0.07422352
  455  0.5489970  0.07113269
  457  0.5488644  0.07084409
  459  0.5492622  0.07160460
  461  0.5493942  0.07182989
  463  0.5485991  0.07027014
  465  0.5503201  0.07358529
  467  0.5505855  0.07409577
  469  0.5491286  0.07096909
  471  0.5500555  0.07283180
  473  0.5508499  0.07446954
  475  0.5503197  0.07325502
  477  0.5513795  0.07534247
  479  0.5517769  0.07589577
  481  0.5515118  0.07527772
  483  0.5520421  0.07618347
  485  0.5520418  0.07615598
  487  0.5513806  0.07480617
  489  0.5515121  0.07487014
  491  0.5507176  0.07325720
  493  0.5507174  0.07315880
  495  0.5485991  0.06865642
  497  0.5496580  0.07076446
  499  0.5501887  0.07182373

Accuracy was used to select the optimal model using the largest value.
The final value used for the model was k = 61.

4.1.2 Grafica de precisión del modelo

# Extraer resultados del modelo
resultados <- modelo_knn$results

# Encontrar el mejor valor de k
mejor_k <- resultados$k[which.max(resultados$Accuracy)]
mejor_precision <- max(resultados$Accuracy)

# Crear gráfico con ggplot
g_modelo <- ggplot(resultados, aes(x = k, y = Accuracy)) +
  geom_line(color = "#4682B4", size = 1.2) +
  geom_point(color = "#FF69B4", size = 2, alpha = 0.7) +
  geom_vline(xintercept = mejor_k, linetype = "dashed", color = "red", size = 1) +
  annotate("text", x = mejor_k, y = mejor_precision + 0.005,
           label = paste("Mejor k =", mejor_k),
           color = "red", size = 4, hjust = -0.1) +
  labs(
    title = "Precisión del modelo KNN según el número de vecinos (k)",
    subtitle = "Validación cruzada con 10 pliegues",
    x = "Número de vecinos (k)",
    y = "Precisión (Accuracy)",
    caption = "Fuente: caret::train con método KNN"
  ) +
  theme_minimal(base_family = "Palatino") +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    plot.subtitle = element_text(size = 14, hjust = 0.5, margin = margin(b = 10)),
    axis.title = element_text(size = 13),
    axis.text = element_text(size = 11),
    plot.caption = element_text(size = 10, hjust = 1, face = "italic"),
    panel.grid.major = element_line(color = "gray85"),
    panel.grid.minor = element_blank()
  )

# Convertir a gráfico interactivo
ggplotly(g_modelo)

Mediante un proceso de validación cruzada, se evaluaron distintos valores k y se encontró que el error de clasificación promedio se minimizó en k = 61. Este valor refleja un equilibrio entre precisión y estabilidad, reduciendo el sobreajuste que suele presentarse con valores bajos de k.

4.1.3 Matriz de confusion

# Predicciones sobre test
pred_knn_caret <- predict(modelo_knn, newdata = datos_test)

# Matriz de confusión y métricas
confusionMatrix(pred_knn_caret, datos_test$ProgramasAlcaldia, positive = "Si")
Confusion Matrix and Statistics

          Reference
Prediction  No  Si
        No 889 695
        Si 458 474
                                         
               Accuracy : 0.5417         
                 95% CI : (0.522, 0.5613)
    No Information Rate : 0.5354         
    P-Value [Acc > NIR] : 0.2679         
                                         
                  Kappa : 0.0663         
                                         
 Mcnemar's Test P-Value : 3.648e-12      
                                         
            Sensitivity : 0.4055         
            Specificity : 0.6600         
         Pos Pred Value : 0.5086         
         Neg Pred Value : 0.5612         
             Prevalence : 0.4646         
         Detection Rate : 0.1884         
   Detection Prevalence : 0.3704         
      Balanced Accuracy : 0.5327         
                                         
       'Positive' Class : Si             
                                         

1. El modelo tiene accuracy moderada-baja (≈ 54%).

2. Sensibilidad muy baja (40.6%) vs especificidad razonable (66.0%).

  • El modelo falla en identificar la mayoría de los positivos reales (695 FN frente a 474 TP).

  • Detecta bastante mejor a los negativos. Eso significa que, con este umbral, el modelo subestima la clase “Sí”: hay más casos reales positivos que el modelo no detecta.

3. Predicción de positivos por debajo de la prevalencia real.

  • Prevalencia real = 46.5% de la muestra son “Sí”, pero el modelo predice “Sí” solo el 37.0% (detection prevalence).

  • El modelo predice menos positivos de los que existen.

4. Precisión (PPV) ≈ 0.51: de los casos marcados como “Sí”, ~51% son verdaderos. No es terrible, pero combinado con baja sensibilidad, indica que para encontrar muchos positivos hay que aceptar más falsos positivos.

5. Kappa muy bajo (0.066) y Balanced Accuracy ≈ 0.533: el desempeño es solo un poco mejor que el azar y hay poca mejora práctica respecto a un clasificador trivial.

6. Test de McNemar p << 0.001: la asimetría de errores es significativa, lo que confirma que el patrón de errores no es aleatorio.

4.1.4 Grafica roc

# Calcular curva ROC y AUC
prob_knn <- predict(modelo_knn, newdata = datos_test, type = "prob")
pred_obj <- prediction(prob_knn[, 2], datos_test$ProgramasAlcaldia)
perf <- performance(pred_obj, "tpr", "fpr")
auc <- performance(pred_obj, "auc")@y.values[[1]]

# Extraer datos para ggplot
roc_data <- data.frame(
  fpr = perf@x.values[[1]],
  tpr = perf@y.values[[1]]
)

# Graficar con 

ggplot(roc_data, aes(x = fpr, y = tpr)) +
  geom_line(color = "#4682B4", size = 1.2) +
  geom_abline(slope = 1, intercept = 0, linetype = "dashed", color = "gray60") +
  annotate("text", x = 0.6, y = 0.1, label = paste("AUC =", round(auc, 3)),
           size = 5, color = "red", fontface = "bold") +
  labs(
    title = "Curva ROC - Modelo KNN",
    subtitle = "Evaluación binaria sobre conjunto de prueba",
    x = "Tasa de falsos positivos (FPR)",
    y = "Tasa de verdaderos positivos (TPR)",
    caption = "Fuente: ROCR + caret"
  ) +
  theme_minimal(base_family = "Palatino") +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    plot.subtitle = element_text(size = 14, hjust = 0.5),
    axis.title = element_text(size = 13),
    axis.text = element_text(size = 11),
    plot.caption = element_text(size = 10, hjust = 1, face = "italic")
  )

La curva ROC presentada permite evaluar el rendimiento del modelo KNN sobre el conjunto de prueba, mostrando la relación entre la tasa de falsos positivos y la tasa de verdaderos positivos. Se observa que la curva se encuentra ligeramente por encima de la diagonal, lo que indica que el modelo tiene una capacidad de predicción baja y se comporta de manera casi aleatoria. El valor del AUC = 0.57 confirma este resultado, evidenciando que el modelo logra predecir correctamente solo alrededor del 57% de los casos positivos.

4.2 MODELO 2: LOGIT DE CLASIFICACIÓN

Nuestro modelo: ProgramasAlcaldia∼Sexo + LeeEscribe + NivelEducacion + Edad + TiempoCalle

Busca estimar la probabilidad de que una persona conozca o no los programas de la alcaldía, a partir de características sociodemográficas y educativas.

# Nos aseguramos de que la variable objetivo sea factor con niveles "No" y "Sí"
HabitantesCalle2$ProgramasAlcaldia <- factor(HabitantesCalle2$ProgramasAlcaldia, levels = c("No", "Si"))

# Partición (train / test)

set.seed(28)
idx <- createDataPartition(y = HabitantesCalle2$ProgramasAlcaldia, p = 0.75, list = FALSE)
train <- HabitantesCalle2[idx, ]
test  <- HabitantesCalle2[-idx, ]


#  Entrenamiento del modelo logit 
# Aquí escogemos las variables predictoras más lógicas

fit_logit <- glm(ProgramasAlcaldia ~ Sexo + LeeEscribe + NivelEducacion + Edad + TiempoCalle,
                 data = train, family = binomial())

summary(fit_logit)

Call:
glm(formula = ProgramasAlcaldia ~ Sexo + LeeEscribe + NivelEducacion + 
    Edad + TiempoCalle, family = binomial(), data = train)

Coefficients:
                                                           Estimate Std. Error
(Intercept)                                               -0.804147   0.130632
SexoMujer                                                  0.142768   0.070215
LeeEscribeSi                                               0.238165   0.112190
NivelEducacionBásica secundaria                            0.151509   0.059311
NivelEducacionMedia académica, media técnica o normalista  0.216801   0.069374
NivelEducacionNinguno                                     -0.084792   0.125930
NivelEducacionPreescolar                                  -0.213975   0.215039
NivelEducacionTécnica profesional o tegnológica            0.858198   0.172865
NivelEducacionUniversitario o Posgrado                     0.366928   0.149952
Edad                                                       0.002780   0.001881
TiempoCalle                                                0.016880   0.002281
                                                          z value Pr(>|z|)    
(Intercept)                                                -6.156 7.47e-10 ***
SexoMujer                                                   2.033  0.04202 *  
LeeEscribeSi                                                2.123  0.03376 *  
NivelEducacionBásica secundaria                             2.554  0.01064 *  
NivelEducacionMedia académica, media técnica o normalista   3.125  0.00178 ** 
NivelEducacionNinguno                                      -0.673  0.50074    
NivelEducacionPreescolar                                   -0.995  0.31971    
NivelEducacionTécnica profesional o tegnológica             4.965 6.89e-07 ***
NivelEducacionUniversitario o Posgrado                      2.447  0.01441 *  
Edad                                                        1.478  0.13939    
TiempoCalle                                                 7.399 1.37e-13 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 10432  on 7551  degrees of freedom
Residual deviance: 10301  on 7541  degrees of freedom
AIC: 10323

Number of Fisher Scoring iterations: 4
# TABLA DE RESULTADOS
variables_modelo <- data.frame(
  Variable = c("Intercept","SexoMujer","LeeEscribeSi","NivelEducación – Básica Secundaria","NivelEducación – Media o Técnica","NivelEducación – Técnica profesional o tecnológica", "NivelEducación – Universitario o Posgrado", "Edad", "TiempoCalle"),
  Estimado = c(
    "-0.804",
    "0.143",
    "0.238",
    "0.152",
    "0.217",
    "0.858",
    "0.367",
    "0.0028",
    "0.0169"
  ),
  p_valor = c(
    "<0.001",
    "0.042",
    "0.034",
    "0.011",
    "0.002",
    "<0.001",
    "0.014",
    "0.139",
    "<0.001"
  ),
  Interpretacion = c(
    "Punto de partida, indica baja probabilidad de conocimiento sin otras variables.",
    "Ser mujer aumenta significativamente la probabilidad de conocer los programas.",
    "Saber leer y escribir incrementa la probabilidad de conocerlos.",
    "Mayor educación básica aumenta la probabilidad." ,
    "Efecto positivo importante: quienes alcanzaron educación media o técnica tienen más conocimiento.",
    "Gran incremento: este grupo tiene una probabilidad mucho mayor de conocer los programas.",
    "También positivo y significativo.",
    "No significativo; la edad no influye estadísticamente.",
    "Cada año adicional en la calle aumenta ligeramente la probabilidad de conocer los programas."
  )
)


tabla <- kable(variables_modelo, 
               format = "html",
               col.names = c("Variable", "Estimado", "p-valor", "Interpretación"),
               align = c('l', 'l', 'l', 'l'),
               caption = "Tabla de resultados del Modelo Logit") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 14,
    position = "center"
  ) %>%
  row_spec(0, background = "#2b6cb0", color = "white", bold = TRUE) %>%
  column_spec(1, bold = TRUE, width = "3cm") %>%
  column_spec(2, width = "4cm") %>%  # Cambiado de 2:8 a columnas específicas
  column_spec(3, width = "3cm") %>%
  column_spec(4, width = "3.5cm") %>%
  footnote(
    general = "",
    general_title = "",
    footnote_as_chunk = TRUE
  )

tabla
Tabla de resultados del Modelo Logit
Variable Estimado p-valor Interpretación
Intercept -0.804 <0.001 Punto de partida, indica baja probabilidad de conocimiento sin otras variables.
SexoMujer 0.143 0.042 Ser mujer aumenta significativamente la probabilidad de conocer los programas.
LeeEscribeSi 0.238 0.034 Saber leer y escribir incrementa la probabilidad de conocerlos.
NivelEducación – Básica Secundaria 0.152 0.011 Mayor educación básica aumenta la probabilidad.
NivelEducación – Media o Técnica 0.217 0.002 Efecto positivo importante: quienes alcanzaron educación media o técnica tienen más conocimiento.
NivelEducación – Técnica profesional o tecnológica 0.858 <0.001 Gran incremento: este grupo tiene una probabilidad mucho mayor de conocer los programas.
NivelEducación – Universitario o Posgrado 0.367 0.014 También positivo y significativo.
Edad 0.0028 0.139 No significativo; la edad no influye estadísticamente.
TiempoCalle 0.0169 <0.001 Cada año adicional en la calle aumenta ligeramente la probabilidad de conocer los programas.

Las variables más influyentes son nivel educativo, lectoescritura, sexo y tiempo en la calle. Esto sugiere que la educación y la experiencia de vida en la calle fortalecen el conocimiento sobre los programas de la alcaldía.

4.2.1 Primera Matriz de confusión

#  Predicciones con umbral 0.5 
p_hat <- predict(fit_logit, newdata = test, type = "response")  # probabilidad de "Sí"

pred_clase <- factor(ifelse(p_hat >= 0.5, "Si", "No"), levels = c("Si", "No"))

# Matriz de confusión
confusionMatrix(pred_clase, test$ProgramasAlcaldia, positive = "Si")
Confusion Matrix and Statistics

          Reference
Prediction   No   Si
        No 1060  818
        Si  287  351
                                          
               Accuracy : 0.5608          
                 95% CI : (0.5412, 0.5803)
    No Information Rate : 0.5354          
    P-Value [Acc > NIR] : 0.005522        
                                          
                  Kappa : 0.0899          
                                          
 Mcnemar's Test P-Value : < 2.2e-16       
                                          
            Sensitivity : 0.3003          
            Specificity : 0.7869          
         Pos Pred Value : 0.5502          
         Neg Pred Value : 0.5644          
             Prevalence : 0.4646          
         Detection Rate : 0.1395          
   Detection Prevalence : 0.2536          
      Balanced Accuracy : 0.5436          
                                          
       'Positive' Class : Si              
                                          

- Exactitud (56.1%): El modelo acierta poco más de la mitad de las veces, apenas mejor que el azar.

- Kappa (0.0899): Muy baja concordancia respecto al azar, indica que el modelo no discrimina bien entre clases.

- Sensibilidad (0.30): Solo detecta correctamente el 30% de los casos “Sí” (falsos negativos altos).

- Especificidad (0.79): Distingue mejor los “No”.

- Balanced Accuracy (0.54): Rendimiento general bajo y desbalanceado.

Con el punto de corte por defecto (0.5), el modelo tiende a predecir “No” en exceso, fallando muchos verdaderos “Sí”.

4.2.2 Punto de corte optimo

# Umbral óptimo con curva ROC 
roc_o <- roc(response = test$ProgramasAlcaldia, predictor = p_hat, levels = c("No", "Si"))
thr   <- coords(roc_o, x = "best", best.method = "youden", ret = "threshold")

umbral <- as.numeric(thr)
umbral  # muestra el nuevo punto de corte óptimo
[1] 0.4413992

Significa que bajar el umbral de decisión (de 0.5 → 0.44) permite clasificar más casos como positivos (“Sí”) para aumentar la sensibilidad.

4.2.3 Segunda Matriz de confusion

# Nueva clasificación con el umbral óptimo
pred_clase_opt <- factor(ifelse(p_hat >= umbral, "Si", "No"), levels = c("Si", "No"))

# Nueva matriz de confusión
confusionMatrix(pred_clase_opt, test$ProgramasAlcaldia, positive = "Si")
Confusion Matrix and Statistics

          Reference
Prediction  No  Si
        No 565 339
        Si 782 830
                                         
               Accuracy : 0.5545         
                 95% CI : (0.5348, 0.574)
    No Information Rate : 0.5354         
    P-Value [Acc > NIR] : 0.02871        
                                         
                  Kappa : 0.1263         
                                         
 Mcnemar's Test P-Value : < 2e-16        
                                         
            Sensitivity : 0.7100         
            Specificity : 0.4195         
         Pos Pred Value : 0.5149         
         Neg Pred Value : 0.6250         
             Prevalence : 0.4646         
         Detection Rate : 0.3299         
   Detection Prevalence : 0.6407         
      Balanced Accuracy : 0.5647         
                                         
       'Positive' Class : Si             
                                         

- Sensibilidad sube mucho (de 0.30 → 0.71): ahora el modelo detecta la mayoría de los “Sí”.

- Especificidad baja (de 0.79 → 0.42): comete más falsos positivos, confunde más “No” como “Sí”.

- Kappa (0.1263): mejora ligeramente; hay un poco más de concordancia que antes.

- Balanced Accuracy (0.5647): también mejora, aunque el rendimiento sigue modesto.

Ajustar el punto de corte mejoró la detección de casos positivos (mayor sensibilidad), lo cual es útil si los “Sí” son los casos más importantes Sin embargo, el costo son más falsos positivos.

4.2.4 Curva ROC

# Crear objeto ROC
roc_o <- roc(response = test$ProgramasAlcaldia, predictor = p_hat, levels = c("No", "Si"))

# Extraer datos para ggplot
roc_df <- data.frame(
  tpr = roc_o$sensitivities,
  fpr = 1 - roc_o$specificities
)

# Calcular AUC
auc_val <- auc(roc_o)

# Crear gráfico con estilo similar al del KNN
g_roc_logit <- ggplot(roc_df, aes(x = fpr, y = tpr)) +
  geom_line(color = "#4682B4", size = 1.2) +  # Azul acero
  geom_abline(slope = 1, intercept = 0, linetype = "dashed", color = "gray60") +
  annotate("text", x = 0.6, y = 0.1, label = paste("AUC =", round(auc_val, 3)),
           size = 5, color = "red", fontface = "bold") +
  labs(
    title = "Curva ROC - Modelo Logístico",
    subtitle = "Evaluación binaria sobre conjunto de prueba",
    x = "Tasa de falsos positivos (FPR)",
    y = "Tasa de verdaderos positivos (TPR)",
    caption = "Fuente: pROC + glm"
  ) +
  theme_minimal(base_family = "Palatino") +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    plot.subtitle = element_text(size = 14, hjust = 0.5),
    axis.title = element_text(size = 13),
    axis.text = element_text(size = 11),
    plot.caption = element_text(size = 10, hjust = 1, face = "italic"),
    panel.grid.major = element_line(color = "gray85"),
    panel.grid.minor = element_blank()
  )

# Convertir a gráfico interactivo
ggplotly(g_roc_logit)

El modelo logra un poder de discriminación moderado-bajo, apenas mejor que el azar (0.5). Esto sugiere que, aunque algunas variables explican el conocimiento de los programas, la relación es débil o hay otros factores no considerados que influyen. Estos resultados sugieren que las personas con mayor educación formal y alfabetización tienen más probabilidades de conocer los programas de apoyo.

5 RESULTADOS DE LOS MODELOS

# Tabla comparativa KNN vs Logit
tabla_comparacion <- data.frame(
  Metrica = c("Accuracy","Sensibilidad","Especificidad","AUC","Precisión","Balanced Accuracy"),
  KNN_k_61 = c(0.5894, 0.5630, 0.6157, 0.5894, 0.5864, 0.5893),
  Logit_umbral_0_441 = c(0.5545, 0.7100, 0.4195, 0.5810, 0.5149, 0.5647)
)

library(kableExtra)

kable(tabla_comparacion, 
      format = "html",
      col.names = c("Métrica", "KNN (k = 67)", "Logit (umbral 0.441)"),
      align = c('l', 'c', 'c'),
      caption = "Comparación de desempeño entre modelos KNN y Logit") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE,
                position = "center") %>%
  row_spec(0, background = "#2b6cb0", color = "white", bold = TRUE)
Comparación de desempeño entre modelos KNN y Logit
Métrica KNN (k = 67) Logit (umbral 0.441)
Accuracy 0.5894 0.5545
Sensibilidad 0.5630 0.7100
Especificidad 0.6157 0.4195
AUC 0.5894 0.5810
Precisión 0.5864 0.5149
Balanced Accuracy 0.5893 0.5647

KNN

  • Su precisión y especificidad son ligeramente mejores que las del modelo Logit.

  • Detecta correctamente tanto casos positivos como negativos en proporción moderada, con un equilibrio razonable entre ambas métricas.

  • Su sensibilidad (0.56) es inferior a la del Logit, por lo que deja pasar más casos positivos sin detectar.

  • Es un modelo más descriptivo que explicativo, ya que no permite identificar qué variables influyen en la predicción.

Logit

  • Al ajustar el umbral a 0.441, el Logit logra una mayor sensibilidad (0.71), lo que significa que detecta mejor a las personas que sí conocen los programas.

  • Su especificidad y precisión disminuyen, es decir, clasifica erróneamente más casos negativos como positivos.

  • Su AUC = 0.58 indica una discriminación moderada, comparable al KNN, pero con la ventaja de que el Logit permite interpretar los efectos de las variables (educación, tiempo en la calle, etc.).

  • El modelo es más explicativo, ideal para proyectos con enfoque social o de política pública.

Tras comparar ambos modelos, se observa que el KNN obtiene una ligera ventaja en términos de exactitud global (0.59), mientras que el modelo Logit presenta un mejor desempeño en sensibilidad (0.71), lo que le permite identificar más casos positivos de conocimiento de los programas de la Alcaldía.

Aunque ambos modelos muestran un poder de discriminación moderado (AUC ≈ 0.58–0.59), el modelo Logit destaca por su capacidad interpretativa, ya que permite identificar las variables más influyentes en el conocimiento de los programas. En este caso, el nivel educativo, la lectoescritura y el tiempo viviendo en la calle incrementan significativamente la probabilidad de conocer los programas institucionales, lo que refleja la importancia de las condiciones educativas y sociales en los procesos de inclusión.

Por tanto, se recomienda utilizar el modelo Logit como herramienta principal de análisis, dado que, además de un rendimiento comparable al KNN, ofrece información valiosa para la comprensión del fenómeno y la formulación de estrategias de política pública.

6 CONCLUSIONES

El ejercicio permitió aplicar y comparar dos métodos de clasificación supervisada —KNN y Regresión Logística (Logit)— para predecir la probabilidad de que una persona conozca los programas de la Alcaldía a partir de características sociodemográficas y educativas de la población habitante de calle.

Ambos modelos presentaron un desempeño moderado, con valores de AUC cercanos a 0.58–0.59, lo cual indica una capacidad de predicción ligeramente superior al azar. Cada modelo mostro caracteristicas distintas:

  • El modelo KNN (k = 61) alcanzó una exactitud del 58.9%, con una sensibilidad del 56% y una especificidad del 61%, logrando un balance adecuado entre la detección de casos positivos y negativos.

  • El modelo Logit, con un umbral ajustado a 0.441, obtuvo una sensibilidad del 71%, mejorando notablemente la detección de personas que sí conocen los programas, aunque con menor especificidad (42%) y exactitud global (55%). Su AUC de 0.581 refleja un poder predictivo moderado, pero su principal ventaja radica en la interpretabilidad de los coeficientes y la identificación de variables influyentes.

En el modelo Logit se encontró que el nivel educativo, la capacidad de lectura y escritura, el sexo y el tiempo viviendo en la calle tienen un efecto positivo y estadísticamente significativo sobre la probabilidad de conocer los programas institucionales. Esto evidencia que las condiciones educativas y la experiencia de vida son factores determinantes en el acceso a la información institucional.

Por tanto, se concluye que, aunque el modelo KNN mostró una ligera ventaja en términos de exactitud, el modelo Logit resulta más apropiado para el análisis del fenómeno, ya que permite comprender las relaciones entre las variables y ofrece información relevante para la toma de decisiones.

6.1 RECOMENDACIONES

1. Modelo recomendado:

Se recomienda utilizar el modelo Logit como herramienta principal, dado que además de tener un desempeño comparable al KNN, permite interpretar el efecto de las variables y orientar estrategias de intervención basadas en evidencia.

2. Ajuste y mejora del modelo:

Se podrían incluir nuevas variables relacionadas con acceso a información, contacto con instituciones, o participación en programas sociales, para aumentar el poder explicativo del modelo.

6.2 ¿El modelo ajustado logro responder al objetivo de la investigacion?

A la luz de los resultados obtenidos, se considera que el modelo ajustado sí logró responder parcialmente al objetivo de la investigación. Los modelos KNN y Logit permitieron clasificar a la población según su conocimiento de los programas de la Alcaldía y evidenciaron qué variables influyen en dicha probabilidad.

Aunque el poder predictivo fue moderado (AUC ≈ 0.58–0.59), los resultados son coherentes con el contexto social del fenómeno, donde las decisiones de participación o conocimiento institucional no dependen únicamente de variables individuales, sino también de factores externos difíciles de capturar en el modelo.

El modelo Logit, en particular, permitió identificar relaciones significativas entre el nivel educativo, la capacidad de lectura y escritura, el tiempo en la calle y el conocimiento de los programas, cumpliendo el propósito de comprender los determinantes del fenómeno. Sin embargo, su capacidad de predicción fue limitada, por lo que no puede considerarse un modelo altamente preciso, sino más bien una herramienta exploratoria y explicativa.

En conclusión, los modelos ajustados sí respondieron al objetivo general del taller, ya que permitieron construir, comparar e interpretar dos enfoques de clasificación supervisada aplicados a un problema real, demostrando la utilidad del aprendizaje supervisado en contextos sociales.

7 BIBLIOGRAFIA