Análisis de la encuesta Así Vamos 2024

Problemática

En Nuevo León persisten importantes desigualdades en las condiciones de movilidad urbana, las cuales se manifiestan de manera diferenciada según el género, la edad y la zona de residencia de las personas. Estas disparidades se reflejan en aspectos como el medio de transporte utilizado, la duración de los trayectos y la frecuencia con la que las personas deben desplazarse. Los grupos en situación de mayor vulnerabilidad; particularmente mujeres, personas jóvenes o adultas mayores, así como habitantes de zonas periféricas, enfrentan mayores obstáculos para acceder a una movilidad eficiente, segura y asequible. Esta situación limita significativamente su acceso equitativo a oportunidades laborales y educativas, lo que contribuye a la reproducción de las desigualdades sociales y económicas en la entidad.

La elección de esta problemática responde a la necesidad de visibilizar cómo las condiciones de movilidad en Nuevo León no son neutrales, sino que están profundamente marcadas por factores sociodemográficos. En un contexto urbano donde el acceso a servicios, empleo y educación depende en gran medida de la capacidad de desplazamiento, las brechas en movilidad representan una barrera estructural para el desarrollo equitativo de la población.

Preguntas de investigación tentativas

1.- ¿Qué diferencias existen en los medios de transporte y tiempos de traslado entre grupos de edad, género y localidades en Nuevo León?

2.-¿Cómo afectan las condiciones de movilidad al acceso a oportunidades laborales y educativas de las personas en distintos contextos sociodemográficos?

Variables a utilizar y justificación

  1. sexo_num: Permite analizar las diferencias de movilidad según el sexo biológico.

  2. genero_num: Aporta una perspectiva más inclusiva y actualizada del género.

  3. nom_mun_mv: Localiza espacialmente a las personas encuestadas para comparar desigualdades entre municipios.

  4. nom_loc_mv: Permite análisis más precisos dentro de cada municipio, detectando diferencias urbanas vs. rurales o centrales vs. periféricas.

  5. colonia: Aporta microdatos territoriales útiles para análisis georreferenciados.

  6. mun_amm_y_periferia: Clasifica el lugar de residencia en zonas metropolitanas, periféricas o resto del estado.

  7. cp4_1: Registra la edad exacta.

  8. rangos_edad: Facilita el análisis por grupos etarios, identificando necesidades diferenciadas de movilidad entre jóvenes, adultos y mayores.

  9. p7_8: Indica si el empleo ofrece transporte privado, revelando posibles diferencias según sector laboral o nivel socioeconómico.

  10. p13: Muestra el motivo del traslado (trabajo, estudio, salud, etc.), necesario para vincular movilidad con acceso a oportunidades.

  11. p15: Permite medir la frecuencia semanal de traslados para evaluar esfuerzo de movilidad.

  12. p16: Identifica el municipio de destino de los viajes, lo que permite analizar patrones de desplazamiento intermunicipal.

  13. p17: Complementa la información del destino principal.

  14. p18: Revela el tipo de transporte utilizado.

  15. tiempo_espera: Mide cuánto tiempo se espera el transporte.

  16. p21: Informa si hubo transbordo.

  17. p22: Cuantifica los transbordos.

  18. tiempo_total_traslado: Mide la duración total del viaje redondo.

  19. costo_total_viaje_redondo: Mide el gasto monetario en movilidad.

  20. usa_transporte_publico: Variable dicotómica que permite identificar usuarios frecuentes de transporte público y asociarlos con condiciones de vulnerabilidad.

  21. p31_3: Evalúa la percepción de seguridad en el transporte público, relevante para analizar desigualdades de género.

  22. p31_6: Indica si el transporte está climatizado, lo cual impacta en la calidad y dignidad del servicio, especialmente en zonas de calor extremo.

  23. p32: Mide la percepción sobre la tarifa, indicador subjetivo que puede variar según nivel socioeconómico.

  24. p33_9: Señala fallas tecnológicas en las unidades, relacionadas con eficiencia y accesibilidad del sistema de transporte.

  25. victima_tp: Identifica si la persona ha sido víctima de acoso en el transporte público, dato fundamental para el análisis de género y seguridad.

  26. p39: Indica el número de vehículos en el hogar, lo que permite aproximarse al nivel de dependencia del transporte público.

  27. Factor_CVNL: Permite generalizar los resultados de la muestra a la población objetivo. Representa el número de unidades en la población que cada unidad muestral representa.

  28. p164: Permite ver el ingreso total del hogar.

Selección de variables

library(readr)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
eav2024 <- read.csv("eav2024.csv")

eav2024_selected <- eav2024 %>% select ("sexo_num",
                                   "genero_num",
                                   "nom_mun_mv",
                                   "nom_loc_mv",
                                   "colonia",
                                   "mun_amm_y_periferia",
                                   "cp4_1",
                                   "rangos_edad",
                                   "p7_8",
                                   "p13",
                                   "p15",
                                   "p16",
                                   "p17",
                                   "p18",
                                   "usa_transporte_publico",
                                   "tiempo_espera",
                                   "p21",
                                   "p22",
                                   "tiempo_total_traslado",
                                   "costo_total_viaje_redondo",
                                   "p31_3",
                                   "p31_6",
                                   "p32",
                                   "p33_9",
                                   "victima_tp",
                                   "p39", 
                                   "Factor_CVNL",
                                   "p164"
                                         )
head(eav2024_selected)
##   sexo_num genero_num        nom_mun_mv              nom_loc_mv
## 1        1          1 Cadereyta Jiménez       Cadereyta Jiménez
## 2        0          0 Cadereyta Jiménez         Valle del Roble
## 3        1          1 Cadereyta Jiménez       Cadereyta Jiménez
## 4        0          0 Cadereyta Jiménez       Cadereyta Jiménez
## 5        0          0 Cadereyta Jiménez       Cadereyta Jiménez
## 6        1          1  General Escobedo Ciudad General Escobedo
##                       colonia mun_amm_y_periferia cp4_1 rangos_edad p7_8 p13
## 1                    Praderas                   9    50       45-54    0   1
## 2             Valle del Roble                   9    35       35-44    1   1
## 3  Infonavit Jeronimo Treviño                   9    32       25-34   NA   2
## 4            Alfredo V Bonfil                   9    62       55-64    0   8
## 5         Centro De Cadereyta                   9    80    75 o más   NA   8
## 6 Alianza Real Barrio Jalisco                  21    51       45-54   NA   5
##   p15 p16  p17 p18 usa_transporte_publico tiempo_espera p21 p22
## 1   5   9  621   1                      0            NA  NA  NA
## 2   6  31 1048   1                      1            NA  NA  NA
## 3   5   9  621   1                      0            NA  NA  NA
## 4   1   9  392   1                      0            NA  NA  NA
## 5   2   9  439   1                      0            NA  NA  NA
## 6   2  21 1573   1                      1            NA  NA  NA
##   tiempo_total_traslado costo_total_viaje_redondo p31_3 p31_6 p32 p33_9
## 1                    45                        NA    NA    NA  NA    NA
## 2                   100                        NA     1     2   3     1
## 3                    10                        NA    NA    NA  NA    NA
## 4                    10                        NA    NA    NA  NA    NA
## 5                    10                        NA    NA    NA  NA    NA
## 6                    40                        NA  8888     0   3     1
##   victima_tp p39 Factor_CVNL p164
## 1         NA   0    258.2655    2
## 2          0   0    273.0114    3
## 3         NA   1    258.2655    3
## 4         NA   1    273.0114    3
## 5         NA   1    273.0114    3
## 6          1   0   1013.6011    3

##Factor de Expansión

library(survey)
## Cargando paquete requerido: grid
## Cargando paquete requerido: Matrix
## Cargando paquete requerido: survival
## 
## Adjuntando el paquete: 'survey'
## The following object is masked from 'package:graphics':
## 
##     dotchart
diseño_encuesta <- svydesign(ids=~1, 
                             data=eav2024_selected,
                             weights = eav2024_selected$Factor_CVNL) 

svymean(~factor(genero_num), diseño_encuesta) #Factor solo se usa cuando sea variable categórica
##                              mean     SE
## factor(genero_num)0    0.49760513 0.0086
## factor(genero_num)1    0.50106381 0.0086
## factor(genero_num)2    0.00031323 0.0003
## factor(genero_num)9999 0.00101783 0.0007
svymean(~(cp4_1), diseño_encuesta)
##         mean     SE
## cp4_1 47.132 0.2934
mean(eav2024_selected$cp4_1) #Cambia porque aquí no usa los pasos de Factor_CVNL
## [1] 46.83711
svytotal(~p15, diseño_encuesta, na.rm=TRUE) #na.rm es para quitar na. P15- El total de la población se ha movido 87190212 veces en la semana
##        total       SE
## p15 87190212 30156013
sum(eav2024_selected$p15, na.rm=TRUE) #Sin el factor da 81957, por eso hay que poner el factor de expansión con la librería survey y el ~
## [1] 81957

Limpieza de la base de datos

eav2024_clean <- eav2024_selected %>%
  
  mutate(sexo = case_when(sexo_num==0 ~ "Hombre", sexo_num==1 ~ "Mujer"))%>%
  mutate(sexo=as.factor(sexo)) %>% #Agrega columna nueva o la sobreescribe sobre la misma columna
  
  mutate(municipio=as.factor(nom_mun_mv))%>% #No todos los municipios tuvieron participación
  
  mutate(edad=(cp4_1)) %>%
  
  mutate (categoría_edad = case_when(
      edad < 15 ~ "Infancias",
      edad >= 15 & edad < 30 ~ "Juventud",
      edad >= 30 & edad < 65 ~ "Adultos",
      edad >= 65 ~ "Tercera Edad")) %>%
  mutate(categoría_edad=as.factor(categoría_edad)) %>%
  
  
  mutate(prestacion_transportepriv = case_when(p7_8==0 ~ "No", p7_8==1 ~ "Sí", p7_8==8888 ~ "No sabe", p7_8==9999 ~ "No contesta"))%>%
  mutate(prestacion_transportepriv=as.factor(prestacion_transportepriv)) %>%
  
  mutate(motivo_traslado = case_when(p13==1 ~ "Trabajo", p13==2 ~ "Escuela", p13==3 ~ "Compras",p13==4 ~ "Médico u hospital",p13==5 ~ "Diversión", p13==6 ~ "Acompañar o llevar a alguien", p13==7 ~ "Banco o pago de servicios", p13==8 ~ "Visita", p13==9 ~ "Buscar empleo", p13==10 ~ "Trámites", p13==9999 ~ "No contesta"))%>%
  mutate(motivo_traslado=as.factor(motivo_traslado)) %>%
  
  mutate(traslados_semanales_motivo=(p15)) %>%
  
  mutate(municipio_destino_motivo = case_when(p16==39 ~ "Monterrey", p16==26 ~ "Guadalupe", p16==46 ~ "San Nicolás de los Garza",p16==6 ~ "Apodaca",p16==21 ~ "Escobedo", p16==19 ~ "San Pedro Garza García", p16==49 ~ "Santiago", p16==31 ~ "Juárez", p16==18 ~ "García", p16==48 ~ "Santa Catarina",p16==9 ~ "Cadereyta", p16==41 ~ "Pesquería", p16==10 ~ "El Carmen", p16==12 ~ "Ciénega de Flores", p16==25 ~ "Zuazua", p16==45 ~ "Salinas Victoria", p16==1 ~ "Abasolo", p16==2 ~ "Agualeguas",p16==4 ~ "Allende", p16==5 ~ "Anáhuac", p16==7 ~ "Aramberri", p16==8 ~ "Bustamante", p16==11 ~ "Cerralvo", p16==13 ~ "China", p16==14 ~ "Doctor Arroyo", p16==15 ~ "Doctor Coss", p16==16 ~ "Doctor González", p16==17 ~ "Galeana", p16==20 ~ "General Bravo", p16==22 ~ "General Terán", p16==23 ~ "General Treviño", p16==24 ~ "General Zaragoza", p16==47 ~ "Hidalgo", p16==28 ~ "Higueras", p16==29 ~ "Hualahuises", p16==30 ~ "Iturbide", p16==31 ~ "Juárez", p16==32~ "Lampazos de Narango", p16==33 ~ "Linares", p16==3 ~ "Los Aldamas", p16==27 ~ "Los Herreras", p16==42 ~ "Los Ramones", p16==34 ~ "Marín", p16==35 ~ "Melchor Ocampo", p16==36 ~ "Mier y Noriega", p16==37 ~ "Mina", p16==38 ~ "Montemorelos", p16==40 ~ "Parás", p16==43 ~ "Rayones", p16==44 ~ "Sabinas Hidalgo", p16==50 ~ "Vallecillo", p16==51 ~ "Villaldama", p16==100 ~ "Fuera de Nuevo León", p16==111 ~ "Fuera del país", p16==888 ~ "No Sabe", p16==9999 ~ "No contesta"))%>%
  mutate(municipio_destino_motivo=as.factor(municipio_destino_motivo)) %>%
  
  mutate(medio_transporte = case_when(p18==1 ~ "Pie/silla de ruedas", p18==2 ~ "Camión/microbus", p18==3 ~ "Taxi",p18==4 ~ "Uber",p18==5 ~ "Motocicleta", p18==6 ~ "Bicicleta", p18==7 ~ "Metro", p18==8 ~ "Automóvil", p18==9 ~ "Transmetro", p18==10 ~ "Ecovía", p18==11 ~ "Transporte escolar", p18==12 ~ "Transporte de trabajo", p18==13 ~ "Camión privado", p18==14 ~ "Trailer", p18==15 ~ "Cuatrimoto", p18==16 ~ "Tractor", p18==17 ~ "Taxi colectivo", p18==8888 ~ "No sabe", p18==9999 ~ "No contesta"))%>%
  mutate(medio_transporte=as.factor(medio_transporte)) %>%
  
  mutate(usa_transporte_publico = case_when(usa_transporte_publico == 0 ~"no", usa_transporte_publico == 1 ~ "si"  )) %>% 
  mutate(usa_transporte_publico = as.factor(usa_transporte_publico)) %>% 
  
  mutate(transborda = case_when(p21 == 0 ~ "no", p21 == 1 ~ "si")) %>% 
  mutate(transborda = as.factor(transborda)) %>% 
  
  mutate(numero_transbordos = as.numeric(p22)) %>% 
  
  mutate(se_siente_seguro_tp = case_when(p31_3 == 0 ~ "no", p31_3 == 1 ~ "si", p31_3 == 8888 ~ "no sabe", p31_3 == 9999 ~ "no contesta")) %>% 
  mutate(se_siente_seguro_tp = as.factor(se_siente_seguro_tp)) %>% 
  
  mutate(unidades_climatizadas = case_when(p31_6 == 0 ~ "no", p31_6 == 1 ~ "sí, todas", p31_6 == 2 ~ "sí, algunas", p31_6 == 8888 ~ "no sabe", p31_6 == 9999 ~ "no contesta")) %>%
  mutate(unidades_climatizadas = as.factor(unidades_climatizadas)) %>%
  
  mutate(Calificacion_transporte = case_when(p32 == 1 ~ "Muy baja",
    p32 == 2 ~ "Bajo",
    p32 == 3 ~ "Adecuada",
    p32 == 4 ~ "Alta",
    p32 == 5 ~ "Muy alta",
    p32 == 8888 ~ "No sabe",
    p32 == 9999 ~ "No contesta",
    TRUE ~ NA_character_
  )) %>%
  mutate(Calificacion_transporte=as.factor(Calificacion_transporte)) %>%
  
  mutate(Transporte_público_fallas = case_when(
    p33_9 == 0 ~ "No",
    p33_9 == 1 ~ "Si",
    p33_9 == 8888 ~ "No sabe",
    p33_9 == 9999 ~ "No contesta",
    TRUE ~ NA_character_
  )) %>%
  mutate(Transporte_público_fallas=as.factor(Transporte_público_fallas)) %>%
  
  mutate(ingresos_nivel_socioeconomico = case_when(
    p164 == 1 ~ "E",
    p164 == 2 ~ "D" ,
    p164 == 3 ~ "D",
    p164 == 4 ~ "D+",
    p164 == 5 ~ "D+",
    p164 == 6 ~ "C",
    p164 == 7 ~ "C",
    p164 == 8 ~ "C+",
    p164 == 9 ~ "C+",
    p164 == 10 ~ "A/B",
    p164 == 11 ~ "A/B",
    p164 == 12 ~ "A/B",
    p164 == 8888 ~ "No sabe",
    p164 == 9999 ~ "No contesta",
    TRUE ~ NA_character_
  )) %>%
  mutate(ingresos_nivel_socioeconomico=as.factor(ingresos_nivel_socioeconomico)) %>%
  
   mutate(victima_tp = case_when(
    victima_tp == 1 ~ "Si",
    victima_tp == 0 ~"No",
    TRUE ~ NA_character_ 
   ))%>% 
  mutate(victima_tp=as.factor(victima_tp)) %>%
  
   mutate(vehiculos_hogar=(p39)) %>%
  
  select(-colonia, -sexo_num, -genero_num, -nom_loc_mv, -nom_mun_mv, -cp4_1, -mun_amm_y_periferia, -rangos_edad, -p7_8, -p13, -p15, -p16, -p17, -p18, -p32, -p33_9, -p164,-p39, -p21,-p22,-p31_3,-p31_6, -p164, -transborda) #Para deseleccionar o eliminar

Imputación

En la base de datos eav2024_clean, y por la forma en que están diseñadas las preguntas sobre movilidad en la encuesta Así Vamos, no es útil ni recomendable hacer imputaciones para los datos que faltan. Las variables no están relacionadas entre sí de forma que nos permitan predecir los valores ausentes con confianza. Además, varias variables numéricas tienen más del 40 % de datos faltantes, lo cual hace que cualquier intento de rellenarlos artificialmente pueda distorsionar el análisis. Por eso, decidimos trabajar solo con los datos disponibles.

(colSums(is.na(eav2024_clean)) * 100) /4942 # Es un porcentaje
##        usa_transporte_publico                 tiempo_espera 
##                       0.00000                      84.35856 
##         tiempo_total_traslado     costo_total_viaje_redondo 
##                      41.23837                      84.07527 
##                    victima_tp                   Factor_CVNL 
##                      59.57102                       0.00000 
##                          sexo                     municipio 
##                       0.00000                       0.00000 
##                          edad                categoría_edad 
##                       0.00000                       0.00000 
##     prestacion_transportepriv               motivo_traslado 
##                      53.01497                      39.82193 
##    traslados_semanales_motivo      municipio_destino_motivo 
##                      39.82193                      39.88264 
##              medio_transporte            numero_transbordos 
##                      39.82193                      94.67827 
##           se_siente_seguro_tp         unidades_climatizadas 
##                      59.57102                      59.57102 
##       Calificacion_transporte     Transporte_público_fallas 
##                      59.57102                      59.57102 
## ingresos_nivel_socioeconomico               vehiculos_hogar 
##                       0.00000                       0.00000

Preguntas de investigación final

1.- ¿Qué perfiles sociodemográficos presentan mayores desventajas en las condiciones de movilidad urbana en Nuevo León, en términos de acceso, tiempo y costo?

Base final de datos

eav2024_final <- eav2024_clean %>% select(sexo, edad, categoría_edad, municipio, ingresos_nivel_socioeconomico, medio_transporte, prestacion_transportepriv, vehiculos_hogar, usa_transporte_publico, numero_transbordos, tiempo_espera, tiempo_total_traslado, motivo_traslado, traslados_semanales_motivo, municipio_destino_motivo, costo_total_viaje_redondo, unidades_climatizadas, Transporte_público_fallas, se_siente_seguro_tp, victima_tp, Calificacion_transporte, Factor_CVNL)

head(eav2024_final)
##     sexo edad categoría_edad         municipio ingresos_nivel_socioeconomico
## 1  Mujer   50        Adultos Cadereyta Jiménez                             D
## 2 Hombre   35        Adultos Cadereyta Jiménez                             D
## 3  Mujer   32        Adultos Cadereyta Jiménez                             D
## 4 Hombre   62        Adultos Cadereyta Jiménez                             D
## 5 Hombre   80   Tercera Edad Cadereyta Jiménez                             D
## 6  Mujer   51        Adultos  General Escobedo                             D
##      medio_transporte prestacion_transportepriv vehiculos_hogar
## 1 Pie/silla de ruedas                        No               0
## 2 Pie/silla de ruedas                        Sí               0
## 3 Pie/silla de ruedas                      <NA>               1
## 4 Pie/silla de ruedas                        No               1
## 5 Pie/silla de ruedas                      <NA>               1
## 6 Pie/silla de ruedas                      <NA>               0
##   usa_transporte_publico numero_transbordos tiempo_espera tiempo_total_traslado
## 1                     no                 NA            NA                    45
## 2                     si                 NA            NA                   100
## 3                     no                 NA            NA                    10
## 4                     no                 NA            NA                    10
## 5                     no                 NA            NA                    10
## 6                     si                 NA            NA                    40
##   motivo_traslado traslados_semanales_motivo municipio_destino_motivo
## 1         Trabajo                          5                Cadereyta
## 2         Trabajo                          6                   Juárez
## 3         Escuela                          5                Cadereyta
## 4          Visita                          1                Cadereyta
## 5          Visita                          2                Cadereyta
## 6       Diversión                          2                 Escobedo
##   costo_total_viaje_redondo unidades_climatizadas Transporte_público_fallas
## 1                        NA                  <NA>                      <NA>
## 2                        NA           sí, algunas                        Si
## 3                        NA                  <NA>                      <NA>
## 4                        NA                  <NA>                      <NA>
## 5                        NA                  <NA>                      <NA>
## 6                        NA                    no                        Si
##   se_siente_seguro_tp victima_tp Calificacion_transporte Factor_CVNL
## 1                <NA>       <NA>                    <NA>    258.2655
## 2                  si         No                Adecuada    273.0114
## 3                <NA>       <NA>                    <NA>    258.2655
## 4                <NA>       <NA>                    <NA>    273.0114
## 5                <NA>       <NA>                    <NA>    273.0114
## 6             no sabe         Si                Adecuada   1013.6011

Tabla resumen

library(knitr)
library(kableExtra)
## 
## Adjuntando el paquete: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
Elemento <- c(
  "sexo", "edad", "categoría_edad", "municipio", "ingresos_nivel_socioeconomico",
  "medio_transporte", "prestacion_transportepriv", "vehiculos_hogar", "usa_transporte_publico",
  "numero_transbordos", "tiempo_espera", "tiempo_total_traslado", "motivo_traslado",
  "traslados_semanales_motivo", "municipio_destino_motivo", "costo_total_viaje_redondo",
  "unidades_climatizadas", "Transporte_público_fallas", "se_siente_seguro_tp", "victima_tp",
  "Calificacion_transporte", "Factor_CVNL"
)

Hallazgo_Descripción <- c(
  "Era una variable numérica donde el valor 1 representaba a los hombres y el valor 2 a las mujeres.",
  "Es una variable numérica que va del 18 al 95.",
  "La variable estaba escrita como rangos de edad de forma numérica.",
  "El municipio estaba codificado numéricamente, asignándose una clave específica a cada uno.",
  "El nivel socioeconómico estaba representado por el ingreso total reportado por la persona.",
  "La variable hace referencia al medio de transporte que utilizan las personas para trasladarse.",
  "Indicaba si las personas recibían la prestación de transporte por parte de su empleo (0 = no, 1 = sí).",
  "La variable hace referencia a la cantidad de vehículos privados disponibles en cada hogar.",
  "Estaba codificada como numérica: 0 = no usa transporte público, 1 = sí usa.",
  "Indica cuántos transbordos semanales hace la persona usuaria de transporte público.",
  "Variable numérica de 0 a 180 minutos; la mayoría de NAs son personas con automóvil.",
  "Variable numérica que describe el tiempo total de traslado de la persona (ida y vuelta).",
  "Describe el motivo del traslado: trabajo, escuela, compras, etc.",
  "Número de traslados realizados por semana según el motivo principal.",
  "Municipio de destino de quienes se desplazaron fuera de su localidad.",
  "Costo total del viaje redondo, con valores entre $0 y $4000 pesos.",
  "Describe si las unidades cuentan con aire acondicionado.",
  "Describe si las personas han enfrentado fallas en el transporte público.",
  "Describe la percepción de seguridad del usuario en el transporte público.",
  "Indica si la persona fue víctima de violencia en el transporte público (0 = no, 1 = sí).",
  "Calificación general del transporte público (escala del 1 al 10).",
  "Factor de expansión o representatividad para extrapolar a la población total."
)

Acción_tomada <- c(
  "Se convirtió en una variable factorial, asignando etiquetas 'Hombre' y 'Mujer'.",
  "Se cambió el nombre de la variable.",
  "Se transformó en factorial y se agruparon las edades como 'Juventud', 'Adultos' y 'Tercera edad'.",
  "Se transformó en variable factorial usando nombres de municipios.",
  "Se convirtió en factorial con categorías de nivel socioeconómico según AMAI.",
  "Se cambió el nombre de la variable.",
  "Se convirtió en factorial con categorías 'Sí' y 'No'.",
  "Se cambió el nombre de la variable.",
  "Se transformó en variable factorial.",
  "Se cambió el nombre de la variable.",
  "Se cambió el nombre de la variable.",
  "Se cambió el nombre de la variable.",
  "Se transformó en factorial con categorías según tipo de motivo.",
  "Se cambió el nombre de la variable.",
  "Se cambió el nombre de la variable.",
  "Se cambió el nombre de la variable.",
  "Se transformó en factorial con categorías 'No', 'Sí algunas', 'Sí todas'.",
  "Se transformó en factorial con categorías 'Sí' y 'No'.",
  "Se transformó en factorial con categorías 'Sí' y 'No'.",
  "Se transformó en factorial con categorías 'Sí' y 'No'.",
  "Se recodificó de 1 a 10 en categorías cualitativas: Muy baja a Muy alta.",
  "Se aplicó como ponderador en análisis con argumento `weights =`."
)

Justificación <- c(
  "Facilita la interpretación en análisis y visualizaciones.",
  "Facilita la comprensión de la variable.",
  "Permite análisis más claros por grupo etario.",
  "Facilita el análisis territorial y comparación regional.",
  "Permite estudiar desigualdades por nivel socioeconómico.",
  "Facilita el análisis de los medios de transporte utilizados.",
  "Hace más clara la interpretación en cruces y modelos.",
  "Mejora la legibilidad y análisis por número de vehículos.",
  "Permite analizar patrones de uso del transporte público.",
  "Conserva el significado pero mejora su lectura.",
  "Facilita los análisis sin modificar el significado original.",
  "Mantiene claridad en el análisis de tiempos de traslado.",
  "Permite vincular el motivo con las condiciones de traslado.",
  "Facilita el análisis de la carga de movilidad semanal.",
  "Mejora la comprensión de los patrones de destino.",
  "Permite analizar el impacto económico de la movilidad.",
  "Hace más clara la percepción sobre la calidad del servicio.",
  "Permite vincular calidad del servicio con fallas específicas.",
  "Facilita análisis de género y seguridad en el transporte.",
  "Hace más clara la interpretación de experiencias de violencia.",
  "Facilita la interpretación de la percepción general del servicio.",
  "Permite estimar resultados representativos de la población."
)

tabla_limpieza <- data.frame(Elemento, Hallazgo_Descripción, Acción_tomada, Justificación)

kable(tabla_limpieza, caption = "Tabla resumen de limpieza y transformación de variables") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"), full_width = FALSE)
Tabla resumen de limpieza y transformación de variables
Elemento Hallazgo_Descripción Acción_tomada Justificación
sexo Era una variable numérica donde el valor 1 representaba a los hombres y el valor 2 a las mujeres. Se convirtió en una variable factorial, asignando etiquetas ‘Hombre’ y ‘Mujer’. Facilita la interpretación en análisis y visualizaciones.
edad Es una variable numérica que va del 18 al 95. Se cambió el nombre de la variable. Facilita la comprensión de la variable.
categoría_edad La variable estaba escrita como rangos de edad de forma numérica. Se transformó en factorial y se agruparon las edades como ‘Juventud’, ‘Adultos’ y ‘Tercera edad’. Permite análisis más claros por grupo etario.
municipio El municipio estaba codificado numéricamente, asignándose una clave específica a cada uno. Se transformó en variable factorial usando nombres de municipios. Facilita el análisis territorial y comparación regional.
ingresos_nivel_socioeconomico El nivel socioeconómico estaba representado por el ingreso total reportado por la persona. Se convirtió en factorial con categorías de nivel socioeconómico según AMAI. Permite estudiar desigualdades por nivel socioeconómico.
medio_transporte La variable hace referencia al medio de transporte que utilizan las personas para trasladarse. Se cambió el nombre de la variable. Facilita el análisis de los medios de transporte utilizados.
prestacion_transportepriv Indicaba si las personas recibían la prestación de transporte por parte de su empleo (0 = no, 1 = sí). Se convirtió en factorial con categorías ‘Sí’ y ‘No’. Hace más clara la interpretación en cruces y modelos.
vehiculos_hogar La variable hace referencia a la cantidad de vehículos privados disponibles en cada hogar. Se cambió el nombre de la variable. Mejora la legibilidad y análisis por número de vehículos.
usa_transporte_publico Estaba codificada como numérica: 0 = no usa transporte público, 1 = sí usa. Se transformó en variable factorial. Permite analizar patrones de uso del transporte público.
numero_transbordos Indica cuántos transbordos semanales hace la persona usuaria de transporte público. Se cambió el nombre de la variable. Conserva el significado pero mejora su lectura.
tiempo_espera Variable numérica de 0 a 180 minutos; la mayoría de NAs son personas con automóvil. Se cambió el nombre de la variable. Facilita los análisis sin modificar el significado original.
tiempo_total_traslado Variable numérica que describe el tiempo total de traslado de la persona (ida y vuelta). Se cambió el nombre de la variable. Mantiene claridad en el análisis de tiempos de traslado.
motivo_traslado Describe el motivo del traslado: trabajo, escuela, compras, etc. Se transformó en factorial con categorías según tipo de motivo. Permite vincular el motivo con las condiciones de traslado.
traslados_semanales_motivo Número de traslados realizados por semana según el motivo principal. Se cambió el nombre de la variable. Facilita el análisis de la carga de movilidad semanal.
municipio_destino_motivo Municipio de destino de quienes se desplazaron fuera de su localidad. Se cambió el nombre de la variable. Mejora la comprensión de los patrones de destino.
costo_total_viaje_redondo Costo total del viaje redondo, con valores entre $0 y $4000 pesos. Se cambió el nombre de la variable. Permite analizar el impacto económico de la movilidad.
unidades_climatizadas Describe si las unidades cuentan con aire acondicionado. Se transformó en factorial con categorías ‘No’, ‘Sí algunas’, ‘Sí todas’. Hace más clara la percepción sobre la calidad del servicio.
Transporte_público_fallas Describe si las personas han enfrentado fallas en el transporte público. Se transformó en factorial con categorías ‘Sí’ y ‘No’. Permite vincular calidad del servicio con fallas específicas.
se_siente_seguro_tp Describe la percepción de seguridad del usuario en el transporte público. Se transformó en factorial con categorías ‘Sí’ y ‘No’. Facilita análisis de género y seguridad en el transporte.
victima_tp Indica si la persona fue víctima de violencia en el transporte público (0 = no, 1 = sí). Se transformó en factorial con categorías ‘Sí’ y ‘No’. Hace más clara la interpretación de experiencias de violencia.
Calificacion_transporte Calificación general del transporte público (escala del 1 al 10). Se recodificó de 1 a 10 en categorías cualitativas: Muy baja a Muy alta. Facilita la interpretación de la percepción general del servicio.
Factor_CVNL Factor de expansión o representatividad para extrapolar a la población total. Se aplicó como ponderador en análisis con argumento weights =. Permite estimar resultados representativos de la población.