En Nuevo León persisten importantes desigualdades en las condiciones de movilidad urbana, las cuales se manifiestan de manera diferenciada según el género, la edad y la zona de residencia de las personas. Estas disparidades se reflejan en aspectos como el medio de transporte utilizado, la duración de los trayectos y la frecuencia con la que las personas deben desplazarse. Los grupos en situación de mayor vulnerabilidad; particularmente mujeres, personas jóvenes o adultas mayores, así como habitantes de zonas periféricas, enfrentan mayores obstáculos para acceder a una movilidad eficiente, segura y asequible. Esta situación limita significativamente su acceso equitativo a oportunidades laborales y educativas, lo que contribuye a la reproducción de las desigualdades sociales y económicas en la entidad.
La elección de esta problemática responde a la necesidad de visibilizar cómo las condiciones de movilidad en Nuevo León no son neutrales, sino que están profundamente marcadas por factores sociodemográficos. En un contexto urbano donde el acceso a servicios, empleo y educación depende en gran medida de la capacidad de desplazamiento, las brechas en movilidad representan una barrera estructural para el desarrollo equitativo de la población.
1.- ¿Qué diferencias existen en los medios de transporte y tiempos de traslado entre grupos de edad, género y localidades en Nuevo León?
2.-¿Cómo afectan las condiciones de movilidad al acceso a oportunidades laborales y educativas de las personas en distintos contextos sociodemográficos?
sexo_num: Permite analizar las diferencias de movilidad según el sexo biológico.
genero_num: Aporta una perspectiva más inclusiva y actualizada del género.
nom_mun_mv: Localiza espacialmente a las personas encuestadas para comparar desigualdades entre municipios.
nom_loc_mv: Permite análisis más precisos dentro de cada municipio, detectando diferencias urbanas vs. rurales o centrales vs. periféricas.
colonia: Aporta microdatos territoriales útiles para análisis georreferenciados.
mun_amm_y_periferia: Clasifica el lugar de residencia en zonas metropolitanas, periféricas o resto del estado.
cp4_1: Registra la edad exacta.
rangos_edad: Facilita el análisis por grupos etarios, identificando necesidades diferenciadas de movilidad entre jóvenes, adultos y mayores.
p7_8: Indica si el empleo ofrece transporte privado, revelando posibles diferencias según sector laboral o nivel socioeconómico.
p13: Muestra el motivo del traslado (trabajo, estudio, salud, etc.), necesario para vincular movilidad con acceso a oportunidades.
p15: Permite medir la frecuencia semanal de traslados para evaluar esfuerzo de movilidad.
p16: Identifica el municipio de destino de los viajes, lo que permite analizar patrones de desplazamiento intermunicipal.
p17: Complementa la información del destino principal.
p18: Revela el tipo de transporte utilizado.
tiempo_espera: Mide cuánto tiempo se espera el transporte.
p21: Informa si hubo transbordo.
p22: Cuantifica los transbordos.
tiempo_total_traslado: Mide la duración total del viaje redondo.
costo_total_viaje_redondo: Mide el gasto monetario en movilidad.
usa_transporte_publico: Variable dicotómica que permite identificar usuarios frecuentes de transporte público y asociarlos con condiciones de vulnerabilidad.
p31_3: Evalúa la percepción de seguridad en el transporte público, relevante para analizar desigualdades de género.
p31_6: Indica si el transporte está climatizado, lo cual impacta en la calidad y dignidad del servicio, especialmente en zonas de calor extremo.
p32: Mide la percepción sobre la tarifa, indicador subjetivo que puede variar según nivel socioeconómico.
p33_9: Señala fallas tecnológicas en las unidades, relacionadas con eficiencia y accesibilidad del sistema de transporte.
victima_tp: Identifica si la persona ha sido víctima de acoso en el transporte público, dato fundamental para el análisis de género y seguridad.
p39: Indica el número de vehículos en el hogar, lo que permite aproximarse al nivel de dependencia del transporte público.
Factor_CVNL: Permite generalizar los resultados de la muestra a la población objetivo. Representa el número de unidades en la población que cada unidad muestral representa.
p164: Permite ver el ingreso total del hogar.
library(readr)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
eav2024 <- read.csv("eav2024.csv")
eav2024_selected <- eav2024 %>% select ("sexo_num",
"genero_num",
"nom_mun_mv",
"nom_loc_mv",
"colonia",
"mun_amm_y_periferia",
"cp4_1",
"rangos_edad",
"p7_8",
"p13",
"p15",
"p16",
"p17",
"p18",
"usa_transporte_publico",
"tiempo_espera",
"p21",
"p22",
"tiempo_total_traslado",
"costo_total_viaje_redondo",
"p31_3",
"p31_6",
"p32",
"p33_9",
"victima_tp",
"p39",
"Factor_CVNL",
"p164"
)
head(eav2024_selected)
## sexo_num genero_num nom_mun_mv nom_loc_mv
## 1 1 1 Cadereyta Jiménez Cadereyta Jiménez
## 2 0 0 Cadereyta Jiménez Valle del Roble
## 3 1 1 Cadereyta Jiménez Cadereyta Jiménez
## 4 0 0 Cadereyta Jiménez Cadereyta Jiménez
## 5 0 0 Cadereyta Jiménez Cadereyta Jiménez
## 6 1 1 General Escobedo Ciudad General Escobedo
## colonia mun_amm_y_periferia cp4_1 rangos_edad p7_8 p13
## 1 Praderas 9 50 45-54 0 1
## 2 Valle del Roble 9 35 35-44 1 1
## 3 Infonavit Jeronimo Treviño 9 32 25-34 NA 2
## 4 Alfredo V Bonfil 9 62 55-64 0 8
## 5 Centro De Cadereyta 9 80 75 o más NA 8
## 6 Alianza Real Barrio Jalisco 21 51 45-54 NA 5
## p15 p16 p17 p18 usa_transporte_publico tiempo_espera p21 p22
## 1 5 9 621 1 0 NA NA NA
## 2 6 31 1048 1 1 NA NA NA
## 3 5 9 621 1 0 NA NA NA
## 4 1 9 392 1 0 NA NA NA
## 5 2 9 439 1 0 NA NA NA
## 6 2 21 1573 1 1 NA NA NA
## tiempo_total_traslado costo_total_viaje_redondo p31_3 p31_6 p32 p33_9
## 1 45 NA NA NA NA NA
## 2 100 NA 1 2 3 1
## 3 10 NA NA NA NA NA
## 4 10 NA NA NA NA NA
## 5 10 NA NA NA NA NA
## 6 40 NA 8888 0 3 1
## victima_tp p39 Factor_CVNL p164
## 1 NA 0 258.2655 2
## 2 0 0 273.0114 3
## 3 NA 1 258.2655 3
## 4 NA 1 273.0114 3
## 5 NA 1 273.0114 3
## 6 1 0 1013.6011 3
##Factor de Expansión
library(survey)
## Cargando paquete requerido: grid
## Cargando paquete requerido: Matrix
## Cargando paquete requerido: survival
##
## Adjuntando el paquete: 'survey'
## The following object is masked from 'package:graphics':
##
## dotchart
diseño_encuesta <- svydesign(ids=~1,
data=eav2024_selected,
weights = eav2024_selected$Factor_CVNL)
svymean(~factor(genero_num), diseño_encuesta) #Factor solo se usa cuando sea variable categórica
## mean SE
## factor(genero_num)0 0.49760513 0.0086
## factor(genero_num)1 0.50106381 0.0086
## factor(genero_num)2 0.00031323 0.0003
## factor(genero_num)9999 0.00101783 0.0007
svymean(~(cp4_1), diseño_encuesta)
## mean SE
## cp4_1 47.132 0.2934
mean(eav2024_selected$cp4_1) #Cambia porque aquí no usa los pasos de Factor_CVNL
## [1] 46.83711
svytotal(~p15, diseño_encuesta, na.rm=TRUE) #na.rm es para quitar na. P15- El total de la población se ha movido 87190212 veces en la semana
## total SE
## p15 87190212 30156013
sum(eav2024_selected$p15, na.rm=TRUE) #Sin el factor da 81957, por eso hay que poner el factor de expansión con la librería survey y el ~
## [1] 81957
eav2024_clean <- eav2024_selected %>%
mutate(sexo = case_when(sexo_num==0 ~ "Hombre", sexo_num==1 ~ "Mujer"))%>%
mutate(sexo=as.factor(sexo)) %>% #Agrega columna nueva o la sobreescribe sobre la misma columna
mutate(municipio=as.factor(nom_mun_mv))%>% #No todos los municipios tuvieron participación
mutate(edad=(cp4_1)) %>%
mutate (categoría_edad = case_when(
edad < 15 ~ "Infancias",
edad >= 15 & edad < 30 ~ "Juventud",
edad >= 30 & edad < 65 ~ "Adultos",
edad >= 65 ~ "Tercera Edad")) %>%
mutate(categoría_edad=as.factor(categoría_edad)) %>%
mutate(prestacion_transportepriv = case_when(p7_8==0 ~ "No", p7_8==1 ~ "Sí", p7_8==8888 ~ "No sabe", p7_8==9999 ~ "No contesta"))%>%
mutate(prestacion_transportepriv=as.factor(prestacion_transportepriv)) %>%
mutate(motivo_traslado = case_when(p13==1 ~ "Trabajo", p13==2 ~ "Escuela", p13==3 ~ "Compras",p13==4 ~ "Médico u hospital",p13==5 ~ "Diversión", p13==6 ~ "Acompañar o llevar a alguien", p13==7 ~ "Banco o pago de servicios", p13==8 ~ "Visita", p13==9 ~ "Buscar empleo", p13==10 ~ "Trámites", p13==9999 ~ "No contesta"))%>%
mutate(motivo_traslado=as.factor(motivo_traslado)) %>%
mutate(traslados_semanales_motivo=(p15)) %>%
mutate(municipio_destino_motivo = case_when(p16==39 ~ "Monterrey", p16==26 ~ "Guadalupe", p16==46 ~ "San Nicolás de los Garza",p16==6 ~ "Apodaca",p16==21 ~ "Escobedo", p16==19 ~ "San Pedro Garza García", p16==49 ~ "Santiago", p16==31 ~ "Juárez", p16==18 ~ "García", p16==48 ~ "Santa Catarina",p16==9 ~ "Cadereyta", p16==41 ~ "Pesquería", p16==10 ~ "El Carmen", p16==12 ~ "Ciénega de Flores", p16==25 ~ "Zuazua", p16==45 ~ "Salinas Victoria", p16==1 ~ "Abasolo", p16==2 ~ "Agualeguas",p16==4 ~ "Allende", p16==5 ~ "Anáhuac", p16==7 ~ "Aramberri", p16==8 ~ "Bustamante", p16==11 ~ "Cerralvo", p16==13 ~ "China", p16==14 ~ "Doctor Arroyo", p16==15 ~ "Doctor Coss", p16==16 ~ "Doctor González", p16==17 ~ "Galeana", p16==20 ~ "General Bravo", p16==22 ~ "General Terán", p16==23 ~ "General Treviño", p16==24 ~ "General Zaragoza", p16==47 ~ "Hidalgo", p16==28 ~ "Higueras", p16==29 ~ "Hualahuises", p16==30 ~ "Iturbide", p16==31 ~ "Juárez", p16==32~ "Lampazos de Narango", p16==33 ~ "Linares", p16==3 ~ "Los Aldamas", p16==27 ~ "Los Herreras", p16==42 ~ "Los Ramones", p16==34 ~ "Marín", p16==35 ~ "Melchor Ocampo", p16==36 ~ "Mier y Noriega", p16==37 ~ "Mina", p16==38 ~ "Montemorelos", p16==40 ~ "Parás", p16==43 ~ "Rayones", p16==44 ~ "Sabinas Hidalgo", p16==50 ~ "Vallecillo", p16==51 ~ "Villaldama", p16==100 ~ "Fuera de Nuevo León", p16==111 ~ "Fuera del país", p16==888 ~ "No Sabe", p16==9999 ~ "No contesta"))%>%
mutate(municipio_destino_motivo=as.factor(municipio_destino_motivo)) %>%
mutate(medio_transporte = case_when(p18==1 ~ "Pie/silla de ruedas", p18==2 ~ "Camión/microbus", p18==3 ~ "Taxi",p18==4 ~ "Uber",p18==5 ~ "Motocicleta", p18==6 ~ "Bicicleta", p18==7 ~ "Metro", p18==8 ~ "Automóvil", p18==9 ~ "Transmetro", p18==10 ~ "Ecovía", p18==11 ~ "Transporte escolar", p18==12 ~ "Transporte de trabajo", p18==13 ~ "Camión privado", p18==14 ~ "Trailer", p18==15 ~ "Cuatrimoto", p18==16 ~ "Tractor", p18==17 ~ "Taxi colectivo", p18==8888 ~ "No sabe", p18==9999 ~ "No contesta"))%>%
mutate(medio_transporte=as.factor(medio_transporte)) %>%
mutate(usa_transporte_publico = case_when(usa_transporte_publico == 0 ~"no", usa_transporte_publico == 1 ~ "si" )) %>%
mutate(usa_transporte_publico = as.factor(usa_transporte_publico)) %>%
mutate(transborda = case_when(p21 == 0 ~ "no", p21 == 1 ~ "si")) %>%
mutate(transborda = as.factor(transborda)) %>%
mutate(numero_transbordos = as.numeric(p22)) %>%
mutate(se_siente_seguro_tp = case_when(p31_3 == 0 ~ "no", p31_3 == 1 ~ "si", p31_3 == 8888 ~ "no sabe", p31_3 == 9999 ~ "no contesta")) %>%
mutate(se_siente_seguro_tp = as.factor(se_siente_seguro_tp)) %>%
mutate(unidades_climatizadas = case_when(p31_6 == 0 ~ "no", p31_6 == 1 ~ "sí, todas", p31_6 == 2 ~ "sí, algunas", p31_6 == 8888 ~ "no sabe", p31_6 == 9999 ~ "no contesta")) %>%
mutate(unidades_climatizadas = as.factor(unidades_climatizadas)) %>%
mutate(Calificacion_transporte = case_when(p32 == 1 ~ "Muy baja",
p32 == 2 ~ "Bajo",
p32 == 3 ~ "Adecuada",
p32 == 4 ~ "Alta",
p32 == 5 ~ "Muy alta",
p32 == 8888 ~ "No sabe",
p32 == 9999 ~ "No contesta",
TRUE ~ NA_character_
)) %>%
mutate(Calificacion_transporte=as.factor(Calificacion_transporte)) %>%
mutate(Transporte_público_fallas = case_when(
p33_9 == 0 ~ "No",
p33_9 == 1 ~ "Si",
p33_9 == 8888 ~ "No sabe",
p33_9 == 9999 ~ "No contesta",
TRUE ~ NA_character_
)) %>%
mutate(Transporte_público_fallas=as.factor(Transporte_público_fallas)) %>%
mutate(ingresos_nivel_socioeconomico = case_when(
p164 == 1 ~ "E",
p164 == 2 ~ "D" ,
p164 == 3 ~ "D",
p164 == 4 ~ "D+",
p164 == 5 ~ "D+",
p164 == 6 ~ "C",
p164 == 7 ~ "C",
p164 == 8 ~ "C+",
p164 == 9 ~ "C+",
p164 == 10 ~ "A/B",
p164 == 11 ~ "A/B",
p164 == 12 ~ "A/B",
p164 == 8888 ~ "No sabe",
p164 == 9999 ~ "No contesta",
TRUE ~ NA_character_
)) %>%
mutate(ingresos_nivel_socioeconomico=as.factor(ingresos_nivel_socioeconomico)) %>%
mutate(victima_tp = case_when(
victima_tp == 1 ~ "Si",
victima_tp == 0 ~"No",
TRUE ~ NA_character_
))%>%
mutate(victima_tp=as.factor(victima_tp)) %>%
mutate(vehiculos_hogar=(p39)) %>%
select(-colonia, -sexo_num, -genero_num, -nom_loc_mv, -nom_mun_mv, -cp4_1, -mun_amm_y_periferia, -rangos_edad, -p7_8, -p13, -p15, -p16, -p17, -p18, -p32, -p33_9, -p164,-p39, -p21,-p22,-p31_3,-p31_6, -p164, -transborda) #Para deseleccionar o eliminar
En la base de datos eav2024_clean, y por la forma en que están diseñadas las preguntas sobre movilidad en la encuesta Así Vamos, no es útil ni recomendable hacer imputaciones para los datos que faltan. Las variables no están relacionadas entre sí de forma que nos permitan predecir los valores ausentes con confianza. Además, varias variables numéricas tienen más del 40 % de datos faltantes, lo cual hace que cualquier intento de rellenarlos artificialmente pueda distorsionar el análisis. Por eso, decidimos trabajar solo con los datos disponibles.
(colSums(is.na(eav2024_clean)) * 100) /4942 # Es un porcentaje
## usa_transporte_publico tiempo_espera
## 0.00000 84.35856
## tiempo_total_traslado costo_total_viaje_redondo
## 41.23837 84.07527
## victima_tp Factor_CVNL
## 59.57102 0.00000
## sexo municipio
## 0.00000 0.00000
## edad categoría_edad
## 0.00000 0.00000
## prestacion_transportepriv motivo_traslado
## 53.01497 39.82193
## traslados_semanales_motivo municipio_destino_motivo
## 39.82193 39.88264
## medio_transporte numero_transbordos
## 39.82193 94.67827
## se_siente_seguro_tp unidades_climatizadas
## 59.57102 59.57102
## Calificacion_transporte Transporte_público_fallas
## 59.57102 59.57102
## ingresos_nivel_socioeconomico vehiculos_hogar
## 0.00000 0.00000
1.- ¿Qué perfiles sociodemográficos presentan mayores desventajas en las condiciones de movilidad urbana en Nuevo León, en términos de acceso, tiempo y costo?
eav2024_final <- eav2024_clean %>% select(sexo, edad, categoría_edad, municipio, ingresos_nivel_socioeconomico, medio_transporte, prestacion_transportepriv, vehiculos_hogar, usa_transporte_publico, numero_transbordos, tiempo_espera, tiempo_total_traslado, motivo_traslado, traslados_semanales_motivo, municipio_destino_motivo, costo_total_viaje_redondo, unidades_climatizadas, Transporte_público_fallas, se_siente_seguro_tp, victima_tp, Calificacion_transporte, Factor_CVNL)
head(eav2024_final)
## sexo edad categoría_edad municipio ingresos_nivel_socioeconomico
## 1 Mujer 50 Adultos Cadereyta Jiménez D
## 2 Hombre 35 Adultos Cadereyta Jiménez D
## 3 Mujer 32 Adultos Cadereyta Jiménez D
## 4 Hombre 62 Adultos Cadereyta Jiménez D
## 5 Hombre 80 Tercera Edad Cadereyta Jiménez D
## 6 Mujer 51 Adultos General Escobedo D
## medio_transporte prestacion_transportepriv vehiculos_hogar
## 1 Pie/silla de ruedas No 0
## 2 Pie/silla de ruedas Sí 0
## 3 Pie/silla de ruedas <NA> 1
## 4 Pie/silla de ruedas No 1
## 5 Pie/silla de ruedas <NA> 1
## 6 Pie/silla de ruedas <NA> 0
## usa_transporte_publico numero_transbordos tiempo_espera tiempo_total_traslado
## 1 no NA NA 45
## 2 si NA NA 100
## 3 no NA NA 10
## 4 no NA NA 10
## 5 no NA NA 10
## 6 si NA NA 40
## motivo_traslado traslados_semanales_motivo municipio_destino_motivo
## 1 Trabajo 5 Cadereyta
## 2 Trabajo 6 Juárez
## 3 Escuela 5 Cadereyta
## 4 Visita 1 Cadereyta
## 5 Visita 2 Cadereyta
## 6 Diversión 2 Escobedo
## costo_total_viaje_redondo unidades_climatizadas Transporte_público_fallas
## 1 NA <NA> <NA>
## 2 NA sí, algunas Si
## 3 NA <NA> <NA>
## 4 NA <NA> <NA>
## 5 NA <NA> <NA>
## 6 NA no Si
## se_siente_seguro_tp victima_tp Calificacion_transporte Factor_CVNL
## 1 <NA> <NA> <NA> 258.2655
## 2 si No Adecuada 273.0114
## 3 <NA> <NA> <NA> 258.2655
## 4 <NA> <NA> <NA> 273.0114
## 5 <NA> <NA> <NA> 273.0114
## 6 no sabe Si Adecuada 1013.6011
library(knitr)
library(kableExtra)
##
## Adjuntando el paquete: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
Elemento <- c(
"sexo", "edad", "categoría_edad", "municipio", "ingresos_nivel_socioeconomico",
"medio_transporte", "prestacion_transportepriv", "vehiculos_hogar", "usa_transporte_publico",
"numero_transbordos", "tiempo_espera", "tiempo_total_traslado", "motivo_traslado",
"traslados_semanales_motivo", "municipio_destino_motivo", "costo_total_viaje_redondo",
"unidades_climatizadas", "Transporte_público_fallas", "se_siente_seguro_tp", "victima_tp",
"Calificacion_transporte", "Factor_CVNL"
)
Hallazgo_Descripción <- c(
"Era una variable numérica donde el valor 1 representaba a los hombres y el valor 2 a las mujeres.",
"Es una variable numérica que va del 18 al 95.",
"La variable estaba escrita como rangos de edad de forma numérica.",
"El municipio estaba codificado numéricamente, asignándose una clave específica a cada uno.",
"El nivel socioeconómico estaba representado por el ingreso total reportado por la persona.",
"La variable hace referencia al medio de transporte que utilizan las personas para trasladarse.",
"Indicaba si las personas recibían la prestación de transporte por parte de su empleo (0 = no, 1 = sí).",
"La variable hace referencia a la cantidad de vehículos privados disponibles en cada hogar.",
"Estaba codificada como numérica: 0 = no usa transporte público, 1 = sí usa.",
"Indica cuántos transbordos semanales hace la persona usuaria de transporte público.",
"Variable numérica de 0 a 180 minutos; la mayoría de NAs son personas con automóvil.",
"Variable numérica que describe el tiempo total de traslado de la persona (ida y vuelta).",
"Describe el motivo del traslado: trabajo, escuela, compras, etc.",
"Número de traslados realizados por semana según el motivo principal.",
"Municipio de destino de quienes se desplazaron fuera de su localidad.",
"Costo total del viaje redondo, con valores entre $0 y $4000 pesos.",
"Describe si las unidades cuentan con aire acondicionado.",
"Describe si las personas han enfrentado fallas en el transporte público.",
"Describe la percepción de seguridad del usuario en el transporte público.",
"Indica si la persona fue víctima de violencia en el transporte público (0 = no, 1 = sí).",
"Calificación general del transporte público (escala del 1 al 10).",
"Factor de expansión o representatividad para extrapolar a la población total."
)
Acción_tomada <- c(
"Se convirtió en una variable factorial, asignando etiquetas 'Hombre' y 'Mujer'.",
"Se cambió el nombre de la variable.",
"Se transformó en factorial y se agruparon las edades como 'Juventud', 'Adultos' y 'Tercera edad'.",
"Se transformó en variable factorial usando nombres de municipios.",
"Se convirtió en factorial con categorías de nivel socioeconómico según AMAI.",
"Se cambió el nombre de la variable.",
"Se convirtió en factorial con categorías 'Sí' y 'No'.",
"Se cambió el nombre de la variable.",
"Se transformó en variable factorial.",
"Se cambió el nombre de la variable.",
"Se cambió el nombre de la variable.",
"Se cambió el nombre de la variable.",
"Se transformó en factorial con categorías según tipo de motivo.",
"Se cambió el nombre de la variable.",
"Se cambió el nombre de la variable.",
"Se cambió el nombre de la variable.",
"Se transformó en factorial con categorías 'No', 'Sí algunas', 'Sí todas'.",
"Se transformó en factorial con categorías 'Sí' y 'No'.",
"Se transformó en factorial con categorías 'Sí' y 'No'.",
"Se transformó en factorial con categorías 'Sí' y 'No'.",
"Se recodificó de 1 a 10 en categorías cualitativas: Muy baja a Muy alta.",
"Se aplicó como ponderador en análisis con argumento `weights =`."
)
Justificación <- c(
"Facilita la interpretación en análisis y visualizaciones.",
"Facilita la comprensión de la variable.",
"Permite análisis más claros por grupo etario.",
"Facilita el análisis territorial y comparación regional.",
"Permite estudiar desigualdades por nivel socioeconómico.",
"Facilita el análisis de los medios de transporte utilizados.",
"Hace más clara la interpretación en cruces y modelos.",
"Mejora la legibilidad y análisis por número de vehículos.",
"Permite analizar patrones de uso del transporte público.",
"Conserva el significado pero mejora su lectura.",
"Facilita los análisis sin modificar el significado original.",
"Mantiene claridad en el análisis de tiempos de traslado.",
"Permite vincular el motivo con las condiciones de traslado.",
"Facilita el análisis de la carga de movilidad semanal.",
"Mejora la comprensión de los patrones de destino.",
"Permite analizar el impacto económico de la movilidad.",
"Hace más clara la percepción sobre la calidad del servicio.",
"Permite vincular calidad del servicio con fallas específicas.",
"Facilita análisis de género y seguridad en el transporte.",
"Hace más clara la interpretación de experiencias de violencia.",
"Facilita la interpretación de la percepción general del servicio.",
"Permite estimar resultados representativos de la población."
)
tabla_limpieza <- data.frame(Elemento, Hallazgo_Descripción, Acción_tomada, Justificación)
kable(tabla_limpieza, caption = "Tabla resumen de limpieza y transformación de variables") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"), full_width = FALSE)
| Elemento | Hallazgo_Descripción | Acción_tomada | Justificación |
|---|---|---|---|
| sexo | Era una variable numérica donde el valor 1 representaba a los hombres y el valor 2 a las mujeres. | Se convirtió en una variable factorial, asignando etiquetas ‘Hombre’ y ‘Mujer’. | Facilita la interpretación en análisis y visualizaciones. |
| edad | Es una variable numérica que va del 18 al 95. | Se cambió el nombre de la variable. | Facilita la comprensión de la variable. |
| categoría_edad | La variable estaba escrita como rangos de edad de forma numérica. | Se transformó en factorial y se agruparon las edades como ‘Juventud’, ‘Adultos’ y ‘Tercera edad’. | Permite análisis más claros por grupo etario. |
| municipio | El municipio estaba codificado numéricamente, asignándose una clave específica a cada uno. | Se transformó en variable factorial usando nombres de municipios. | Facilita el análisis territorial y comparación regional. |
| ingresos_nivel_socioeconomico | El nivel socioeconómico estaba representado por el ingreso total reportado por la persona. | Se convirtió en factorial con categorías de nivel socioeconómico según AMAI. | Permite estudiar desigualdades por nivel socioeconómico. |
| medio_transporte | La variable hace referencia al medio de transporte que utilizan las personas para trasladarse. | Se cambió el nombre de la variable. | Facilita el análisis de los medios de transporte utilizados. |
| prestacion_transportepriv | Indicaba si las personas recibían la prestación de transporte por parte de su empleo (0 = no, 1 = sí). | Se convirtió en factorial con categorías ‘Sí’ y ‘No’. | Hace más clara la interpretación en cruces y modelos. |
| vehiculos_hogar | La variable hace referencia a la cantidad de vehículos privados disponibles en cada hogar. | Se cambió el nombre de la variable. | Mejora la legibilidad y análisis por número de vehículos. |
| usa_transporte_publico | Estaba codificada como numérica: 0 = no usa transporte público, 1 = sí usa. | Se transformó en variable factorial. | Permite analizar patrones de uso del transporte público. |
| numero_transbordos | Indica cuántos transbordos semanales hace la persona usuaria de transporte público. | Se cambió el nombre de la variable. | Conserva el significado pero mejora su lectura. |
| tiempo_espera | Variable numérica de 0 a 180 minutos; la mayoría de NAs son personas con automóvil. | Se cambió el nombre de la variable. | Facilita los análisis sin modificar el significado original. |
| tiempo_total_traslado | Variable numérica que describe el tiempo total de traslado de la persona (ida y vuelta). | Se cambió el nombre de la variable. | Mantiene claridad en el análisis de tiempos de traslado. |
| motivo_traslado | Describe el motivo del traslado: trabajo, escuela, compras, etc. | Se transformó en factorial con categorías según tipo de motivo. | Permite vincular el motivo con las condiciones de traslado. |
| traslados_semanales_motivo | Número de traslados realizados por semana según el motivo principal. | Se cambió el nombre de la variable. | Facilita el análisis de la carga de movilidad semanal. |
| municipio_destino_motivo | Municipio de destino de quienes se desplazaron fuera de su localidad. | Se cambió el nombre de la variable. | Mejora la comprensión de los patrones de destino. |
| costo_total_viaje_redondo | Costo total del viaje redondo, con valores entre $0 y $4000 pesos. | Se cambió el nombre de la variable. | Permite analizar el impacto económico de la movilidad. |
| unidades_climatizadas | Describe si las unidades cuentan con aire acondicionado. | Se transformó en factorial con categorías ‘No’, ‘Sí algunas’, ‘Sí todas’. | Hace más clara la percepción sobre la calidad del servicio. |
| Transporte_público_fallas | Describe si las personas han enfrentado fallas en el transporte público. | Se transformó en factorial con categorías ‘Sí’ y ‘No’. | Permite vincular calidad del servicio con fallas específicas. |
| se_siente_seguro_tp | Describe la percepción de seguridad del usuario en el transporte público. | Se transformó en factorial con categorías ‘Sí’ y ‘No’. | Facilita análisis de género y seguridad en el transporte. |
| victima_tp | Indica si la persona fue víctima de violencia en el transporte público (0 = no, 1 = sí). | Se transformó en factorial con categorías ‘Sí’ y ‘No’. | Hace más clara la interpretación de experiencias de violencia. |
| Calificacion_transporte | Calificación general del transporte público (escala del 1 al 10). | Se recodificó de 1 a 10 en categorías cualitativas: Muy baja a Muy alta. | Facilita la interpretación de la percepción general del servicio. |
| Factor_CVNL | Factor de expansión o representatividad para extrapolar a la población total. |
Se aplicó como ponderador en análisis con argumento
weights =.
|
Permite estimar resultados representativos de la población. |