Sin una formación cívica sólida, las personas no desarrollan habilidades como la toma de decisiones informadas, la deliberación pública o el sentido de corresponsabilidad (García y De Alba, 2007; Guevara, 1998). El nivel educativo potencia las capacidades cognitivas para comprender procesos políticos, evaluar alternativas y participar activamente, tanto en formas convencionales como no convencionales (Marsh y Kaase, 1979). Las personas con más recursos pueden cubrir sus necesidades básicas y destinar tiempo y atención a la esfera política. Quienes se encuentran en posiciones más altas dentro de la estructura social tienden a tener mayor sentido de eficacia política, interés y compromiso cívico (Anduiza y Bosch, 2004; Milbraith, 1981). Cuando gran parte de la población no participa, las decisiones públicas dejan de ser representativas.Esto debilita la democracia, reduce la rendición de cuentas y aleja al gobierno de las verdaderas necesidades sociales.
Desigualdad educativa y la limitación al ejercicio pleno de la ciudadanía.
La desigualdad educativa es una barrera significativa para el ejercicio pleno de la ciudadanía. Factores como el nivel de escolaridad alcanzado, la calidad percibida de la experiencia educativa y las condiciones socioeconómicas del entorno pueden influir directamente en el grado de participación cívica de las personas. Sin embargo, esta relación no es uniforme: el género puede introducir diferencias importantes tanto en el acceso a oportunidades educativas como en las formas de involucramiento ciudadano. Las mujeres, en particular, enfrentan obstáculos estructurales que limitan su desarrollo educativo y, por ende, pueden afectar su participación activa en los asuntos públicos. Esto evidenciaría que la desigualdad educativa no solo reproduce brechas sociales, sino que también condiciona el derecho a una ciudadanía plena de manera diferenciada entre hombres y mujeres.
¿De qué manera el nivel educativo alcanzado y la satisfacción con la experiencia escolar influyen en la participación ciudadana (votar, exigir mejoras, proponer presupuesto), y cómo difiere esta relación entre mujeres y hombres?
La base de datos generada por Como Vamos NL viene de la encuesta estatal Asi Vamos NL. Esta es una gran herramienta para la toma de decisiones publicas informadas. La base de datos cuenta con datos actualizados y específicos de Nuevo León, Representatividad estatal, variables clave y es una herramienta reconocida por organizaciones civiles y autoridades locales.El uso de esta encuesta promueve la creación de políticas públicas eficientes ya que se hacen tomando en cuenta los problemas que la gran parte de la población reconoce. Las políticas públicas que son hechas usando información tan relevante y representativa como la de esta encuesta, incrementan la probabilidad de que estas sean exitosas. Esta base de datos es del 2024, siendo la más reciente y contiene los datos más recientes con los que podemos trabajar, es decir, continuan siendo representativos de los problemas que se vocalizan en la encuesta.
Se detectaron muchos valores faltantes (N/A) en distintas variables relacionadas con el nivel educativo.Optamos por incluir la variable de nivel socioeconómico percibido como complemento, ya que tenía mayor tasa de respuesta.Recodificamos y limpiamos datos para asegurar coherencia y comparabilidad entre las respuestas. Por suerte, no nos encontramos con problemas grandes que no nos permitieran seguir con la pregunta de investigación.
Nuestra pregunta de investigación aborda temas de género, educación y participación ciudadana. Con esto en mente, las variables que sleccionamos son de estas tres secciones. También, nos enfocamos en elegir variables que pudieran tener correlación entre sí, para demostrar esta relación. Incluimos variables que reflejan el contexto económico, de género y educativo para entender cómo funciona la participación ciudadana en Nuevo León. Consideramos que todas estas variables tienen una relación en incentivar a las personas a participar en la toma de decisiones en los gobiernos.
nom_mun_mv = Nombre del municipio donde se realizó la encuesta. sexo_num = Código numérico del sexo de la persona encuestada. genero_num = Código numérico del género con el que se identifica la persona encuestada. cp7_1 = ¿Estudia actualmente? cp8_1 = Máximo nivel de estudios alcanzados. cp10_1 = Tipo de escuela. cp11_1 = ¿Se negó la educación por falta de pago? cp15_1 = ¿En la escuela existen dispositivos tecnológicos? cp16_1 = ¿Cómo evalúas los equipamientos de la escuela? (infraestructura) cp17_1_1 = ¿Qué tan satisfecho está con el servicio de su escuela? PRIMARIA cp17_2_1 = ¿Qué tan satisfecho está con el servicio de su escuela? SECUNDARIA cp17_3_1 = ¿Qué tan satisfecho está con el servicio de su escuela? MEDIA SUPERIOR p1 = ¿En su hogar existen suficientes dispositivos electrónicos? p2 = ¿Su hogar cuenta con una conexión a internet estable y confiable? p75 = ¿Su ingreso total satisface todas las necesidades? p164 = Ingreso mensual del hogar. p99 = ¿Cuál es el principal problema de DESARROLLO SOCIAL que se vive en su municipio? p100 = ¿Qué tan seguro(a) se siente en su municipio? p108_1 = ¿La presencia de policías en su colonia es suficiente? p157_10_otra = ¿Ha realizado alguna(s) de siguientes acciones en los últimos 12 meses para mejorar las condiciones de su estado?: Otra. p157_10_espec = ¿Ha realizado alguna(s) de siguientes acciones en los últimos 12 meses para mejorar las condiciones de su estado?: Especificar cuál otra acción de participación ciudadana ha realizado (solo para quienes respondieron que sí a otra). p120 = ¿Votó en las pasadas elecciones? p125 = ¿Considera que el gobierno del alcalde o de la alcaldesa de su municipio hizo un buen uso de los recursos públicos? p132_2 = ¿Considera que el alcalde o la alcaldesa de su municipio fue capaz de resolver los problemas del municipio? p137 = En términos generales, ¿aprueba o desaprueba el trabajo que hizo el alcalde o la alcaldesa de su municipio? p151 = ¿Sabe quién es la o el diputado local del distrito en el que usted vive? p155 = ¿Cuánto considera que los ciudadanos pueden influir en las decisiones del gobierno del estado de Nuevo León? p156 = ¿Cuánto considera que los ciudadanos pueden influir en las decisiones del gobierno de este municipio? p157_5 = ¿Ha realizado alguna(s) de las siguientes acciones en los últimos 12 meses para mejorar las condiciones de su estado?: Participar en una asociación de padres de familia. p157_8 = ¿Ha realizado alguna(s) de siguientes acciones en los últimos 12 meses para mejorar las condiciones de su estado?: Votar o proponer en qué se debería gastar el presupuesto participativo en su municipio. p157_9 = ¿Ha realizado alguna(s) de siguientes acciones en los últimos 12 meses para mejorar las condiciones de su estado?: Solicitar apoyo o presentar quejas a funcionarios o autoridades (reportar baches, luminarias, parques en mal estado u otros aspectos que permitan la mejora de la ciudad). p76 = ¿Considera que las mujeres tienen las mismas oportunidades laborales, económicas, políticas y sociales que los hombres? p77_1 = ¿Cree que en Nuevo León se discrimina a la gente por ser mujer? p149 = En términos generales, ¿aprueba o desaprueba el trabajo que hizo Andrés Manuel López Obrador? p150 = ¿Considera que con la administración de Claudia Sheinbaum en los próximos 6 años, México mejorará, se quedará igual de bien, se quedará igual de mal o empeorará?
En el estado de Nuevo León, donde coexisten altos niveles de desarrollo industrial con marcadas desigualdades sociales, surge la necesidad de comprender cómo estas condiciones impactan la manera en que los ciudadanos se informan, opinan y participan en los asuntos públicos.
Un mayor nivel educativo se asocia con una mayor conciencia cívica, habilidades críticas y disposición a participar en actividades políticas o sociales. De igual forma, el nivel socioeconómico podría facilitar o limitar el acceso a recursos que favorecen dicha participación, como el tiempo libre, el acceso a tecnologías de la información o incluso la confianza en las instituciones. No obstante, la interacción entre estas dos variables (educación y nivel socioeconómico) y su efecto conjunto sobre la opinión pública y la participación ciudadana no ha sido suficientemente explorada en el contexto específico de Nuevo León.
Esta falta de comprensión limita la capacidad de diseñar políticas públicas efectivas que fomenten la inclusión y el empoderamiento ciudadano. Por ello, es relevante investigar si existe una correlación significativa entre estas variables, con el fin de identificar brechas, patrones de exclusión y oportunidades para fortalecer la democracia a nivel local.
Considerando la encuesta Asi Vamos NL 2024, ¿cómo influyen el nivel educativo y socioeconómico en la percepción de los ciudadanos de Nuevo León sobre su capacidad de incidir en las decisiones públicas?
En la transcurso de la investigación cambiamos la perspectiva de la misma, ya que consideramos que iba más allá de solo el nivel educativo alcanzado y la participación ciudadana. Nuevo León es un estado con altos contrastes socioeconómicos y una población urbana importante, lo que lo convierte en un escenario ideal para estudiar cómo interactúan estas variables. Además que la opinión pública puede ser condicionada por la información a la que se tiene acceso, el tiempo libre disponible para involucrarse y la confianza en las instituciones.#Varibales ajusutadas
nom_mun_mv = Nombre del municipio donde se realizó la
encuesta.
sexo_num = Código numérico del sexo de la persona
encuestada.
cp7_1 = ¿Estudia actualmente?
cp8_1 = Máximo nivel de estudios alcanzados.
cp10_1 = Tipo de escuela.
p2 = ¿Su hogar cuenta con una conexión a internet estable y
confiable?
p75 = ¿Su ingreso total satisface todas las necesidades?
p164 = Ingreso mensual del hogar.
p99 = ¿Cuál es el principal problema de DESARROLLO SOCIAL que
se vive en su municipio?
p100 = ¿Qué tan seguro(a) se siente en su municipio?
p108_1 = ¿La presencia de policías en su colonia es suficiente?
p157_10_espec = ¿Ha realizado alguna(s) de siguientes acciones
en los últimos 12 meses para mejorar las condiciones de su estado?:
Especificar cuál otra acción de participación ciudadana ha realizado
(solo para quienes respondieron que sí a otra). p120 = ¿Votó en
las pasadas elecciones?
p125 = ¿Considera que el gobierno del alcalde o de la alcaldesa
de su municipio hizo un buen uso de los recursos públicos?
p132_2 = ¿Considera que el alcalde o la alcaldesa de su
municipio fue capaz de resolver los problemas del municipio?
p137 = En términos generales, ¿aprueba o desaprueba el trabajo
que hizo el alcalde o la alcaldesa de su municipio?
p151 = ¿Sabe quién es la o el diputado local del distrito en el
que usted vive?
p155 = ¿Cuánto considera que los ciudadanos pueden influir en
las decisiones del gobierno del estado de Nuevo León?
p149 = En términos generales, ¿aprueba o desaprueba el trabajo
que hizo Andrés Manuel López Obrador?
p150 = ¿Considera que con la administración de Claudia
Sheinbaum en los próximos 6 años, México mejorará, se quedará igual de
bien, se quedará igual de mal o empeorará?
p73 = ¿Cómo describiría usted la SITUACIÓN económica DE SU
HOGAR comparada con la de HACE 12 MESES?
p74 = ¿Y cómo cree usted que será la SITUACIÓN económica DE SU
HOGAR DENTRO DE 12 MESES respecto de la actual? p105 = ¿Qué tan
probable considera que los delitos denunciados sean investigados y
sancionados por las autoridades? p116 = De acuerdo con su
percepción, mencione cuál es el principal problema de SEGURIDAD que se
vive en su municipio
p122 = ¿Por qué eligió al alcalde(sa) por quien votó? (Solo
para quienes respondieron que sí votó en las elecciones pasadas)
p126 = ¿Considera que el gobierno de Samuel García ha hecho un
buen uso de los recursos públicos? p127 = La corrupción
consiste en el abuso de poder para beneficio propio ya sea en el sector
público o en el privado. En su opinión, en el estado de Nuevo León la
corrupción es una práctica: muy frecuente, frecuente, poco frecuente o
no ocurre. p131_1 = Considera que el alcalde o la alcaldesa de
su municipio: ¿Fue un gobernante honesto(a)?
p132_2 = Considera que el alcalde o la alcaldesa de su
municipio: ¿Fue capaz de resolver los problemas del municipio?
p133_4 = Considera que el alcalde o la alcaldesa de su
municipio: ¿Cumplió con sus promesas de campaña/compromisos?
133_5 = Considera que el alcalde o la alcaldesa de su
municipio: ¿Tuvo la capacidad y apertura para generar acuerdos con
diferentes actores políticos e instituciones públicas por el bien de su
municipio?
p136 = Usted considera que el alcalde o la alcaldesa de su
municipio tomó la mayoría de sus decisiones: pensando en el bienestar
del municipio o pensando en intereses particulares/personales.
p137 = En términos generales, ¿aprueba o desaprueba el trabajo
que hizo el alcalde o la alcaldesa de su municipio?
p138 = En términos generales, considera que hoy, comparado con
hace tres años, este municipio: ha empeorado, se ha mantenido igual de
mal, se ha mantenido igual de bien o ha mejorado.
p139 = Para usted, el gobierno del alcalde o la alcaldesa de su
municipio fue: mejor de lo que esperaba, igual de bien que lo que
esperaba, igual de lo mal que lo que esperaba o peor de lo que
esperaba.
p140_1 = Considera que Samuel García: ¿Es un gobernante
honesto?
p142_3 = Considera que Samuel García: ¿Es capaz de resolver los
problemas del Estado?
Estas son las librerias que vamos a utilizar para poder leer la base de datos y poder extraer información relevante para la construcción de un modelo de regresión logística que demuestre correlación entre las variables que seleccionamos para la investigación.
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyr)
eav2024 <- read_csv("eav2024.csv")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 4942 Columns: 491
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (15): nom_mun_mv, nom_loc_mv, ageb_mv, colonia, rangos_edad, cp4_2_dumm...
## dbl (432): num_mun, mun_amm_y_periferia, sexo_num, genero_num, mza_mv, cp1, ...
## lgl (44): cp13_1, cp17_1_1, cp4_1_2, cp13_6, cp4_1_7, cp9_8, cp10_8, cp11_8...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
La selección de variables es la parte más importante del proyecto, ya que con la ayuda de estas vamos a ver si nuestra pregunta está en lo correcto o no. En este caso, elegimos variables de opinión y percepción pública al igual que variables con indicadores socioeconómicos y de educación.
eav2024_selected <- eav2024 %>% select(
Factor_CVNL, nom_mun_mv,sexo_num,genero_num,cp7_1,cp4_1,cp8_1,cp10_1,p2,p75,p164,p99,p100,p108_1,p120,p125,p132_2,p137,p151,p155,p149,p150,p73,p74,p105,p109_1,p109_3,p116,p122,p126,p127,p131_1,p132_2,p133_4,p133_5,p136,p137,p138,p139,p140_1,p142_3,p143_4,p143_5,p145,p146,p153,p154,p156)
Las primeras observaciones de la base de datos (pre limpieza) nos demuestran valores que son complicados de leer sin la ayuda del diccionario de datos, por eso, es importante hacer una limpieza y eliminar valores con pocas respuestas y muchos N/A.
head(eav2024_selected)
## # A tibble: 6 × 46
## Factor_CVNL nom_mun_mv sexo_num genero_num cp7_1 cp4_1 cp8_1 cp10_1 p2
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 258. Cadereyta Jimé… 1 1 0 50 2 NA 1
## 2 273. Cadereyta Jimé… 0 0 0 35 3 NA 1
## 3 258. Cadereyta Jimé… 1 1 0 32 3 NA 1
## 4 273. Cadereyta Jimé… 0 0 0 62 3 NA 1
## 5 273. Cadereyta Jimé… 0 0 0 80 2 NA 0
## 6 1014. General Escobe… 1 1 0 51 3 NA 1
## # ℹ 37 more variables: p75 <dbl>, p164 <dbl>, p99 <dbl>, p100 <dbl>,
## # p108_1 <dbl>, p120 <dbl>, p125 <dbl>, p132_2 <dbl>, p137 <dbl>, p151 <dbl>,
## # p155 <dbl>, p149 <dbl>, p150 <dbl>, p73 <dbl>, p74 <dbl>, p105 <dbl>,
## # p109_1 <dbl>, p109_3 <dbl>, p116 <dbl>, p122 <dbl>, p126 <dbl>, p127 <dbl>,
## # p131_1 <dbl>, p133_4 <dbl>, p133_5 <dbl>, p136 <dbl>, p138 <dbl>,
## # p139 <dbl>, p140_1 <dbl>, p142_3 <dbl>, p143_4 <dbl>, p143_5 <dbl>,
## # p145 <dbl>, p146 <dbl>, p153 <dbl>, p154 <dbl>, p156 <dbl>
El factor de expansión es necesario en las variables que representan una población con menos representación que otras. Por ejemplo, una respuesta en un municipio podría tener mas representatividad que otra de un municipio con menos densidad poblacional. Es decir, ajusta el peso de las respuestas para obtener balance en los datos.
library(survey)
## Loading required package: grid
## Loading required package: Matrix
##
## Attaching package: 'Matrix'
## The following objects are masked from 'package:tidyr':
##
## expand, pack, unpack
## Loading required package: survival
##
## Attaching package: 'survey'
## The following object is masked from 'package:graphics':
##
## dotchart
diseño_encuesta <- svydesign(ids = ~1,
data = eav2024_selected,
weights = eav2024_selected$Factor_CVNL)
svymean(~factor(genero_num), diseño_encuesta)
## mean SE
## factor(genero_num)0 0.49760513 0.0086
## factor(genero_num)1 0.50106381 0.0086
## factor(genero_num)2 0.00031323 0.0003
## factor(genero_num)9999 0.00101783 0.0007
svymean(~cp4_1, diseño_encuesta)
## mean SE
## cp4_1 47.132 0.2934
mean(eav2024_selected$cp4_1) #aca no se usa Factor de exp
## [1] 46.83711
svytotal(~p164, diseño_encuesta, na.rm=TRUE) #cuando queres quitar los N/A, usa **na.rm=TRUE**
## total SE
## p164 4762743058 269358330
#la libreria survery trae varias funciones, hay que revisar que funciones tiene
sum(eav2024_selected$p164, na.rm=TRUE)
## [1] 4574005
#No siempre es necesario usar el factor de expansión
Esta es la parte mas tediosa del proceso, pero, es muy necesaria. Cuando abrimos la base de datos nos dimos cuenta que las variables no tenían nombres que podiamos leer sin la ayuda del diccionario de datos.Al igual que las respuestas, que estaban en formato numérico. Con las variables que elegimos usamos la función de “mutate” para cambiarlas de numeros a respuestas con palabras. Esto lo hace mucho mas fácil para nosotras a la hora de leer la base de datos.
eav2024_selected_clean <- eav2024_selected %>%
mutate(sexo = as.factor(sexo_num)) %>% #llamalo con commad + shit + m
mutate(sexo = case_when(sexo_num == 0 ~"Hombre", sexo_num == 1 ~ "Mujer")) %>%
mutate(municipio = as.factor(nom_mun_mv)) %>%
mutate(estudia_actualmente = as.factor(cp7_1))%>%
mutate(estudia_actualmente = case_when(cp7_1 == 0 ~"no", cp7_1 == 1 ~ "si")) %>%
mutate(Edad = as.numeric(cp4_1)) %>%
mutate(nivel_max_estudios = as.numeric(cp8_1)) %>%
mutate(nivel_max_estudios = case_when(cp8_1 == 0 ~"ninguno", cp8_1 == 1 ~ "preescolar", cp8_1 == 2 ~"primaria", cp8_1 == 3 ~ "secundaria", cp8_1 == 4 ~ "prepa", cp8_1 == 5 ~ "bachiller tecnico", cp8_1 == 6 ~ "estudio tecnico", cp8_1 == 7 ~ "Estudios técnicos o comerciales con secundaria terminada", cp8_1 == 8 ~ "Estudios técnicos o comerciales con preparatoria terminada", cp8_1 == 9 ~ " Normal con primaria o secundaria terminada", cp8_1 == 10 ~ "normal de licenciatura", cp8_1 == 11 ~ "licenciatura", cp8_1 == 12 ~ "especialidad", cp8_1 == 13 ~ "maestria", cp8_1 == 14 ~ "doctorado", cp8_1 == 8888 ~ "no sabe", cp8_1 == 9999 ~ "no contesta")) %>%
mutate(tipo_escuela = as.numeric(cp10_1)) %>%
mutate(tipo_escuela = case_when(cp10_1 == 1 ~"publica", cp10_1 == 2 ~ "privada"))%>%
mutate(conexion_internet = as.numeric(p2)) %>%
mutate(conexion_internet = case_when(p2 == 0 ~"no", p2 == 1 ~ "si", p2 == 8888 ~ "no sabe", p2 == 9999 ~ "no contesta")) %>%
mutate(total_ingreso_hogar = as.numeric(p75)) %>%
mutate(total_ingreso_hogar = case_when(p75 == 1 ~" Les alcanza bien y pueden ahorrar", p75 == 2 ~ "Les alcanza justo, sin grandes dificultades",p75 == 3 ~ "No les alcanza y tienen dificultades",p75 == 4 ~ " No les alcanza y tienen grandes dificultades", p75 == 8888 ~ "no sabe", p75 == 9999 ~ "no contesta")) %>%
mutate(total_mensual_hogar = as.numeric(p164)) %>%
mutate(total_mensual_hogar = case_when(p164 == 1 ~"Sin ingreso", p164 == 2 ~ " Menos de 1 SM ($1 - $7,468)", p164 == 3 ~ "1-2 SM ($7,468 - $14,936)", p164 == 4 ~ " 2-3 SM ($14,936 - $22,404)", p164 == 5 ~ "3-4 SM ($22,404 - $29,872)", p164 == 6 ~ " 4-5 SM ($29,872 - $37,340)", p164 == 7 ~ " 5-6 SM ($37,340 - $44,807)", p164 == 8 ~ "6-7 SM ($44,807 - $52,275)", p164 == 9 ~ "7-8 SM ($52,275 - $59,743)", p164 == 10 ~ " 8-9 SM ($59,743 - $67,211)", p164 == 11 ~ "9-10 SM ($67,211 - $74,679)", p164 == 12 ~ "10 o más SM ($74,679 o más)", p164 == 9999 ~ "no contesta")) %>%
mutate(problema_des_social = as.numeric(p99)) %>%
mutate(problema_des_social = case_when(p99 == 1 ~"El ingreso familiar no es suficiente", p99 == 2 ~ "Pocas oportunidades laborales.", p99 == 3 ~ ". Servicios de salud poco accesibles (lejanos, caros,insuficientes).", p99 == 4 ~ " Mala calidad en los servicios de salud.", p99 == 5 ~ "Planteles educativos poco accesibles (lejanos, caros, cupo insuficiente).", p99 == 6 ~ "Mala calidad del servicio educativo.", p99 == 7 ~ "Discriminación hacia ciertos grupos", p99 == 8 ~ "Personas migrantes sin oportunidades para integrarse a la sociedad.", p99 == 9 ~ " Falta de servicios de cuidado accesibles: guarderías, asilo de ancianos o centros para personas con discapacidad", p99 == 10 ~ "Ninguno", p99 == 8888 ~ "no sabe", p99 == 9999 ~ "no contesta")) %>%
mutate(seguiridad = as.numeric(p100)) %>%
mutate(seguiridad = case_when(p100 == 1 ~ "muy seguro", p100 == 2 ~ "Seguro", p100 == 3 ~ "Inseguro", p100 == 4 ~ "Muy inseguro", p100 == 8888 ~ "no sabe", p100 == 9999 ~ "no contesta")) %>%
mutate(presencia_policias = as.numeric(p108_1)) %>%
mutate(presencia_policias = case_when(p108_1 == 0 ~ "no", p108_1 == 1 ~ "si", p108_1 == 8888 ~ "no sabe", p108_1 == 9999 ~ "no contesta")) %>%
mutate(voto_elecciones = as.numeric(p120)) %>%
mutate(voto_elecciones = case_when(p120 == 0 ~ "no", p120 == 1 ~ "si", p120 == 8888 ~ "no sabe", p120 == 9999 ~ "no contesta")) %>%
mutate(aprueba_usorecursos = as.numeric(p125)) %>%
mutate(aprueba_usorecursos = case_when(p125 == 0 ~ "no", p125 == 1 ~ "si", p125 == 8888 ~ "no sabe", p125 == 9999 ~ "no contesta")) %>%
mutate(eficiencia_alcalde = as.numeric(p132_2)) %>%
mutate(eficiencia_alcalde = case_when(p132_2 == 0 ~ "no", p132_2 == 1 ~ "si", p132_2 == 8888 ~ "no sabe", p132_2 == 9999 ~ "no contesta")) %>%
mutate(aprueba_alcalde = as.numeric(p137)) %>%
mutate(aprueba_alcalde = case_when(p137 == 0 ~ "no", p137 == 1 ~ "si", p137 == 8888 ~ "no sabe", p137 == 9999 ~ "no contesta")) %>%
mutate(conoce_diputado = as.numeric(p151)) %>%
mutate(conoce_diputado = case_when(p151 == 0 ~ "no", p151 == 1 ~ "si", p151 == 9999 ~ "no contesta")) %>%
mutate(percepcion_influencia = as.numeric(p155)) %>%
mutate(percepcion_influencia = case_when(p155 == 1 ~ "mucho", p155 == 2 ~ "algo", p155 == 3 ~ "poco", p155 == 4 ~ "nada", p155 == 8888 ~ "no sabe", p125 == 9999 ~ "no contesta")) %>%
mutate(nivel_influencia = as.numeric(p156)) %>%
mutate(percepcion_influencia = case_when(p155 == 1 ~ "mucho", p156 == 2 ~ "algo", p156 == 3 ~ "poco", p156 == 4 ~ "nada", p156 == 8888 ~ "no sabe", p156 == 9999 ~ "no contesta")) %>%
mutate(aprobacion_amlo = as.numeric(p149)) %>%
mutate(aprobacion_amlo = case_when(p149 == 0 ~ "desaprueba", p149 == 1 ~ "aprueba", p149 == 8888 ~ "no sabe", p149 == 9999 ~ "no contesta")) %>%
mutate(percepcion_sheimbaum = as.numeric(p150)) %>%
mutate(percepcion_sheimbaum = case_when(p150 == 1 ~ "mejora", p150 == 2 ~ "se queda igual de bien", p150 == 3 ~ "se queda igual de mal", p150 == 4 ~ "empeora", p150 == 8888 ~ "no sabe", p150 == 9999 ~ "no contesta")) %>%
mutate(sit_econ_12meses = as.numeric(p73)) %>%
mutate(sit_econ_12meses = case_when(p73 == 1 ~ "mejor", p74 == 2 ~ "igual de bien", p74 == 3 ~ "igual de mal", p74 == 4 ~ " peor", p74 == 8888 ~ "no sabe", p74 == 9999 ~ "no contesta"))%>%
mutate(sit_econ_next12meses = as.numeric(p74)) %>%
mutate(sit_econ_next12meses = case_when(p74 == 1 ~ "mejor", p74 == 2 ~ "igual de bien", p74 == 3 ~ "igual de mal", p74 == 4 ~ " peor", p74 == 8888 ~ "no sabe", p74 == 9999 ~ "no contesta"))%>%
mutate(invest_delitos = as.numeric(p105)) %>%
mutate(invest_delitos = case_when(p105 == 1 ~ "muy probable", p105 == 2 ~ "probable", p105 == 3 ~ "poco probable", p105 == 4 ~ "improbable",p105 == 8888 ~ "no sabe", p105 == 9999 ~ "no contesta")) %>%
mutate(desemp_policia = as.numeric(p116))%>%
mutate(desemp_policia = case_when(p116 == 1 ~ "delito", p116 == 2 ~ "robo")) %>%
mutate(porque_votaste = as.numeric(p122))%>%
mutate(porque_votaste = case_when(p122 == 1 ~ "propuestas", p122 == 2 ~ "trayectoria", p122 == 3 ~ "partido politico", p122 == 4 ~ "beneficio por voto", p122 == 5 ~ "amenaza trabajo", p122 == 6 ~ "amenaza apoyo", p122 == 7 ~ "no queria otro", p122 == 8 ~ "Voto util", p122 == 9 ~ "personalidad", p122 == 10 ~ "lo conozco", p122 == 11 ~ "quiero cambio", p122 == 12 ~ "por cumplir", p122 == 8888 ~ "no sabe", p122 == 9999 ~ "no contesta")) %>%
mutate(apruebarecursos_samuel = as.numeric(p126))%>%
mutate(apruebarecursos_samuel = case_when(p126 == 0 ~ "no", p126 == 1 ~ "si", p126 == 8888 ~ "No sabe", p126 == 9999 ~ "no contesta")) %>%
mutate(corrupcion_nl = as.numeric(p127)) %>%
mutate(corrupcion_nl = case_when(p127 == 1 ~"muy frecuente", p127 == 2 ~ "Frecuente", p127 == 3 ~ "poco frecuente", p127 == 4 ~ "no ocurre", p127 == 8888 ~ "No sabe", p127 == 9999 ~ "no contesta")) %>%
mutate(alcalde_honesto = as.numeric(p131_1))%>%
mutate(alcalde_honesto = case_when(p131_1 == 0 ~ "no", p131_1 == 1 ~ "si", p131_1 == 8888 ~ "no sabe", p131_1 == 9999 ~ "no contesta")) %>%
mutate(cumple_promesas = as.numeric(p133_4))%>%
mutate(cumple_promesas = case_when(p133_4 == 0 ~ "no", p133_4 == 1 ~ "si", p133_4 == 8888 ~ "no sabe", p133_4 == 9999 ~ "no contesta")) %>%
mutate(capacidad_apertura = as.numeric(p133_5))%>%
mutate(capacidad_apertura = case_when(p133_5 == 0 ~ "no", p133_5 == 1 ~ "si", p133_5 == 8888 ~ "no sabe", p133_5 == 9999 ~ "no contesta")) %>%
mutate(toma_decision = as.numeric(p136))%>%
mutate(toma_decision = case_when(p136 == 1 ~ "pensando en bienestar municipal", p136 == 2 ~ "pensando en personal", p136 == 8888 ~ "no sabe", p136 == 9999 ~ "no contesta")) %>%
mutate(mejor_peor = as.numeric(p138))%>%
mutate(mejor_peor= case_when(p138 == 1 ~ "empeorado", p138 == 2 ~ "Mantiene igual de mal", p138 == 3 ~ "mantiene igual de bien", p138 == 4 ~ "ha mejorado", p138 == 8888 ~ "no sabe", p138 == 9999 ~ "no contesta"))%>%
mutate(gobierno_muni_alcalde = as.numeric(p139))%>%
mutate(gobierno_muni_alcalde = case_when(p139 == 1 ~ "mejor de lo que esperaba", p139 == 2 ~ "igual de bien", p139 == 3 ~ "igual de mal", p139 == 4 ~ "peor",p139 == 8888 ~ "no sabe", p139 == 9999 ~ "no contesta"))%>%
mutate(samuel_honesto = as.numeric(p140_1))%>%
mutate(samuel_honesto = case_when(p140_1 == 0 ~ "no", p140_1 == 1 ~ "si", p140_1 == 8888 ~ "no sabe", p140_1 == 9999 ~ "no contesta")) %>%
mutate(factor_expansion = as.numeric(Factor_CVNL)) %>%
select(-sexo_num,-nom_mun_mv,-cp7_1, -cp4_1, -cp8_1,-cp10_1,-p2, -p75, -p164,-p99, -p100, -p108_1,-p120,- p125, -p132_2, -p137,-p151,-p155,-p156, -p149, -p150, -p73, -p74, -p105, -p116, -p122, -p126, -p127, -p131_1, -p133_4, -p133_5, -p136, -p138, -p139, -p140_1, -Factor_CVNL, -genero_num, -p109_1, -p109_3, -p142_3, -p143_4, -p143_5, -p145, -p146, -p153,-p154) #para deseleccionar
Al finalizar el proceso de limpieza, tenemos una base de datos lista para trabajar y utilizar las mejores variables para correr nuestro primer modelo. Ahora cuando se abre la base de datos, podemos ver nombres legibles en las columnas y respuestas que no necesitan un diccionario para ser decodificadas. Esto también nos ayuda al momento de programar ya que es mas facil escribir las variables que tienen un nombre que podemos reconocer a variables que solo son un conjunto de números.
Similarmente a las primeras observaciones de la base de datos original, en esta base ya podemos reconocer cuales son las variables y las respuestas que se encuentran al principio de la base de datos limpia. En este chunk, vamos a transformar la base de datos limpia y seleccionada a la base de datos final, que usaremos a lo largo de este código para nuestro modelo.
eav2024_final <- eav2024_selected_clean
head(eav2024_final)
## # A tibble: 6 × 36
## sexo municipio estudia_actualmente Edad nivel_max_estudios tipo_escuela
## <chr> <fct> <chr> <dbl> <chr> <chr>
## 1 Mujer Cadereyta Ji… no 50 primaria <NA>
## 2 Hombre Cadereyta Ji… no 35 secundaria <NA>
## 3 Mujer Cadereyta Ji… no 32 secundaria <NA>
## 4 Hombre Cadereyta Ji… no 62 secundaria <NA>
## 5 Hombre Cadereyta Ji… no 80 primaria <NA>
## 6 Mujer General Esco… no 51 secundaria <NA>
## # ℹ 30 more variables: conexion_internet <chr>, total_ingreso_hogar <chr>,
## # total_mensual_hogar <chr>, problema_des_social <chr>, seguiridad <chr>,
## # presencia_policias <chr>, voto_elecciones <chr>, aprueba_usorecursos <chr>,
## # eficiencia_alcalde <chr>, aprueba_alcalde <chr>, conoce_diputado <chr>,
## # percepcion_influencia <chr>, nivel_influencia <dbl>, aprobacion_amlo <chr>,
## # percepcion_sheimbaum <chr>, sit_econ_12meses <chr>,
## # sit_econ_next12meses <chr>, invest_delitos <chr>, desemp_policia <chr>, …
Hay varios tipos de regresiones que podemos utilizar para encontrar una respuesta a nuestra pregunta. En este caso, no sabiamos cual iba a ser la mejor para demostrar el comportamiento que estabamos buscando. Es importante definir que una regresión lineal no es compatible con variables binomiales, es decir, tiene poco poder para predecir comportamientos. Al correr ese primer modelo, nos dimos cuenta que no era el indicado y decidimos tratar con un modelo de regresión logística que si es bueno prediciendo comportamiento como percepción.
# Convertir las variables a numéricas si no lo son
eav2024_final$nivel_max_estudios <- as.numeric(as.factor(eav2024_final$nivel_max_estudios))
eav2024_final$total_mensual_hogar <- as.numeric(as.factor(eav2024_final$total_mensual_hogar))
eav2024_final$nivel_influencia <- as.numeric(eav2024_final$nivel_influencia)
# Crear un subconjunto con las variables necesarias y quitar NAs
modelo_df <- eav2024_final %>%
select(nivel_influencia, nivel_max_estudios, total_mensual_hogar) %>%
na.omit()
# Ajustar modelo de regresión lineal
modelo <- lm(nivel_influencia ~ nivel_max_estudios + total_mensual_hogar, data = modelo_df)
# Ver resumen del modelo
summary(modelo)
##
## Call:
## lm(formula = nivel_influencia ~ nivel_max_estudios + total_mensual_hogar,
## data = modelo_df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -459.4 -271.7 -246.1 -140.0 9764.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -71.560 79.280 -0.903 0.3668
## nivel_max_estudios 11.690 5.282 2.213 0.0269 *
## total_mensual_hogar 26.534 6.386 4.155 3.31e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1401 on 4732 degrees of freedom
## Multiple R-squared: 0.004805, Adjusted R-squared: 0.004384
## F-statistic: 11.42 on 2 and 4732 DF, p-value: 1.125e-05
Al correr este modelo, nos dimos cuenta que no era el ideal para demostrar el comportamiento que estabamos buscando entre nuestras variables. Las regresiones lineales no son tan eficientes en demostrar predicciones de comportamiento como lo hacen las regresiones logísticas. Aun asi decidimos correr el modelo para tener una idea de como iban a variar los valores dependiendo del modelo que se utilice.
library(dplyr)
# Preparar datos
modelo_df <- eav2024_final %>%
select(nivel_influencia,
nivel_max_estudios,
total_mensual_hogar,
sexo) %>%
filter(!is.na(nivel_influencia),
!is.na(nivel_max_estudios),
!is.na(total_mensual_hogar),
!is.na(sexo)) %>%
# Crear variable binaria: 1 = alta percepción de influencia (>= 7), 0 = baja
mutate(influencia_alta = ifelse(nivel_influencia >= 7, 1, 0))
# Ajustar modelo de regresión logística
modelo_logit <- glm(influencia_alta ~ nivel_max_estudios + log(total_mensual_hogar + 1) + sexo,
data = modelo_df,
family = binomial)
# Mostrar resumen del modelo
summary(modelo_logit)
##
## Call:
## glm(formula = influencia_alta ~ nivel_max_estudios + log(total_mensual_hogar +
## 1) + sexo, family = binomial, data = modelo_df)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.43649 0.54213 -10.028 < 2e-16 ***
## nivel_max_estudios 0.06387 0.02877 2.220 0.02642 *
## log(total_mensual_hogar + 1) 0.57580 0.18733 3.074 0.00211 **
## sexoMujer -0.26358 0.18644 -1.414 0.15745
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1119.0 on 4734 degrees of freedom
## Residual deviance: 1100.6 on 4731 degrees of freedom
## AIC: 1108.6
##
## Number of Fisher Scoring iterations: 7
exp(coef(modelo_logit))
## (Intercept) nivel_max_estudios
## 0.004354753 1.065957846
## log(total_mensual_hogar + 1) sexoMujer
## 1.778544656 0.768299844
Cuando corrimos este modelo, los valores reflejaron claramente que era la mejor alternativa para encontrar la predicción que estabamos buscando. Las regresiones logisticas son compatibles con las variables binomiales, como lo es nuestra variable dependiente (nivel de influencia). La regresión muestra un valor p que nos indica que si existe una correlación entre nivel socioeconómico y percepción de influencia. Este es el hallazgo mas importante en este punto de nustra investigación.
| Elemento | Hallazgo_Descripción | Acción_tomada | Justificación |
|---|---|---|---|
| Variables de Educación | Se detectaron muchos valores faltantes (N/A) en distintas variables relacionadas con el nivel educativo. | Se eliminaron las variables con demasiados datos faltantes y se sustituyeron por otras más completas y representativas. | El nivel educativo es clave en la investigación, así que fue necesario contar con datos sólidos. Al usar variables más completas, se asegura una mejor medición de su influencia en la participación y opinión. |
| Variables Socioeconómicas | Se identificaron variables con buena calidad de datos y distribución representativa entre niveles. | Se agregaron al análisis para complementar la dimensión educativa. | El nivel socioeconómico es el otro gran eje de análisis. Incluir estas variables permite observar cómo se relaciona con la participación ciudadana y percepción pública con los ingresos de los ciudadanos. |
| Percepción de seguridad y entorno | Se encontraron variables relacionadas con la percepción del entorno y seguridad que aportan contexto. | Se agregaron al análisis como variables complementarias. | La percepción de seguridad, en conjunto con el nivel educativo y socioeconómico, condiciona cómo las personas se informan, opinan y participan. Queremos ver si quienes viven en contextos inseguros o con menor acceso a educación y recursos suelen mostrar menor confianza en las instituciones y menor participación ciudadana. |
| Percepción política | Existen variables que reflejan la percepción de las personas hacia la política y hacia los gobernantes. | Se incluyeron en el análisis | Son directamente relevantes para medir la percepción pública, que es uno de los componentes centrales de la pregunta de investigación.Queremos ver que tan involucrados se sienten en procesos democráticos |
| Regresiones | Este es el hallazgo mas importante. El modelo demuestra una correlación entre ingreso y percepción. | Se tuvo que decartar la regresión lineal por una logística | No sabíamos que modelo nos iba a funcionar mejor, por eso corrimos ambos modelos y al analizar los valores decidimos que la regresión logística representaba los resultados que esperabamos de manera mas eficiente. |
| Cambios, imputaciones, variables nuevas | Tuvimos la necesidad de crear la variable de influencia alta para ver si existía correlación. No imputamos ningun dato y los únicos cambios que hicimos fueron los de cambiarle el nombre a las variables en la base de datos original. | Cambiamos todos los nombres de las variables a unos que entendieramos mejor. | El problema con la base original era que no era tan legible sin el diccionario, por eso cambiamos todos los nombres en la limpieza. No fue necesario imputar nada ya que los datos que habiamos elegido contaban con menos de 40% de N/A, entonces no nos afectaba en la investigación. |
Al correr nuestro modelo por primera vez, encontramos que el nivel socioeconomico si tiene gran influencia en la creencia que hay mas incidencia en la toma de decisiones y procesos publicos. Entre mas alto el nivel, mas percepcion de participacion hay. Este es un hallazgo importante ya que nos demuestra que la correlación que estamos buscando si existe. Como nuestro p-value es menor a 0.05, solo en la variable de ingreso, demuestra que el ingreso si tiene gran influencia en la participacion ciudadana. Como próximos pasos deberíamos de utilizar otras variables en nuestro modelo tomando en cuenta las limitaciones de usar variables binomiales.
Fue sorprendente ver como el nivel económico (ingreso) tiene mas influencia en la percepción de participación que otras variables como educación. Al comenzar nuestra investigación, teniamos una idea diferente de como iban a reaccionar las variables. Es gratificante ver que si existe una relación en el comportamiento que estamos investigando. A partir de estos resultados, cambia nuestra idea de que la educación era la variable que mas influye en percepción y participación politica. Esto nos va a ayudar a ajustar los resultados ya que no van a tener un enfoque tan pesado en educación como no es la variable que predomina. Lo que encontramos en esta primera parte de la investigación marca los siguientes pasos de nuestra investigación.
Segmentación territorial, para ver si la relación entre nivel socioeconómico y participación varía entre zonas urbanas y rurales o entre municipios. Dónde es que menos participan.
Evidencia clara de que las desigualdades económicas están limitando la participación ciudadana efectiva en Nuevo León.
Identificación de los perfiles más desconectados de la toma de decisiones públicas
Con estos tres pasos aseguramos un camino sólido hacia el mejoramiento de nuestros modelos y por ende, resultados.