RETO CIENCIA DE DATOS

Problemática

La confianza de los habitantes del Área Metropolitana de Monterrey (AMM) en los diferentes niveles de gobierno, dependiendo de diferentes factores sociodemográficos y geográficos.

Pregunta de Investigación

*** Nuestra pregunta de investigación la modificamos para asegurar que el modelo que obtengamos no se obstruya con demasiadas variables, por ejemplo, quitamos a la seguridad como un factor de las características sociodemográficas para analizar. También, reducimos el análisis a los gobiernos municipal y estatal únicamente, pues consideramos que esta base de datos específica no cuenta con suficiente información sobre el nivel federal en cuanto a nuestra temática, la cual se enfoca en el nivel de confianza.

¿Cómo se relaciona el nivel de confianza que tienen los habitantes del Área Metropolitana de Monterrey (AMM) en los gobiernos municipal y estatal con sus características sociodemográficas y geográficas?

Variables

*** Dados los cambios en la pregunta de investigación, se cambiaron algunas de las variables que se habían seleccionado, para garantizar que las seleccionadas se enfoquen en la nueva pregunta. Las dividimos en dos grupos:

Sobre confianza y corrupción:

  1. p117 – ¿Cuál es el medio por el que más se entera de los temas de interés público y todo lo relacionado con gobierno?
  2. p120 – ¿Votó en las pasadas elecciones?
  3. p123 – ¿El gobernador o su equipo influyeron en campañas para favorecer a algún candidato?
  4. p124 – ¿El alcalde/alcaldesa o su equipo influyeron en campañas para favorecer a algún candidato?
  5. p125 – ¿Considera que el gobierno del alcalde o alcaldesa hizo un buen uso de los recursos públicos?
  6. p126 – ¿Considera que el gobierno de Samuel García ha hecho un buen uso de los recursos públicos?
  7. p127 – En su opinión, en el estado de Nuevo León, la corrupción es una práctica: muy frecuente, frecuente, poco frecuente o no ocurre.
  8. p128 – En su opinión, en su municipio, la corrupción es una práctica: muy frecuente, frecuente, poco frecuente o no ocurre.
  9. p129 – ¿Usted o algún conocido experimentó un acto de corrupción en contacto con autoridades en los últimos 12 meses?
  10. p131_1 – ¿El alcalde(a) de su municipio fue un gobernante honesto(a)?
  11. p132_2 – ¿El alcalde(a) fue capaz de resolver los problemas del municipio?
  12. p139 – ¿Cómo fue el gobierno del alcalde(a)? (mejor de lo esperado, igual, peor)
  13. p140_1 – ¿Samuel García es un gobernante honesto?
  14. p141_2 – ¿Es capaz de resolver los problemas del Estado?
  15. p142_3 – ¿Cuenta con un equipo capacitado?
  16. p143_4 – ¿Ha cumplido con sus promesas de campaña?
  17. p143_5 – ¿Tiene capacidad para generar acuerdos con diferentes actores?
  18. p144 – ¿Samuel García toma decisiones pensando en el bienestar del Estado o intereses propios?
  19. p145 – ¿Cómo ha sido el gobierno de Samuel García? (mejor de lo esperado, igual, peor)
  20. p153 – ¿Los diputados locales son honestos?
  21. p154 – ¿Aprueba o desaprueba el trabajo del Congreso local?
  22. p155 – ¿Cuánto pueden influir los ciudadanos en decisiones del gobierno estatal?
  23. p156 – ¿Cuánto pueden influir los ciudadanos en decisiones del gobierno municipal?
  24. num_acciones_participacion_ciudadana – Número total de acciones de participación realizadas
  25. p161 – ¿Cuál es el principal problema para confiar en el gobierno?
  26. p162 – ¿En qué ámbito está el principal problema del estado?
  27. p163 – ¿Qué le hace sentirse más orgulloso(a) de Nuevo León?

Sociodemográficos: 28. p164 – ¿Cuál es el ingreso mensual total del hogar? 29. nom_mun_mv - Nombre del municipio donde se realizó la encuesta. 30. mun_amm_y_periferia - Clasificación municipal que mantiene los códigos originales para municipios del Área Metropolitana de Monterrey (AMM), mientras agrupa el resto en dos categorías: conjunto de municipios de la Periferia y el Resto de municipios de Nuevo León no incluidos en AMM ni Periferia. 31. cp4_1 - Se debe aplicar factor de expansión cuando se analiza de forma individual, ya que representa una muestra de la población. Sin embargo, cuando se combinan todas las variables relacionadas con la edad (en años) de los integrantes del hogar (cp4_1, cp4_2, cp4_3, etc.) en un análisis a nivel de personas (estructura ‘long’ o datos apilados), no se debe aplicar el factor de expansión, pues en este caso se está analizando la composición interna de los hogares y no realizando inferencias poblacionales. 33. sexo_num - Código numérico del sexo de la persona encuestada. Variable generada a partir de la pregunta de sexo (cp2_1). 34. genero_num - Código numérico del género con el que se identifica la persona encuestada. Variable generada a partir de la pregunta de género (cp3_1). 35. Factor_CVNL - Factor de expansión que permite generalizar los resultados de la muestra a la población objetivo. Representa el número de unidades en la población que cada unidad muestral representa. Debe aplicarse en análisis estadísticos para obtener estimaciones poblacionales insesgadas. 36. cp7_1 - ¿Estudias actualmente? 37. cp8_1 - ¿Cuál es el nivel máximo de estudios terminado? (Solo para quienes respondieron que no estudian actualmente) 38. cp9_1 - ¿Cuál es el nivel máximo de estudios actualmente cursando? (Solo para quienes respondieron que sí estudian actualmente)

Justificación de las variables:

Las variables concentran puntos interesantes al evaluar él desempeño de cada sector del gobierno, bajo la opinión de los ciudadanos de Nuevo León, haciendo énfasis en medios de información y redes sociales, percepción del uso de recursos públicos, expectativas sobre el gobierno, capacidad de influencia ciudadana y participación ciudadana. Adicionalmente, varias preguntas cuestionan la respuesta del ciudadano bajo criterios de su nivel de educación, estatus socioeconómico y geográfica; hace que el estudio construya un ámbito de evaluar que tipo de persona evalúa al gobierno y con qué vivencias su opinión está correlacionada con los informes que hace gobierno Estas variables son fundamentales para obtener un panorama completo de los elementos que afectan al nivel de confianza ciudadana, y para identificar áreas de mejora en la comunicación, la transparencia y la participación en la gestión pública.

Limpieza de la base de datos de la Encuesta Cómo Vamos Nuevo León

library(readr)
library(survey)
## Loading required package: grid
## Loading required package: Matrix
## Loading required package: survival
## 
## Attaching package: 'survey'
## The following object is masked from 'package:graphics':
## 
##     dotchart
library(survival)
library(Matrix)
library(grid)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Lectura de la base de datos

eav2024 <- read_csv("~/Documents/Clase Ciencia de datos/eav2024.csv")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)
## Rows: 4942 Columns: 491
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr  (15): nom_mun_mv, nom_loc_mv, ageb_mv, colonia, rangos_edad, cp4_2_dumm...
## dbl (432): num_mun, mun_amm_y_periferia, sexo_num, genero_num, mza_mv, cp1, ...
## lgl  (44): cp13_1, cp17_1_1, cp4_1_2, cp13_6, cp4_1_7, cp9_8, cp10_8, cp11_8...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Selección de variables

variables <- c("p117", "p120", "p123", "p124", "p125", "p126", "p127", "p128", "p129", "p131_1", "p132_2", "p139", "p140_1", "p141_2", "p142_3", "p143_4", "p143_5", "p144", "p145", "p153", "p154", "p155", "p156", "num_acciones_participacion_ciudadana", "p161", "p162", "p163", "p164", "nom_mun_mv", "mun_amm_y_periferia", "cp4_1", "sexo_num", "Factor_CVNL", "cp7_1", "cp8_1", "cp9_1")

eav2024_selected <- eav2024[, variables]

Selección de datos de AMM

amm <- subset(eav2024_selected, nom_mun_mv %in% c("San Nicolás de los Garza", "Guadalupe", "Apodaca", "San Pedro Garza García", "Santa Catarina", "General Escobedo", "Juárez", "García", "Santiago", "Pesquería", "Cadereyta Jiménez", "Monterrey"))

Eliminación de datos 9999

Observar cantidad de 8888 y 9999

# TOTAL DE OBSERVACIONES EN AMM ES 3990
m=sapply(amm, function(col) sum(col== 8888, na.rm = TRUE))
total1 <- sum(m)
total1
## [1] 3523
m2=sapply(amm, function(col) sum(col== 9999, na.rm = TRUE))
total2 <- sum(m2)
total2
## [1] 568
numericas <- c("p117", "p120", "p123", "p124", "p125", "p126", "p127", "p128", "p129", "p131_1", "p132_2", "p139", "p140_1", "p141_2", "p142_3", "p143_4", "p143_5", "p144", "p145", "p153", "p154", "p155", "p156","p161", "p162","p163","p164")
fillas_99<- apply(amm[, numericas],1, function(row) any(row==9999))
eav2024_limpio <- amm[!fillas_99,]

Transformación de variables categóricas a factor

eav2024_categoricas <- eav2024_limpio  %>%
  mutate(
    sexo = case_when(
      sexo_num == 0 ~ "Hombre",
      sexo_num == 1 ~ "Mujer"
    ),
    sexo = as.factor(sexo),
    Municipio = as.factor(nom_mun_mv),
    edad = as.factor(cp4_1)
  ) %>%
  mutate(across(
    .cols = c(
      p120, p123, p124, p126,p125, p126,p129,p131_1, p132_2,p140_1,p142_3,p143_4,p143_5,p153,cp7_1
    ),
    .fns = as.factor
  )) %>%
  select(-sexo_num, -nom_mun_mv,-cp4_1)

Renombración de variables

eav2024_renombre <- eav2024_categoricas %>%
  rename(
    fuente_info = p117,
    voto_pasado = p120,
    gob_apoyo_campaña = p123,
    alcalde_apoyo_campaña = p124,
    alcalde_uso_recursos = p125,
    gob_uso_recursos = p126,
    transparencia_estado = p127,
    transparencia_municipio = p128,
    experiencia_corrupcion = p129,
    alcalde_honesto = p131_1,
    alcalde_capaz = p132_2,
    ineficiencia_gobierno_alcalde = p139,
    samuel_honesto = p140_1,
    samuel_capaz = p141_2,
    samuel_equipo = p142_3,
    samuel_promesas = p143_4,
    samuel_acuerdos = p143_5,
    samuel_motivos = p144,
    ineficiencia_gobierno_samuel = p145,
    diputados_honestos = p153,
    aprueba_congreso = p154,
    percep_no_influencia_ciud_est = p155,
    percep_no_influencia_ciud_mun = p156,
    acciones_participacion = num_acciones_participacion_ciudadana,
    problema_confianza = p161,
    ambito_problema = p162,
    orgullo_nl = p163,
    ingreso_hogar = p164,
    zona_geografica = mun_amm_y_periferia,
    factor_expansion = Factor_CVNL,
    estudia_actualmente = cp7_1,
    nivel_educativo_max = cp8_1,
    nivel_educativo_actual = cp9_1,
  )

Creación de variable educación

niveles_educativos <- c(
  "Ninguno", "Preescolar", "Primaria", "Secundaria",
  "Preparatoria o bachillerato general", "Bachillerato tecnológico",
  "Técnicos con primaria", "Técnicos con secundaria",
  "Técnicos con preparatoria", "Normal con primaria o secundaria",
  "Normal de licenciatura", "Licenciatura",
  "Especialidad", "Maestría", "Doctorado", "No sabe"
)

eav2024_edu <- eav2024_renombre %>%
  mutate(
    nivel_educativo = case_when(
      estudia_actualmente == 1 ~ nivel_educativo_actual,
      estudia_actualmente == 0 ~ nivel_educativo_max,
      TRUE ~ 8888  
    ),
    nivel_educativo = factor(nivel_educativo,
                             levels = c(0:14, 8888),
                             labels = niveles_educativos)
  )

Convertirla a numérica

eav2024_educacion1 <- eav2024_edu %>%
  mutate(
    nivel_educativo = case_when(
      estudia_actualmente == 1 ~ nivel_educativo_actual,
      estudia_actualmente == 0 ~ nivel_educativo_max,
      TRUE ~ 8888
    )) %>%
  select(-estudia_actualmente, -nivel_educativo_max,-nivel_educativo_actual)

Debido a que solo una fila cuenta con NA, se decidió eliminar esta fila.

Eliminar NA

eav2024_educacion <- na.omit(eav2024_educacion1)

Creación de variable independiente para modelo

Se decide crear la variable nivel_confianza como dependiente basándose en la percepción de transparencia a nivel municipal y estatal, haciendo los promedios de ambas mediciones.

Convertir 8888 a NA

eav2024_na <- eav2024_educacion %>%
  mutate(
    transparencia_estado = ifelse(transparencia_estado == 8888, NA, transparencia_estado),
    transparencia_municipio = ifelse(transparencia_municipio == 8888, NA, transparencia_municipio)
  )

Crear variable

eav2024_semifinal <- eav2024_na %>%
  mutate(
    nivel_confianza = rowMeans(select(., transparencia_estado, transparencia_municipio), na.rm = TRUE)
  )

Imputación de variables si es necesario

Observar cantidad de NA

sum(is.na(eav2024_semifinal))
## [1] 530
colSums(is.na(eav2024_semifinal))
##                   fuente_info                   voto_pasado 
##                             0                             0 
##             gob_apoyo_campaña         alcalde_apoyo_campaña 
##                             0                             0 
##          alcalde_uso_recursos              gob_uso_recursos 
##                             0                             0 
##          transparencia_estado       transparencia_municipio 
##                           180                           179 
##        experiencia_corrupcion               alcalde_honesto 
##                             0                             0 
##                 alcalde_capaz ineficiencia_gobierno_alcalde 
##                             0                             0 
##                samuel_honesto                  samuel_capaz 
##                             0                             0 
##                 samuel_equipo               samuel_promesas 
##                             0                             0 
##               samuel_acuerdos                samuel_motivos 
##                             0                             0 
##  ineficiencia_gobierno_samuel            diputados_honestos 
##                             0                             0 
##              aprueba_congreso percep_no_influencia_ciud_est 
##                             0                             0 
## percep_no_influencia_ciud_mun        acciones_participacion 
##                             0                             0 
##            problema_confianza               ambito_problema 
##                             0                             0 
##                    orgullo_nl                 ingreso_hogar 
##                             0                             0 
##               zona_geografica              factor_expansion 
##                             0                             0 
##                          sexo                     Municipio 
##                             0                             0 
##                          edad               nivel_educativo 
##                             0                             0 
##               nivel_confianza 
##                           171
eav2024_semifinal[!complete.cases(eav2024_semifinal), ]
## # A tibble: 188 × 35
##    fuente_info voto_pasado gob_apoyo_campaña alcalde_apoyo_campaña
##          <dbl> <fct>       <fct>             <fct>                
##  1           3 1           0                 0                    
##  2           1 1           8888              8888                 
##  3           1 1           0                 0                    
##  4           3 0           0                 0                    
##  5           1 1           0                 0                    
##  6           3 1           1                 0                    
##  7           1 1           0                 0                    
##  8           2 1           0                 0                    
##  9           1 1           8888              8888                 
## 10           1 1           8888              0                    
## # ℹ 178 more rows
## # ℹ 31 more variables: alcalde_uso_recursos <fct>, gob_uso_recursos <fct>,
## #   transparencia_estado <dbl>, transparencia_municipio <dbl>,
## #   experiencia_corrupcion <fct>, alcalde_honesto <fct>, alcalde_capaz <fct>,
## #   ineficiencia_gobierno_alcalde <dbl>, samuel_honesto <fct>,
## #   samuel_capaz <dbl>, samuel_equipo <fct>, samuel_promesas <fct>,
## #   samuel_acuerdos <fct>, samuel_motivos <dbl>, …

Las 3 Variables con NAs ahora van a ser imputadas.

Imputación de variable nivel_confianza

library(mice)
## 
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
## 
##     filter
## The following objects are masked from 'package:base':
## 
##     cbind, rbind
vars_imputacion <- eav2024_semifinal %>%
  select(transparencia_estado, transparencia_municipio, nivel_confianza,
         sexo, edad, Municipio, nivel_educativo, ingreso_hogar)

vars_imputacion$sexo <- as.factor(vars_imputacion$sexo)
vars_imputacion$Municipio <- as.factor(vars_imputacion$Municipio)
vars_imputacion$nivel_educativo <- as.numeric(vars_imputacion$nivel_educativo)  

vars_imputacion$ingreso_hogar <- as.numeric(vars_imputacion$ingreso_hogar)      

imputacion <- mice(vars_imputacion, m = 1, method = "pmm", seed = 123)
## 
##  iter imp variable
##   1   1  transparencia_estado  transparencia_municipio  nivel_confianza
##   2   1  transparencia_estado  transparencia_municipio  nivel_confianza
##   3   1  transparencia_estado  transparencia_municipio  nivel_confianza
##   4   1  transparencia_estado  transparencia_municipio  nivel_confianza
##   5   1  transparencia_estado  transparencia_municipio  nivel_confianza
datos_imputados <- complete(imputacion)

eav2024_semifinal$transparencia_estado     <- datos_imputados$transparencia_estado
eav2024_semifinal$transparencia_municipio <- datos_imputados$transparencia_municipio
eav2024_semifinal$nivel_confianza         <- datos_imputados$nivel_confianza

Verificación de Na

sum(is.na(eav2024_semifinal))
## [1] 0

Base de datos final

eav2024_final <- eav2024_semifinal
head(eav2024_final)
## # A tibble: 6 × 35
##   fuente_info voto_pasado gob_apoyo_campaña alcalde_apoyo_campaña
##         <dbl> <fct>       <fct>             <fct>                
## 1           3 1           0                 0                    
## 2           3 1           0                 0                    
## 3           1 1           0                 0                    
## 4           3 1           0                 0                    
## 5           2 1           1                 1                    
## 6           3 1           0                 0                    
## # ℹ 31 more variables: alcalde_uso_recursos <fct>, gob_uso_recursos <fct>,
## #   transparencia_estado <dbl>, transparencia_municipio <dbl>,
## #   experiencia_corrupcion <fct>, alcalde_honesto <fct>, alcalde_capaz <fct>,
## #   ineficiencia_gobierno_alcalde <dbl>, samuel_honesto <fct>,
## #   samuel_capaz <dbl>, samuel_equipo <fct>, samuel_promesas <fct>,
## #   samuel_acuerdos <fct>, samuel_motivos <dbl>,
## #   ineficiencia_gobierno_samuel <dbl>, diputados_honestos <fct>, …

Tabla Resumen

Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
fuente_info La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. La variable es categórica y cuenta con 10 opciones de respuesta, más 8888 y 9999. Se eliminaron los 9999 (No contestó) porque la cantidad no era significativa. La variable se convirtió a categórica con as.factor, y se mantuvo 8888 (No sabe) porque esta proporciona información sobre el interés de la ciudadanía. Contribuye a explicar porque ciertos grupos tienen más o menos confianza en el gobierno, dependiendo de cómo acceden a la información.
voto_pasado La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se limitó a tres factores de respuesta, sí, no y 8888. Se convirtió a categórica con as.factor. Buscamos conocer si la confianza institucional se puede traducir a una acción política real. Donde el ciudadano sale a ejercer su voto a partir de la confianza que le está depositando al alcalde, gobernador o diputado.
gob_apoyo_campaña La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se dejó el 8888 porque el que no sepan también cuenta como que tan informados están, mientras que el 9999 lo podemos quitar ya que se refiere a “no contestó”. Se convirtió a categórica con as.factor. Conocer cómo las percepciones de abuso de poder afectan la confianza ciudadana.
alcalde_apoyo_campaña La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se dejó el 8888 pero se quitó el 9999. Se convirtió a categórica con as.factor. Tocar el tema de la imparcialidad, para explicar por qué ciertos sectores de la población confían menos en sus autoridades.
alcalde_uso_recursos La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó el 9999, y se dejó el 8888 ya que habla de desinformación. Se convirtió a categórica con as.factor. Hacer conexiones claras con la percepción de corrupción, eficiencia y justicia distributiva.
Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
gob_uso_recurso La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó el 9999, y se dejó el 8888 para temas de desinformación. Se convirtió a categórica con as.factor. Ver un panorama más amplio del nivel de confianza que existe en el actual gobierno.
transparencia_estado Es una variable categórica con 6 respuestas incluyendo a 8888 y 9999. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa.Las respuestas hablan de muy frecuente, frecuente, poco frecuente y no ocurre (tienen un orden). Se quitó el 9999, y se dejó el 8888 para temas de desinformación. Se dejó a la variable como numérica pues las respuestas pueden tratarse como niveles de percepción ciudadana de transparencia. La variable se renombró pues la pregunta original era en cuanto a temas de corrupción, pero el orden de las respuestas impidió que se tomara como tal. Explica actitudes negativas hacia el gobierno, con esta variable buscamos conocer cómo la percepción de la corrupción influye en el nivel de confianza de la ciudadanía.
transparencia_municipio Es una variable categórica con 6 respuestas incluyendo a 8888 y 9999. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa.Las respuestas hablan de muy frecuente, frecuente, poco frecuente y no ocurre (tienen un orden). Se quitó el 9999, y se dejó el 8888 para temas de desinformación. Se dejó a la variable como numérica pues las respuestas pueden tratarse como niveles de percepción ciudadana de transparencia. La variable se renombró pues la pregunta original era en cuanto a temas de corrupción, pero el orden de las respuestas impidió que se tomará como tal. Entender una de las causas más relevantes de la desconfianza en el gobierno. Además, de poder conectar las percepciones individuales con los contextos locales y sociodemográficos del AMM.
experiencia_corrupcion La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. El 9999 fue retirado de la variable, ya que al ser de percepción no hay una respuesta certera. Se convirtió a categórica con as.factor. Se relaciona con las variables sociodemográficas y geográficas para poder detectar patrones de vulnerabilidad o corrupción.
alcalde_honesto La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó el 9999, y se dejó el 8888, habla de desinformación. Se convirtió a categórica con as.factor. Ver la percepción de las personas hacia las instituciones políticas locales.
Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
———- ————————- —————- ——————————————-
alcalde_capaz La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó el 9999, y se dejó el 8888, habla de desinformación. Se convirtió a categórica con as.factor. Esta variable actúa como un reflejo de la eficacia percibida del gobierno, y puede ayudar a explicar diferencias en la confianza según características sociodemográficas y geográficas de los habitantes del AMM.
ineficiencia_gobierno_alcalde La variable es categórica. Las opciones de respuesta son 6, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Las opciones tienen un orden y por tanto se pueden tratar por niveles como numérica. Se deja a la variable como numérica, se eliminan los 9999 porque no son significativos y se dejan los 8888. Conocer mejor las diferencias entre municipios o grupos sociales dentro del AMM.
samuel_honesto La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó el 9999, esta pregunta es meramente de percepción.Se convirtió a categórica con as.factor. Nos va ayudar a poder segmentar por percepciones ciudadanas y conocer si hay una relación en torno a características sociodemográficas y geográficas.
samuel_capaz La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó el 9999, realmente se cierra mucho la pregunta ya que si si o no, depende de cada los ojos de cada persona. Se convirtió a categórica con as.factor. Poder detectar percepciones de eficacia y poder medir la confianza que existe hacia el gobierno.
samuel_equipo La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó los 9999 pero dejamos los 8888, aqui si cuenta qué tan informada está la persona sobre el gobierno que tiene samuel para la resolución de problemas, Se convirtió a categórica con as.factor. Conocer la percepción de capacidad y competencia del gobierno, lo cual es un componente fundamental de la confianza institucional.
Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
———- ————————- —————- ——————————————-
samuel_promesas La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Quitamos los 9999, y dejamos 8888, ya que era importante medir qué tantas personas le han dado seguimiento al trabajo que ha realizado estos últimos años. Se convirtió a categórica con as.factor. A partir de esta pregunta se puede construir o erosionar la confianza que le tiene el ciudadano al gobernador.
samuel_acuerdos La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitó los 9999, pero se dejó los 8888, para conocer qué tan informados están acerca del seguimiento de su trabajo. Se convirtió a categórica con as.factor. Medir la percepción sobre la efectividad del gobierno, un factor que influye en la confianza.
samuel_motivos La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se quitaron los 9999 y se dejaron los 8888. Se convirtió a categórtica con as.factor. Mide la percepción de integridad del gobernador, el cual afecta el nivel de confianza hacia el gobierno estatal.
ineficiencia_gobierno_samuel La variable es categórica. Las opciones de respuesta son 6, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Las opciones tienen un orden y por tanto se pueden tratar por niveles como numérica Se deja a la variable como numérica, se eliminan los 9999 porque no son significativos y se dejan los 8888. Evaluación general de desempeño. Se puede ver el nivel de satisfacción y confianza.
diputados_honestos La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Quitamos los 9999, y dejamos los 8888, importante para ver qué tan informados están sobre quienes son sus diputados, hay personas que ni siquiera saben quienes son sus diputados. Se convirtió a categórica con as.factor. Evalúa percepción de corrupción legislativa, con esto la honestidad percibida refuerza o debilita la confianza institucional
Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
———- ————————- —————- ——————————————-
aprueba_congreso La variable es categórica. Las opciones de respuesta son 4, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se convirtió a categórica con as.factor. Se eliminan los 9999 porque no son significativos y se dejan los 8888 porque habla del interés de la ciudadanía en el tema. Medir la aprobación del poder legislativo local.
percep_no_influencia_ciud_est La variable es categórica. Las opciones de respuesta son 6, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Las opciones tienen un orden y por tanto se pueden tratar por niveles como numérica. Se deja a la variable como numérica, se eliminan los 9999 porque no son significativos y se dejan los 8888. Conocer la percepción de participación ciudadana en decisiones, y así conocer si se genera más confianza con gobierno al sentirse escuchados.
percep_no_influencia_ciud_mun La variable es categórica. Las opciones de respuesta son 6, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Las opciones tienen un orden y por tanto se pueden tratar por niveles como numérica. Se deja a la variable como numérica, se eliminan los 9999 porque no son significativos y se dejan los 8888. Conocer la percepción de participación ciudadana en decisiones, y así conocer si se genera más confianza con el municipio al sentirse escuchados.
acciones_participacion Es una variable adicional creada a partir de diversas preguntas del cuestionario, resume el número de acciones de participación ciudadana que realizaron las personas. Es numérica. Se deja a la variable como numérica, se eliminan los 9999 porque no son significativos y se dejan los 8888. Cuantificar la participación real del ciudadano.
problema_confianza Es categórica. Las opciones de respuesta son 8, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se convierte a categórica con as factor. Se eliminan los 9999 y se dejan los 8888 porque habla del interés de la ciudadanía en el tema. Ver las barreras que impiden la confianza
Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
———- ————————- —————- ——————————————-
ambito_problema Es categórica. Las opciones de respuesta son 7, incluyendo 9999. La cantidad de 9999 no era significativa, por lo cual se eliminaron. No tiene 8888. Se convierte a categórica con as factor. Se eliminan los 9999, Delimita áreas (económica, seguridad, corrupción) de preocupación. Ubicar dónde se puede incidir más para recomendar
orgullo_nl Es categórica. Las opciones de respuesta son 16, incluyendo 9999 y 8888. La cantidad de 9999 no era significativa, por lo cual se eliminaron. La cantidad de 8888 sí era significativa. Se convierte a categórica con as factor. Se eliminan los 9999 y se dejan los 8888 porque habla del interés de la ciudadanía en el tema. Poder entender cómo está el tema de percepción con su contexto.
ingreso_hogar Es categórica. Las opciones de respuesta son 13, incluyendo 9999. La cantidad de 9999 no era significativa, por lo cual se eliminaron. No hay 8888. Cada número representa a un rango de salario. Se convierte a categórica con as factor. Se eliminan los 9999. Es una variable socioeconómica clave ya que los ingresos pueden influir en expectativas hacia el gobierno.
zona_geografica La variable tiene códigos numéricos pero es categórica. No hay 8888 ni 9999. Se transforma a categórica con as factor. Lograr georreferenciar respuestas. Necesario para el análisis por municipio dentro del AMM.
factor_expansion Servirá para el análisis de ciertas variables como edad. Es numérica. No tiene 8888 ni 9999. Se mantiene como numérico. Clasificar el entorno urbano o no del encuestado.
Elemento Descripción / Hallazgo Acción tomada Justificación / Relación con la pregunta
———- ————————- —————- ——————————————-
estudia_actualmente Variable categórica qué toa como respuesta el sí o no estudia que respectivamente se concentró que 3804 personas no estudian actualmente De la variable se eliminó cualquier 9999, puesto representaba un porcentaje nulo y no afectará. A su vez, la variable se para la creación de una nueva llamada nivel el_educativo Juventud o adultez puede modificar la percepción gubernamental.
nivel_educativo_max La variable es considerada categórica por tener datos de preescolar hasta doctorada y respectivamente datos 8888. Se encontró que para personas en el área metropolitana el grado de estudios más frecuente fue Licenciatura con 126 Se eliminaron la opción de 9999 porque era insignificante la cantidad de datos. A partir de esta variable se creó una nueva integrando esta y otras más para saber cuál es el estudio que actual y máximo obtuvo la persona llamada nivel_educativo. Conocer la formación educativa para poder asociarla con una actitud cívica.
nivel_educativo_actual La variable es categórica, la cual abarca respuestas de estar en preescolar hasta doctorado, tiende respectivamente 8888 y 9999. La cual se encontró una proporción significativa de personas en el área metropolitana de Monterrey que actualmente están cursando la secundaria con 1312 Se eliminaron la opción de 9999 porque era insignificante la cantidad de datos. A partir de esta variable se creó una nueva integrando esta y otras más para saber cuál es el estudio que actual y máximo obtuvo la persona llamada nivel_educativo Complementa al análisis de jóvenes y su confianza institucional.
nivel_confianza Variable creada. Se transformaron a NA los 8888 de las variables transparencia_estado y transparencia_municipio. A partir de esto se realizó el promedio de ambos valores para cada unidad de observación y se creo la variable numérica nivel_confianza (con rango 1-4). Luego, se imputó con mice los datos marcados NA para estas tres variables, usando como referencia las variables de sexo, edad, Municipio, nivel_educativo e ingreso_hogar. - Se utilizará como variable dependiente para la futura creación de modelos.