#Título: Análisis de la encuesta Así Vamos ##Subtitulo: Limpieza de la base de datos

library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#file.choose("EncuestaAsiVamos2024.csv")
eav2024 <- read_csv("/Users/ecelestino/Desktop/TEC/Carrera/Métodos cuantitativos/CienciaDatosProyecto/EncuestaAsiVamos2024.csv",show_col_types = FALSE )
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)

###Problemática: La insatisfacción ciudadana hacia los alcaldes, derivada de su percepción de mal desempeño en la gestión de servicios públicos generando desconfianza en las instituciones y limita el desarrollo sostenible de los municipios.

####Preguntas de investigación: ¿Depende del nivel socioeconómico al partido o candidato elegido en el municipio? ####¿Cuáles son los factores que influyen en la baja percepción de los alcaldes por parte de los habitantes de Nuevo León y cómo impactan en su desempeño y legitimidad política? ####¿Cómo influye la gestión de los alcaldes en la percepción de los habitantes según la región geográfica y las características demográficas de cada municipio en Nuevo León?

####Variables: Las siguientes variables fueron elegidas bajo el criterio de análisis de las preguntas de investigación. En concreto, seleccionamos aquellas que reflejan el nivel socioeconómico de la gente, así como las variables de municipios, las de educación y la opinión pública basada en una métrica cualitativa donde los número representan un nivel de valoración superior o inferior. - num_mun: Código numérico del municipio donde se realizó la encuesta.

eav2024_selected <- eav2024%>%select(num_mun, nom_mun_mv, nom_loc_mv, rangos_edad, cp4_1, cp7_1, cp8_1, cp9_1, p5_1, p5_2, p75, p164, p117, p118, p120, p122, p123, p124, p125, p126, p127, p128, p129, p131_1, p132_2, p133_3, p133_4, p133_5, p136, p137, p138, p139, p52_1, p52_2, p52_3, p52_4, p52_5, p100, p156)

head(eav2024_selected)
## # A tibble: 6 × 39
##   num_mun nom_mun_mv  nom_loc_mv rangos_edad cp4_1 cp7_1 cp8_1 cp9_1  p5_1  p5_2
##     <dbl> <chr>       <chr>      <chr>       <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1       9 Cadereyta … Cadereyta… 45-54          50     0     2    NA     9     0
## 2       9 Cadereyta … Valle del… 35-44          35     0     3    NA     8     0
## 3       9 Cadereyta … Cadereyta… 25-34          32     0     3    NA    NA    NA
## 4       9 Cadereyta … Cadereyta… 55-64          62     0     3    NA    12     0
## 5       9 Cadereyta … Cadereyta… 75 o más       80     0     2    NA    NA    NA
## 6      21 General Es… Ciudad Ge… 45-54          51     0     3    NA    NA    NA
## # ℹ 29 more variables: p75 <dbl>, p164 <dbl>, p117 <dbl>, p118 <dbl>,
## #   p120 <dbl>, p122 <dbl>, p123 <dbl>, p124 <dbl>, p125 <dbl>, p126 <dbl>,
## #   p127 <dbl>, p128 <dbl>, p129 <dbl>, p131_1 <dbl>, p132_2 <dbl>,
## #   p133_3 <dbl>, p133_4 <dbl>, p133_5 <dbl>, p136 <dbl>, p137 <dbl>,
## #   p138 <dbl>, p139 <dbl>, p52_1 <dbl>, p52_2 <dbl>, p52_3 <dbl>, p52_4 <dbl>,
## #   p52_5 <dbl>, p100 <dbl>, p156 <dbl>