0.1 Introducción

En este documento se analizará el actual plan de gobierno del partido político Avanza País en el período 2021 - 2026. Comenzaremos estableciendo las frecuencias del vocabulario empleado en la data, así como el sentimientos e intenciones con la que ha sido descrito. Para fines prácticos, nuestro análisis será considerando las 10 palabras con mayor frecunecia desde de nuestros resultados. Esta información es recogida íntegramente desde la plataforma electoral del JNE (descarga desde aquí).

0.2 Objetivos

Nuestro análisis es con el fin de brindar al elector un entendimiento más profundo del plan de gobierno Avanza País, de esta manera se podrá apelar a un reconocimiento mas interiorizado de los objetivos, metas y promezas con las que está redactado este documento.

  • Encontrar las palabras más empleadas durante la redacción.

  • Identificar la intención del partido político al plantear su plan de gobierno.

  • Demostrar completa imparcialidad durante el análisis y reconocimiento del mismo.

0.3 Análsis del Plan de Gobierto - Avanza País

# I. Lectura de Datos
discurso <- pdf_text("Plan de Gobierno - Avanza País.pdf")
# II. Construcción y Limpieza de la data
discurso <- paste(discurso, collapse = " ")
discurso <- tibble(discurso) %>% unnest_tokens(Token,discurso)

discurso_1 <- discurso %>% mutate(Token = removeNumbers(Token))

stop_words_1 <- read_xlsx("CustomStopWords.xlsx")
stop_words_1 <- stop_words_1 %>% rename(Token = Palabra)
stop_words_2 <- tibble(Token= c(""), Fuente = "Mis StopWords")

stopwords <- rbind(stop_words_1, stop_words_2)                                      
stopwords <- stopwords[!duplicated(stopwords$Token),]

discurso_2 <- discurso_1 %>% anti_join(stopwords)
discurso_2 <- discurso_2 %>%
              mutate(Token = case_when(
              str_detect(Token, "país") ~ "perú",
              TRUE ~ Token))

0.3.1 Frecuencias del vocabulario empleado

# III. Top 10 - Frecuencias
Discurso_frecuencia <- discurso_2 %>% count(Token, sort = TRUE) %>% top_n(12)
tabla0 <- flextable(Discurso_frecuencia)
Top_frecuencias <- add_header_lines(tabla0, values = "Top 12 de las palabras empleadas") %>%
  bold(part = "header") %>% 
  align(align = "center", part = "header")
Top_frecuencias 
# IV. Gráfico de Barras
Barras_frecuencias <- Discurso_frecuencia %>%
  ggplot() + aes(y = fct_reorder(Token, n),
                x = n, fill=Token) + geom_col(fill ="darkred") +
  labs(title = "Top 12 de las palabras empleadas", x = "Frecuencia", 
       y = NULL) +
  theme_gdocs() + 
  geom_text(aes(label = n), colour ="white", hjust = 1.25, size = 4.0)
Barras_frecuencias

# V. WordCloud - Nube de Palabras
Cantidad <- discurso_2 %>% count(Token, sort = TRUE)
Nube_freciencias <- wordcloud2(Cantidad, size = 0.8, color = "random-light", backgroundColor = "black")
Nube_freciencias

0.3.2 Frecuencias de sentimientos

# VI. Análisis de Sentimientos
sentimientos <- read.delim("sentimientos_2.txt")
sentimientos_discurso <- discurso_2 %>% 
  inner_join(sentimientos, by = c("Token" = "palabra"))

Gráfica_sentimientos <- sentimientos_discurso %>% 
  count(sentimiento) %>% 
  ggplot() + aes(x = fct_reorder(sentimiento,n),
                 y = n,
                 fill = sentimiento) + 
  geom_col(show.legend = F) + coord_flip() +
  labs(title ="Análisis de sentimientos del plan de Gobierno - AVANZA PAIS",
       subtitle = "Período 2021 - 2026",
       x = "Sentimientos",
       y = "Frecuencia") +
  theme_avatar() +
  geom_text(aes(label = n), colour ="white", hjust = 1.25, size = 4.0)
Gráfica_sentimientos

# VII. Porcentaje de Sentimientos
Pcntj_Sentimientos <- sentimientos_discurso %>% 
  count(sentimiento) %>% 
  mutate(Pntj_Sent = round(n/sum(n)*100)) %>% 
  arrange(-Pntj_Sent)

Gráfica_Pcntj_Sentimientos <- ggplot(Pcntj_Sentimientos, aes(x = "", 
                                                          y = Pntj_Sent, fill=sentimiento)) +
  geom_bar(stat = "identity", color = "white") +
  geom_text(color = "white", aes(label = paste0(round(Pntj_Sent),"%")),
            position = position_stack(vjust = 0.5), size = 3.5) +
  coord_polar(theta = "y") +
  theme_void() +
  labs(title = "Sentimientos - Avanza País", fill = "")
Gráfica_Pcntj_Sentimientos

Cantidad_sentimientos <- discurso_2 %>% 
  inner_join(sentimientos, by = c("Token"="palabra")) %>% 
  count(Token, sentimiento) %>% group_by(sentimiento) %>% arrange(-n) %>% 
  top_n(4,n)

Comparación_emociones <- ggplot(Cantidad_sentimientos) +
  aes(n, fct_reorder(Token,n), fill = sentimiento) +
  geom_col(show.legend = FALSE) +
  facet_wrap( ~ sentimiento, scales= "free") +
  labs(title= "Comparación de Emociones",
       x="Frecuencia" , y="Palabra") + 
  theme_tufte()
Comparación_emociones

0.4 Conclusiones

Fue fundamental la estrategia que usamos al recopilar la data en palabras claves, una forma de sintetizar lo que el plan de gobierno de AVANZA PAÍS quiere trasmitir al ciudadano a pie. Antes de iniciar el presente análisis hicimos un punto aparte y consideramos lo siguiente: Las palabras País y Perú han sido fusionadas en la palabra PERÚ en un mismo conteo debido a que una hace referencia directamente a la otra y viceversa. Esta fusión no afecta la idea que cada palabra tiene respecto al documento sino más bien refiere a lo mismo. Como era de esperarse la palabra PERU es la más mencionada en nuestro análisis y no era para menos pues al tener como objetivo convencer a nivel nacional (nacional se ubica en tercera posición, aludiendo al patriotismo característico que se usan en campañas electorales) que AVANZA PAIS es la solución a los problemas que hoy aquejan el estado peruano. Las palabras vienen en consecuencia a ello. De la misma menera una palabra también bastante empleada por el partido es “Social”, la cual hace referencia al partido de Integración Social, así como también a la ética con la que se manejan, que es un principio del partido. Hace hincapié en la dimensión que abarca las otras palabras encontradas en este análisis, tales como salud educación, justicia o seguridad ciudadana. Sin duda la palabra Social es una palabra que engloba otras palabras claves halladas. Otras palabras resaltantes es infraestructura e inversión, efectivamente; el análisis a este plan de gobierno arroja palabras como gasto, promover, creación, recursos, palabras que tienen menor protagonismo pero que en la gráfica de nube de palabras salen de menor tamaño a diferencia de las primeras mencionadas.