En este documento se analizará el actual plan de gobierno del partido político Avanza País para el período 2021 - 2026. Comenzaremos estableciendo las frecuencias del vocabulario empleado en la data, así como el sentimientos e intenciones con la que ha sido descrito. Para fines prácticos, nuestro análisis será considerando las 12 palabras con mayor frecuencia desde nuestros resultados. Esta información fue recogida íntegramente desde la plataforma electoral del JNE (descarga desde aquí).
Fuente: Infórmate Perú - https://informateperu.pe/politica/hernando-de-soto-sera-el-candidato-presidencial-de-avanza-pais-segun-partido-politico/.
Nuestro análisis es con el fin de brindar al elector un entendimiento más profundo del plan de gobierno Avanza País, de esta manera se podrá apelar a un reconocimiento más interiorizado de los objetivos, metas y promesas con las que está redactado este documento.
Encontrar las palabras más empleadas durante la redacción.
Identificar la intención del partido político al plantear su plan de gobierno.
Demostrar completa imparcialidad durante el análisis y reconocimiento del mismo.
# I. Lectura de Datos
discurso <- pdf_text("Plan de Gobierno - Avanza País.pdf")
# II. Construcción y Limpieza de la data
discurso <- paste(discurso, collapse = " ")
discurso <- tibble(discurso) %>% unnest_tokens(Token,discurso)
discurso_1 <- discurso %>% mutate(Token = removeNumbers(Token))
stop_words_1 <- read_xlsx("CustomStopWords.xlsx")
stop_words_1 <- stop_words_1 %>% rename(Token = Palabra)
stop_words_2 <- tibble(Token= c(""), Fuente = "Mis StopWords")
stopwords <- rbind(stop_words_1, stop_words_2)
stopwords <- stopwords[!duplicated(stopwords$Token),]
discurso_2 <- discurso_1 %>% anti_join(stopwords)
discurso_2 <- discurso_2 %>%
mutate(Token = case_when(
str_detect(Token, "país") ~ "perú",
TRUE ~ Token))
# III. Top 12 - Frecuencias
Discurso_frecuencia <- discurso_2 %>% count(Token, sort = TRUE) %>% top_n(12)
tabla0 <- flextable(Discurso_frecuencia)
Top_frecuencias <- add_header_lines(tabla0, values = "Top 12 de las palabras empleadas") %>%
bold(part = "header") %>%
align(align = "center", part = "header")
Top_frecuencias
Top 12 de las palabras empleadas | |
Token | n |
perú | 37 |
social | 30 |
nacional | 24 |
sistema | 23 |
salud | 18 |
inversión | 17 |
infraestructura | 16 |
gasto | 15 |
gobierno | 15 |
plan | 15 |
política | 15 |
servicios | 15 |
# IV. Gráfico de Barras
Barras_frecuencias <- Discurso_frecuencia %>%
ggplot() + aes(y = fct_reorder(Token, n),
x = n, fill=Token) + geom_col(fill ="darkred") +
labs(title = "Top 12 de las palabras empleadas", x = "Frecuencia",
y = NULL) +
theme_gdocs() +
geom_text(aes(label = n), colour ="white", hjust = 1.25, size = 4.0)
Barras_frecuencias
# V. WordCloud - Nube de Palabras
Cantidad <- discurso_2 %>% count(Token, sort = TRUE)
Nube_freciencias <- wordcloud2(Cantidad, size = 0.8, color = "random-light", backgroundColor = "black")
Nube_freciencias
# VI. Análisis de Sentimientos
sentimientos <- read.delim("sentimientos_2.txt")
sentimientos_discurso <- discurso_2 %>%
inner_join(sentimientos, by = c("Token" = "palabra"))
Gráfica_sentimientos <- sentimientos_discurso %>%
count(sentimiento) %>%
ggplot() + aes(x = fct_reorder(sentimiento,n),
y = n,
fill = sentimiento) +
geom_col(show.legend = F) + coord_flip() +
labs(title ="Análisis de sentimientos del plan de Gobierno - AVANZA PAIS",
subtitle = "Período 2021 - 2026",
x = "Sentimientos",
y = "Frecuencia") +
theme_avatar() +
geom_text(aes(label = n), colour ="white", hjust = 1.25, size = 4.0)
Gráfica_sentimientos
# VII. Porcentaje de Sentimientos
Pcntj_Sentimientos <- sentimientos_discurso %>%
count(sentimiento) %>%
mutate(Pntj_Sent = round(n/sum(n)*100)) %>%
arrange(-Pntj_Sent)
Gráfica_Pcntj_Sentimientos <- ggplot(Pcntj_Sentimientos, aes(x = "",
y = Pntj_Sent, fill=sentimiento)) +
geom_bar(stat = "identity", color = "white") +
geom_text(color = "white", aes(label = paste0(round(Pntj_Sent),"%")),
position = position_stack(vjust = 0.5), size = 3.5) +
coord_polar(theta = "y") +
theme_void() +
labs(title = "Sentimientos - Avanza País", fill = "")
Gráfica_Pcntj_Sentimientos
# VIII. Comparación de emociones
Cantidad_sentimientos <- discurso_2 %>%
inner_join(sentimientos, by = c("Token"="palabra")) %>%
count(Token, sentimiento) %>% group_by(sentimiento) %>% arrange(-n) %>%
top_n(4,n)
Comparacion_emociones <- ggplot(Cantidad_sentimientos) +
aes(n, fct_reorder(Token,n), fill = sentimiento) +
geom_col(show.legend = FALSE) +
facet_wrap( ~ sentimiento, scales= "free") +
labs(title= "Comparación de Emociones",
x="Frecuencia" , y="Palabra") +
theme_tufte()
Comparacion_emociones
Fue fundamental la estrategia que usamos al recopilar la data en palabras claves, una forma de sintetizar lo que el plan de gobierno de Avanza País quiere transmitir al ciudadano a pie.
Como era de esperarse la palabra “Perú” es la más mencionada en nuestro análisis, pues el objetivo es convencer a nivel nacional (nacional se ubica en tercera posición, aludiendo al patriotismo característico que se usan en campañas electorales) que Avanza País es la solución a los problemas que hoy aquejan el estado peruano. Las palabras vienen en consecuencia a ello. De la misma manera una palabra también bastante empleada por el partido es “social”, la cual hace referencia al partido de Integración Social, así como también a la ética con la que se manejan, demostrar que es un principio del partido. Hace hincapié en la dimensión que abarcan las otras palabras encontradas en este análisis, tales como salud, educación, justicia o seguridad ciudadana. Sin duda la palabra Social es una palabra que engloba otras palabras claves halladas.
Encontramos otras palabras que, en menor medida, fueron resaltantes para nuestro análisis, tales como infraestructura, inversión, plan, sistema, entre otras. Esto nos permitió concluir que estamos hablando de una plan bastante técnico, donde se hacen promesas en función a los recursos de los que el país puede disponer y manejar.