library(pacman)
p_load(tidyverse, tidytext, tm, wordcloud, wordcloud2,
pdftools, patchwork, widyr, dplyr, magrittr)
library(pdftools)
discurso1980 <- pdf_text("mensaje-1980-fbt.pdf")
discurso1980 <- paste(discurso1980, collapse = " ")
#quitando titulo
discurso1980 <- str_remove(discurso1980,"MENSAJE DEL PRESIDENTE CONSTITUCIONAL DEL PERÚ,")
discurso1980 <- str_remove(discurso1980,"ARQUITECTO FERNANDO BELAUNDE TERRY,")
discurso1980 <- str_remove(discurso1980,"ANTE EL CONGRESO NACIONAL, EL 28 DE JULIO DE 1980")
# quitando los numeros y signos de puntuacion
discurso1980 <- str_remove_all(discurso1980, "[:digit:]")
discurso1980 <- str_remove_all(discurso1980, "[:punct:]")
discurso1980 <- tibble(discurso1980) %>%
unnest_tokens(Token, discurso1980) %>%
mutate(Token = removeNumbers(Token)) # Del paquete tm
# Este codigo nos sirve para ir eliminado stowords plabras que no sirven e ir reemplazando por unas que son similares
library(readxl)
stopwords_es_1 <- read_excel("CustomStopWords.xlsx")
names(stopwords_es_1) <- c("Token", "Fuente")
stopwords_es_2 <- tibble(Token = c(""), Fuente="Mis StopWords")
stopwords_es <- rbind(stopwords_es_1, stopwords_es_2)
stopwords_es <- stopwords_es[!duplicated(stopwords_es$Token), ]
#SACANDO LKAS PLABRAS QUE NO SIRVEN
discurso1980 <- discurso1980 %>% anti_join(stopwords_es)
discurso1980$Token <- str_replace(discurso1980$Token, "perú", "país")
discurso1980$Token <- str_replace(discurso1980$Token, "proyectos", "proyecto")
discurso1980$Token <- str_replace(discurso1980$Token, "ciudadana", "ciudadanía")
# leyendo diccionario de los sentimientos
sentimientos <- read.delim("sentimientos_2.txt")
sentimientos <- as.tibble(sentimientos)
sentimientos <- distinct(sentimientos)
sentimientos <- sentimientos[!duplicated(sentimientos), ]
# Uniendo discurso con el diccionario de sentimientos
discurso_sentimiento1980 <- discurso1980 %>%
inner_join(sentimientos, by = c("Token" = "palabra"))
#################### grafico de las 15 palabras mas usadas #######################
# Obteniendo frecuencias por palabra
library(ggplot2)
library(gganimate)
discurso1_frecuencias1980 <- discurso1980 %>%
count(Token, sort = TRUE)
#graficando
grafico_palabras_mas_usadas1980 <- discurso1_frecuencias1980 %>%
top_n(15) %>%
ggplot() +
aes(x = fct_reorder(Token, n), y = n, fill = Token) +
geom_col() +
labs(x = NULL, y = "Frecuencia",
title = "Mensaje Presidencial 1980" ) +
theme_minimal() +
theme(legend.position = "none") +
coord_flip()
#################### grafico de las palabras mas usadas por sentimiento #######################
analisis_sentiomiento_general1980 <- discurso_sentimiento1980 %>%
count(sentimiento) %>%
ggplot() + aes(x = fct_reorder(sentimiento, n),
y = n,
fill = sentimiento) +
geom_col(show.legend = F) + coord_flip() +
labs(title ="Análisis de sentimientos del discurso presidencial",
subtitle = "Mensaje Presidencial de Fernando Belaúnde Terry ",
caption = "Fuente: Presidencia de la República del Perú",
x = "Sentimientos",
y= "Frecuencia") +
theme_bw()
#mostrando las 3 palabras mas usadas por sentimiento LUEGO LAS MOSTRAMOS EN LA PARTE DE ABAJO
contar_palabras1980 <- discurso1980 %>%
inner_join(sentimientos,
by = c("Token" = "palabra")) %>%
#filter(sentimiento %in% c("positivo","negativo")) %>%
dplyr::count(Token, sentimiento) %>%
group_by(sentimiento) %>%
top_n(3, n)
grafico_palabras_sentimiento1980<- ggplot(contar_palabras1980) +
aes(x=fct_reorder(Token,n),
y=n,
fill=sentimiento) +
geom_col(show.legend = FALSE) +
facet_wrap( ~ sentimiento, scales = "free", ncol = 5) +
labs(title= "Gráfico de palabras mas uadas por sentimiento",
subtitle = "Mensaje Presidencial de Fernando Belaúnde Terry 1980 ",
x = "Palabras", y = "Frecuencia") +
theme_bw() +
coord_flip()
library(pacman)
p_load(tidyverse, tidytext, tm, wordcloud, wordcloud2,
pdftools, patchwork, widyr, dplyr, magrittr)
library(pdftools)
discurso1985 <- pdf_text("mensaje-1985-fbt.pdf")
discurso1985 <- paste(discurso1985, collapse = " ")
#quitando titulo
discurso1985 <- str_remove(discurso1985,"MENSAJE DEL PRESIDENTE CONSTITUCIONAL DEL PERÚ,")
discurso1985 <- str_remove(discurso1985,"ARQUITECTO FERNANDO BELAUNDE TERRY,")
discurso1985 <- str_remove(discurso1985,"ANTE EL CONGRESO NACIONAL, EL 28 DE JULIO DE 1985")
# quitando los numeros y signos de puntuacion
discurso1985 <- str_remove_all(discurso1985, "[:digit:]")
discurso1985 <- str_remove_all(discurso1985, "[:punct:]")
discurso1985 <- tibble(discurso1985) %>%
unnest_tokens(Token, discurso1985) %>%
mutate(Token = removeNumbers(Token)) # Del paquete tm
# eliminado stowords plabras que no sirven
library(readxl)
stopwords_es_1 <- read_excel("CustomStopWords.xlsx")
names(stopwords_es_1) <- c("Token", "Fuente")
stopwords_es_2 <- tibble(Token = c(""), Fuente="Mis StopWords")
stopwords_es <- rbind(stopwords_es_1, stopwords_es_2)
stopwords_es <- stopwords_es[!duplicated(stopwords_es$Token), ]
#SACANDO LKAS PLABRAS QUE NO SIRVEN
discurso1985 <- discurso1985 %>% anti_join(stopwords_es)
discurso1985$Token <- str_replace(discurso1985$Token, "perú", "país")
discurso1985$Token <- str_replace(discurso1985$Token, "proyectos", "proyecto")
discurso1985$Token <- str_replace(discurso1985$Token, "ciudadana", "ciudadanía")
# leyendo diccionario de los sentimientos
sentimientos <- read.delim("sentimientos_2.txt")
sentimientos <- as.tibble(sentimientos)
sentimientos <- distinct(sentimientos)
sentimientos <- sentimientos[!duplicated(sentimientos), ]
# Uniendo discurso con el diccionario de sentimientos
discurso_sentimiento1985 <- discurso1985 %>%
inner_join(sentimientos, by = c("Token" = "palabra"))
#################### grafico de las 15 palabras mas usadas #######################
# Obteniendo frecuencias por palabra
library(ggplot2)
library(gganimate)
discurso1_frecuencias1985 <- discurso1985 %>%
count(Token, sort = TRUE)
#graficando
grafico_palabras_mas_usadas1985 <- discurso1_frecuencias1985 %>%
top_n(15) %>%
ggplot() +
aes(x = fct_reorder(Token, n), y = n, fill = Token) +
geom_col() +
labs(x = NULL, y = "Frecuencia",
title = "Mensaje Presidencial 1985" ) +
theme_minimal() +
theme(legend.position = "none") +
coord_flip()
#################### grafico de las palabras mas usadas por sentimiento #######################
analisis_sentiomiento_general1985 <- discurso_sentimiento1985 %>%
count(sentimiento) %>%
ggplot() + aes(x = fct_reorder(sentimiento, n),
y = n,
fill = sentimiento) +
geom_col(show.legend = F) + coord_flip() +
labs(title ="Análisis de sentimientos del discurso presidencial",
subtitle = "Mensaje Presidencial de Fernando Belaúnde Terry ",
caption = "Fuente: Presidencia de la República del Perú",
x = "Sentimientos",
y= "Frecuencia") +
theme_bw()
#mostrando las palabras mas usadas por sentimiento
contar_palabras1985 <- discurso1985 %>%
inner_join(sentimientos,
by = c("Token" = "palabra")) %>%
#filter(sentimiento %in% c("positivo","negativo")) %>%
dplyr::count(Token, sentimiento) %>%
group_by(sentimiento) %>%
top_n(3, n)
grafico_palabras_sentimiento1985<- ggplot(contar_palabras1985) +
aes(x=fct_reorder(Token,n),
y=n,
fill=sentimiento) +
geom_col(show.legend = FALSE) +
facet_wrap( ~ sentimiento, scales = "free", ncol = 5) +
labs(title= "Gráfico de palabras mas uadas por sentimiento",
subtitle = "Mensaje Presidencial de Fernando Belaúnde Terry 1985 ",
x = "Palabras", y = "Frecuencia") +
theme_bw() +
coord_flip()
Fernando Belaúnde Terry (1912-2002) fue un destacado político peruano y dos veces presidente de su país. Nació en Lima y se graduó como arquitecto en la Universidad Nacional de Ingeniería. Fundó el Partido Popular Cristiano en 1956, convirtiéndose en una figura central de la política peruana.
Belaúnde fue elegido presidente por primera vez en 1963, liderando un gobierno centrado en la democracia y el desarrollo económico. Sin embargo, fue derrocado en un golpe de estado en 1968. Regresó al poder en 1980, marcando el retorno a la democracia en Perú. Durante su segundo mandato, se centró en la modernización del país y la promoción de la inversión extranjera.
Su legado incluye contribuciones significativas a la arquitectura y la política, siendo recordado como un defensor de la democracia y el progreso en el Perú.
Biografia de Belaunde de Terry
library(vembedr)
embed_url("https://www.youtube.com/watch?v=HNu8PPRGdYk") %>% use_align("center")
grafico_palabras_mas_usadas1980
library(wordcloud2)
set.seed(2021)
wordcloud2(discurso1_frecuencias1980,
size = 0.9,
shape = 'circle')
#En esta nube de palabras podemos ver que el discurso fue orientada a convencer al poblacion de que el gobierno esta seguro y que los pueblos son que mas importan en este pais. tambien podemos ver que hablan sobre desarrollo energia etc.Está nube de palabras tranmiste confianza.
grafico_palabras_sentimiento1980
grafico_palabras_mas_usadas1985
El hecho de que las palabras “país”, “gobierno” y “nacional” sean las
más usadas en un discurso presidencial nos da a entender que el tema
central del discurso fue el estado del país y la gestión del
gobierno.
library(wordcloud2)
set.seed(2021)
wordcloud2(discurso1_frecuencias1985,
size = 0.9,
shape = 'circle')
grafico_palabras_sentimiento1985
El análisis de las palabras más usadas en el mensaje del presidente
revela que los sentimientos que transmiten confianza principalmente
tinen las siguientes palabras “instituto”, “sistema” y “especial”. Estas
palabras se asocian con la idea de un gobierno tranquilo que goza de un
buen momento.
Sin embargo, el mensaje también incluye algunas palabras que transmiten sentimientos de miedo y tristeza como “gobierno”, “crisis”, “problema” e “deuda”. Estas palabras se asocian con la idea de que al gobierno lo le durara el estado el buen climax que bienen gozando.
library(gridExtra)
grafico_palabras_mas_usadas1980 + grafico_palabras_mas_usadas1985