Fiódor Dostoyevski fue un destacado novelista y filósofo ruso del siglo XIX. Nació el 11 de noviembre de 1821 y falleció el 9 de febrero de 1881. Dostoyevski es conocido por sus obras literarias que exploran la psicología humana y las complejidades morales. Algunas de sus obras más famosas incluyen “Crimen y castigo”, “Los hermanos Karamázov”, “El jugador” y “El idiota”. Su estilo literario se caracteriza por su profundidad psicológica, sus reflexiones filosóficas y su exploración de las tensiones entre el bien y el mal.
Link del libro:https://www.casadellibro.com/libro-los-hermanos-karamazov/9788420650807/1831147
library(vembedr)
embed_url("https://www.youtube.com/watch?v=bX0C35JDs4M")
knitr::opts_chunk$set( message = F, warning = F)
library(pacman)
p_load(tidyverse, tidytext, tm, wordcloud,
wordcloud2, pdftools, patchwork,
widyr,dplyr,magrittr,readxl,gganimate,gifski)
libro1<- pdf_text("Los Hermanos Karamazov.pdf")
libro1 <- paste(libro1, collapse = " ")
libro1 <- str_remove_all(libro1, "[:punct:]")
libro1<- str_remove_all(libro1,"[:digit:]")
libro1 <- tibble(libro1) %>%
unnest_tokens(Token, libro1) %>%
mutate(Token = removeNumbers(Token))
library(tidytext)
stopwords_es_1 <- read_excel("CustomStopWords.xlsx")
names(stopwords_es_1) <- c("Token","Fuente")
stopwords_es_2 <- tibble(Token= c(""),Fuente="Mis StopWords")
stopwords_es<- rbind(stopwords_es_1, stopwords_es_2)
stopwords_es<- stopwords_es[!duplicated(stopwords_es$Token),]
libro1 <- libro1 %>% anti_join(stopwords_es)
libro1_frecuencias <- libro1 %>%
count(Token, sort = TRUE)
libro1_frecuencias1<- libro1_frecuencias%>%
top_n(10) %>% ggplot() + aes(x = fct_reorder(Token,n),
y = n,fill=Token) +
geom_col() +
labs(x = NULL, y = "Frecuencia",
title = "LOS HERMANOS KARAMASOV") +
theme_minimal() +
theme(legend.position = "none") + transition_states(n) + enter_fade() + exit_fade() + shadow_mark()+
coord_flip()
libro1_frecuencias1
library(wordcloud)
library(RColorBrewer)
set.seed(123)
libro1_frecuencias <- libro1 %>%
count(Token, sort = TRUE)
wordcloud(words= libro1_frecuencias$Token,
freq = libro1_frecuencias$n,
max.words = 100,colors=brewer.pal(5,"Dark2"))
sentimientos <- read.delim("sentimientos_2.txt")
sentimientos <- as.tibble(sentimientos)
sentimientos <- distinct(sentimientos)
libro_sentimiento <- libro1 %>%
inner_join(sentimientos,by=c("Token"="palabra"))
libro_sentimiento1<-libro_sentimiento%>%
count(Token,sentimiento) %>% group_by(sentimiento) %>% top_n(3,n)
ggplot(libro_sentimiento1) +
aes(x=fct_reorder(Token,n),
y=n,
fill=sentimiento) +
geom_col(show.legend = FALSE) +
facet_wrap( ~ sentimiento, scales= "free") +
labs(title= "Gráfico de palabras por sentimiento",
x= "Palabras", y="Frecuencia") +
theme_bw() +
coord_flip()