parcial2

1.BIOGRAFIA

Paulo Coelho

Paulo Coelho, nacido el 24 de agosto de 1947 en Río de Janeiro, Brasil, es un renombrado escritor y novelista contemporáneo, cuyas obras han cautivado a lectores de todo el mundo. Su vida está marcada por una fascinante mezcla de experiencias, exploración espiritual y una búsqueda constante de significado.

Aunque Coelho mostró desde joven su inclinación hacia la escritura, su familia tenía expectativas diferentes. Estudió derecho y trabajó en el teatro y la televisión antes de sumergirse en el mundo de las drogas y la rebeldía juvenil durante los años 60 y 70. En 1974, Coelho fue encarcelado por el régimen militar brasileño debido a sus actividades relacionadas con el teatro.

Después de salir de prisión, Paulo Coelho emprendió un viaje espiritual y, en 1986, realizó el famoso Camino de Santiago, una peregrinación que cambió su vida. Su experiencia se reflejaría más tarde en su obra maestra “El Alquimista”. Este libro, publicado en 1988, se convirtió en uno de los mayores éxitos de la literatura contemporánea, traducido a más de 80 idiomas y vendido en millones de copias en todo el mundo.

La obra de Coelho explora temas como la espiritualidad, la filosofía y la búsqueda de uno mismo. Otros éxitos literarios incluyen “Brida”, “Veronika decide morir”, “Once minutos” y “El Peregrino de Compostela”. Su estilo narrativo sencillo pero profundamente simbólico ha resonado con una amplia audiencia, convirtiéndolo en uno de los autores más leídos y respetados del mundo.

Portal de Paulo Coelho

# o información cargada
rm(list = ls())

# Para limpiar el área de gráficos
graphics.off()

# Cambiar el directorio de trabajo
setwd(dirname(rstudioapi::getActiveDocumentContext()$path))
getwd()

## [1] "E:/MATERIALES TED/FUENTES_FIORELLA"

# Otras opciones
cat("\014")

options(scipen=999)    # Eliminar la notación científica
options(digits = 3)

library(pdftools)
libro1 <- pdf_text("La_quinta_montaña.pdf")

libro1 <- paste(libro1, collapse = " ")
  
#libro1

No es completo

#limpiar los nombres 
library(stringr)
str_count(libro1, "Elías")

## [1] 396

str_count(libro1, "elías")

## [1] 0

str_remove_all(libro1, "Elías") -> libro2
str_remove_all(libro1, "elías") -> libro2
#libro2

write_lines(libro2, "libro3.txt")
libro2<- scan("libro3.txt",
                   encoding = "UTF-8", what = "char",
                   sep = "\n")

libro3 <- tibble(libro2) %>% 
    unnest_tokens(Token, libro2) %>% 
    mutate(Token = removeNumbers(Token)) 

#libro3

library(readxl)
stopwords_es_1        <- read_excel("CustomStopWords.xlsx")
names(stopwords_es_1) <- c("Token","Fuente")

stopwords_es_2 <- tibble(Token= c(""),Fuente="Mis StopWords")
  
stopwords_es   <- rbind(stopwords_es_1, stopwords_es_2)
stopwords_es   <- stopwords_es[!duplicated(stopwords_es$Token),]

libro4 <- libro3 %>% anti_join(stopwords_es)

## Joining with `by = join_by(Token)`

#libro4

libro4_frecuencias <- libro4 %>%
  count(Token, sort = TRUE)
  
libro4_frecuencias

## # A tibble: 6,086 × 2
##    Token          n
##    <chr>      <int>
##  1 elías        407
##  2 señor        192
##  3 akbar        189
##  4 ciudad       150
##  5 gobernador   147
##  6 dios         144
##  7 mujer        132
##  8 dioses       111
##  9 niño         105
## 10 vida         104
## # ℹ 6,076 more rows

PORSICA para eliminar

#str_replace(discurso1$Token, "perú", "Perú")->discurso1b
#str_remove_all(libro4$Token, "elías")->libro5
libro5 <- str_remove_all(libro4$Token, "(?i)akbar|elías")


libro5 <- tibble(libro5) %>% 
    unnest_tokens(Token, libro5) %>% 
    mutate(Token = removeNumbers(Token))

libro5_frecuencias <- libro5 %>%
  count(Token, sort = TRUE)
  
libro5_frecuencias

## # A tibble: 6,084 × 2
##    Token          n
##    <chr>      <int>
##  1 señor        192
##  2 ciudad       150
##  3 gobernador   147
##  4 dios         144
##  5 mujer        132
##  6 dioses       111
##  7 niño         105
##  8 vida         104
##  9 hombre       101
## 10 sacerdote    101
## # ℹ 6,074 more rows

#para grafico animado

library(gganimate)   
library(gifski)
library(png)

3.NUBE DE 100 PALABRAS

library(wordcloud2)


# Toma las primeras 100 filas (las 100 palabras más usadas)
top_100_palabras <- head(libro5_frecuencias, 100)


# Crea el wordcloud con las 100 palabras más usada
set.seed(2021)
wordcloud2(top_100_palabras,
           size = 0.7,
           shape = 'circle')

#porsica guardarlo

sentimientos <- read.delim("sentimientos_2.txt")

#sentimientos                     

sentimientos <- as.tibble(sentimientos)

## Warning: `as.tibble()` was deprecated in tibble 2.0.0.
## ℹ Please use `as_tibble()` instead.
## ℹ The signature and semantics have changed, see `?as_tibble`.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

#sentimientos <- distinct(sentimientos) #elminar

table(sentimientos$sentimiento)

## 
##     alegría     asombro   confianza    disgusto         ira       miedo 
##         619         476        1122         929        1071        1272 
##    negativo    positivo premonición    tristeza 
##        4379        2727         769        1011

2.GRAFICO DE TOP 10

library(ggplot2)
library(gganimate)

sentimientos %>% ggplot() + 
  aes(sentimiento,fill=sentimiento) + #geom_bar ggplot2 lo hace
  geom_bar(show.legend = F) + transition_states(sentimiento) +
             enter_fade() +
             exit_shrink()  + coord_flip() +
  labs(title= "Frecuencia de sentimientos del diccionario NRC",
       x = "Sentimiento",
       y= "Frecuencia")  -> a1

animate(a1)

parcial2

Fuentes Fiorella

2024-01-05

1.BIOGRAFIA

3.NUBE DE 100 PALABRAS

2.GRAFICO DE TOP 10