En esta actividad se realizará un análisis de minería de texto sobre la obra “Don Quijote de la Mancha” de Miguel de Cervantes Saavedra. El propósito es examinar las relaciones entre bigramas y descubrir patrones significativos en el texto.
# Stopwords en español
stopwords_es <- stopwords("es")
# Tokenización
df_tokens <- df_texto %>%
unnest_tokens(word, frase) %>%
filter(!word %in% stopwords_es,
str_detect(word, "[a-záéíóúñ]"))