#Codigo
install.packages(“dendextend”) install.packages(“ggplot2”)
library(ggplot2) library(dendextend)
dramas <- read.csv(“dramas3.csv”, header = TRUE, stringsAsFactors = FALSE)
head(dramas)
#Diagrama de dispersion ggplot(dramas, aes(x = Score , y = Popularity)) + geom_point(alpha = 1.6, size = 3, color = “orange”) + labs(title = “Relación entre puntaje y popularidad en Kdramas”, x = “Score”, y = “Popularity”)
hist(dramas$Episodes, main = “Histograma de cantidad de episodios”, xlab = “Episodios”, ylab = “Frecuencia”, col = “pink”, breaks = 5)
install.packages(‘wordcloud’) install.packages(‘tm’) install.packages(‘extrafont’)
datos <- read.csv(“dramas3.csv”, stringsAsFactors = FALSE)
texto <- datos$Genre
texto_limpio <- gsub(“[^[:alnum:]\s]”, ““, tolower(texto))
frecuencia <- table(texto_limpio)
#Nube de palabras con los generos de los dramas library(wordcloud) library(extrafont)
font_import(pattern = “Arial”) # Cambia “Lato” por la fuente que quieras utilizar loadfonts()
wordcloud(names(frecuencia), freq = frecuencia, scale = c(5, 1), min.freq = 1, max.words = 100, random.order = FALSE, rot.per = 0.25, colors = brewer.pal(8, “Dark2”), family = “Arial”, vfont = c(“sans serif”, “plain”)) # Boxplot ggplot(dramas, aes(x = Episodes, y = Score)) + geom_boxplot() + labs(title = “Boxplot de cantidad de episodios por la cantidad de puntaje”, x = “Episodios”, y = “Puntaje”)