install.packages(“dendextend”) install.packages(“ggplot2”)
library(ggplot2)
library(dendextend)
dramas <- read.csv(“top100_kdrama.csv”, header = TRUE, stringsAsFactors = FALSE)
head(dramas)
#Diagrama de dispersion ggplot(dramas, aes(x = Score , y = Popularity)) + geom_point(alpha = 1.6, size = 3, color = “orange”) + labs(title = “Relación entre puntaje y popularidad en Kdramas”, x = “Score”, y = “Popularity”) #Histograma hist(dramas$Episodes, main = “Histograma de cantidad de episodios”, xlab = “Episodios”, ylab = “Frecuencia”, col = “pink”, breaks = 5)
install.packages(‘wordcloud’) install.packages(‘tm’) install.packages(‘extrafont’)
datos <- read.csv(“top100_kdrama.csv”, stringsAsFactors = FALSE) texto <- datos$Genre texto_limpio <- gsub(“[^[:alnum:]\s]”, ““, tolower(texto)) frecuencia <- table(texto_limpio)
#Nube de palabras con los generos de los dramas library(wordcloud) library(extrafont)
font_import(pattern = “Arial”) # Cambia “Lato” por la fuente que quieras utilizar loadfonts()
wordcloud(names(frecuencia), freq = frecuencia, scale = c(5, 1), min.freq = 1, max.words = 100, random.order = FALSE, rot.per = 0.25, colors = brewer.pal(8, “Dark2”), family = “Arial”, vfont = c(“sans serif”, “plain”)) # Boxplot ggplot(dramas, aes(x = Episodes, y = Score)) + geom_boxplot() + labs(title = “Boxplot de cantidad de episodios por la cantidad de puntaje”, x = “Episodios”, y = “Puntaje”)