top100dramas

Cargar el archivo CSV

dramas <- read.csv(“dramas3.csv”, header = TRUE, stringsAsFactors = FALSE)

head(dramas)

#Diagrama de dispersion ggplot(dramas, aes(x = Score , y = Popularity)) + geom_point(alpha = 1.6, size = 3, color = “orange”) + labs(title = “Relación entre puntaje y popularidad en Kdramas”, x = “Score”, y = “Popularity”)

hist(dramas$Episodes, main = “Histograma de cantidad de episodios”, xlab = “Episodios”, ylab = “Frecuencia”, col = “pink”, breaks = 5)

install.packages(‘wordcloud’) install.packages(‘tm’) install.packages(‘extrafont’)

datos <- read.csv(“dramas3.csv”, stringsAsFactors = FALSE)

texto <- datos$Genre

texto_limpio <- gsub(“[^[:alnum:]\s]”, ““, tolower(texto))

frecuencia <- table(texto_limpio)

#Nube de palabras con los generos de los dramas library(wordcloud) library(extrafont)

font_import(pattern = “Arial”) # Cambia “Lato” por la fuente que quieras utilizar loadfonts()

wordcloud(names(frecuencia), freq = frecuencia, scale = c(5, 1), min.freq = 1, max.words = 100, random.order = FALSE, rot.per = 0.25, colors = brewer.pal(8, “Dark2”), family = “Arial”, vfont = c(“sans serif”, “plain”)) # Boxplot ggplot(dramas, aes(x = Episodes, y = Score)) + geom_boxplot() + labs(title = “Boxplot de cantidad de episodios por la cantidad de puntaje”, x = “Episodios”, y = “Puntaje”)

top100dramas

Monserrat Abdala

2023-03-28

Cargar el archivo CSV