Sesión 5 - Visualización con Gráfico de Dispersión

Descarga el conjunto de datos en formato csv en la siguiente liga: https://drive.google.com/file/d/12IpMErb4j83h5gGTdTpv0WZOf5ceY7b3/view?usp=sharing

1. Cargar los datos y algo de limpieza

library(readr)
library(dplyr)
library(stringr)
library(ggplot2)

# Leer archivo
movies_original <- read_csv("movie_info.csv", 
                   col_types = cols(.default = "c"))

movies <- movies_original %>%
  mutate(
    critic_score = as.numeric(str_remove(critic_score, "%")),
    audience_score = as.numeric(str_remove(audience_score, "%")),
    year = str_extract(release_date, "\\d{4}"),
    year = as.numeric(year)
  )

2. Crear el primer gráfico de dispersión básico

3. Personalizar apariencia de los puntos

#geom_point

4. Agregar una línea de tendencia al gráfico

#geom_smooth

5. Facetas por año de estreno

#facet_wrap(~ year, ncol = 4, scales = "free")

6. Mini reto práctico

Elige una película específica (title) y filtra la base.
Compara su puntuación de crítica y audiencia contra la media general.
Filtra las películas del año 1997, ¿cuál es la que tiene mayor puntuación en crítica?
Crea un gráfico de dispersión sólo para las películas del año 2000 en adelante.
Genera la media de las puntuaciones de crítica para el conjunto de datos anteriores a 2000 (inlcuido). Genera la media de las puntuaciones de crítica para el conjunto de datos posteriores a 2000. ¿Qué tan diferentes son estas medias, qué indica eso?
Genera la media de las puntuaciones de audiciencia para el conjunto de datos anteriores a 2000 (inlcuido). Genera la media de las puntuaciones de audiencia para el conjunto de datos posteriores a 2000. ¿Qué tan diferentes son estas medias, qué indica eso?

¡Listo!

En esta sesión aprendiste a:

Crear gráficos de dispersión en ggplot2.
Personalizar color, forma, tamaño y transparencia.
Agregar líneas de tendencia para interpretación.
Separar visualizaciones por grupos usando facet_grid().

Sesión 5 - Visualización con Gráfico de Dispersión

Víctor Espinoza

2025-04-29

1. Cargar los datos y algo de limpieza

2. Crear el primer gráfico de dispersión básico

3. Personalizar apariencia de los puntos

4. Agregar una línea de tendencia al gráfico

5. Facetas por año de estreno

6. Mini reto práctico

¡Listo!