library(tidyverse)
## ── Attaching packages ─────────────────────────────────────────── tidyverse 1.3.0 ──
## ✓ ggplot2 3.3.0     ✓ purrr   0.3.3
## ✓ tibble  2.1.3     ✓ dplyr   0.8.5
## ✓ tidyr   1.0.2     ✓ stringr 1.4.0
## ✓ readr   1.3.1     ✓ forcats 0.5.0
## ── Conflicts ────────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
series = read_csv("data/series_from_imdb.csv.zip")
## Parsed with column specification:
## cols(
##   series_name = col_character(),
##   Episode = col_character(),
##   series_ep = col_double(),
##   season = col_double(),
##   season_ep = col_double(),
##   url = col_character(),
##   UserRating = col_double(),
##   UserVotes = col_double(),
##   r1 = col_double(),
##   r2 = col_double(),
##   r3 = col_double(),
##   r4 = col_double(),
##   r5 = col_double(),
##   r6 = col_double(),
##   r7 = col_double(),
##   r8 = col_double(),
##   r9 = col_double(),
##   r10 = col_double()
## )
hoc = series %>% 
    filter(series_name == "House of Cards")

Avaliações de House of Cards ao longo das temporadas

É perceptível a diminuição drástica na avaliação da série na sexta temporada em comparação com as anteriores. Um dos fatores que pode explicar essa diferença é a saída do personagem até então principal, porque, até então, havia certa constância nas avaliações.

hoc %>% 
    ggplot(mapping = aes(y = UserRating, x = series_ep, group = season, color = season)) +
    geom_line(alpha = .7)