library(tidyverse)
## ── Attaching packages ─────────────────────────────────────────── tidyverse 1.3.0 ──
## ✓ ggplot2 3.3.0 ✓ purrr 0.3.3
## ✓ tibble 2.1.3 ✓ dplyr 0.8.5
## ✓ tidyr 1.0.2 ✓ stringr 1.4.0
## ✓ readr 1.3.1 ✓ forcats 0.5.0
## ── Conflicts ────────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
series = read_csv("data/series_from_imdb.csv.zip")
## Parsed with column specification:
## cols(
## series_name = col_character(),
## Episode = col_character(),
## series_ep = col_double(),
## season = col_double(),
## season_ep = col_double(),
## url = col_character(),
## UserRating = col_double(),
## UserVotes = col_double(),
## r1 = col_double(),
## r2 = col_double(),
## r3 = col_double(),
## r4 = col_double(),
## r5 = col_double(),
## r6 = col_double(),
## r7 = col_double(),
## r8 = col_double(),
## r9 = col_double(),
## r10 = col_double()
## )
hoc = series %>%
filter(series_name == "House of Cards")
É perceptível a diminuição drástica na avaliação da série na sexta temporada em comparação com as anteriores. Um dos fatores que pode explicar essa diferença é a saída do personagem até então principal, porque, até então, havia certa constância nas avaliações.
hoc %>%
ggplot(mapping = aes(y = UserRating, x = series_ep, group = season, color = season)) +
geom_line(alpha = .7)