ator <- "will_smith"
import_data(ator)
filmes = read_imported_data(ator)

Exploração dos dados

Os dados foram gerados em Agosto de 2021 a partir do Rotten Tomatoes. Cada linha é um filme que o ator participou. As variáveis são as seguintes:

avaliacao: Sistema de avaliação do Rotten Tomatoes (Tomatometer), varia de 0 a 100
nota_audiencia: Avaliação dada pela audiência, varia de 0 a 100
filme: Filme em que o ator participou
papel: Papel do ator no filme
bilheteria: Valor de bilheteria em milhões de dólares
ano: Ano de lançamento do filme

plot_data <- function(data, color, title, x_legend){
    filmes %>% 
        ggplot(aes(x = data, y = "")) +
        geom_violin(fill = "grey", color = "transparent", alpha = 0.2) +
        geom_jitter(alpha = 0.4,
                  height = 0.1,
                  color = color) +
        geom_vline(aes(xintercept = median(avaliacao)), color=color) +
        labs(x = x_legend, y = "", title = title)
}

Avaliação dos críticos e da audiência

filmes %>%
    gather(key, value, avaliacao, nota_audiencia) %>%
    mutate(key = ifelse(key == "nota_audiencia", "Nota da audiência", "Nota dos críticos")) %>% 
    ggplot(aes(x=value, y=key, colour=key)) +
    geom_violin(fill = "grey", color = "transparent", alpha = 0.2) +
    geom_jitter(alpha = 0.4, height = 0.1) +
    stat_summary(
        geom = "point",
        color = "blue",
        size = 3,
        fun = median
    ) +
    labs(
      x = "Avaliação",
      y = "",
      title = "Avaliação: críticos vs audiência",
      subtitle = "O ponto azul é a mediana", 
      color = "") +
    theme(legend.position = "none")

# filmes %>%
#     gather(key, value, avaliacao, nota_audiencia) %>%
#     ggplot(aes(x=value, fill=key)) +
#     geom_density(alpha = 0.3, color = "grey60")
    # labs(x = "x_legend", y = "", title = "title")
filmes %>%
  summarise(
    `Mediana Críticos` = median(avaliacao, na.rm = TRUE),
    `Mediana Audiência` = mean(nota_audiencia, na.rm = TRUE),
  ) %>%
  kable(align = "l")
Mediana Críticos Mediana Audiência
56 66.71429

Bilheria

filmes %>% 
    ggplot(aes(x = ano, y = bilheteria)) + 
    geom_point(color = "deepskyblue") +
    labs(title = "Bilheteria ao longo dos anos", y = "Bilheteria", x = "Ano") +
    scale_y_continuous(labels = label_number(prefix = "$ ", suffix = "M"))

filmes %>% 
    ggplot(aes(x = bilheteria)) + 
    geom_histogram(binwidth = 25, fill = "deepskyblue", color = "black", alpha = 0.5) + 
    geom_rug(size = .5, color = "deepskyblue") +
    labs(x = "Bilheteria", y = "", title = "Distribuição da bilheteria") + 
    scale_x_continuous(labels = label_number(prefix = "$ ", suffix = "M"))

Agrupamento

# centros pré calculados
centers = structure(c(-1.03882855178687, 0.925329832927003, 0.118227832145699, 
0.822340254702305, -0.697036059281448, 1.57143614969046, 0.537897289922629, 
-0.775350197516041), .Dim = c(4L, 2L), .Dimnames = list(c("1", 
"2", "3", "4"), c("avaliacao", "bilheteria")))

clusters <- filmes %>% 
    mutate(avaliacao = scale(avaliacao), bilheteria = scale(bilheteria)) %>% 
    select(avaliacao, bilheteria) %>% 
    kmeans(centers = centers)

filmes <- filmes

filmes$grupo <- as.factor(clusters$cluster)

filmes %>% 
    ggplot(aes(x=bilheteria, y=avaliacao/100, color = grupo)) +
    geom_point(size = 2) +
    scale_color_manual(labels = c(
        "Baixa avaliação e bilheteria",
        "Sucessos de bilheteria aclamados pela crítica",
        "Sucessos de bilheteria",
        "Crítica ama, público nem tanto"), 
        values = c("red", "green", "deepskyblue", "purple")) +
    theme(legend.position = "bottom", legend.direction = "vertical") +
    labs(color="", x="Bilheteria", y="Avaliação dos críticos", title = "Agrupamento pela avaliação e bilheteria") +
    scale_y_continuous(labels = scales::percent) + 
    scale_x_continuous(labels = label_number(prefix = "$ ", suffix = "M"))

print_movies <- function(g) {
  filmes %>% 
    filter(grupo == g) %>% 
    mutate(bilheteria = paste0("$ ", bilheteria, "M")) %>%
    mutate(avaliacao = paste0(avaliacao, "%")) %>%
    arrange(ano) %>% 
    select(`Filme` = filme, `Ano` = ano, `Bilheteria` = bilheteria, `Avaliação` = avaliacao) %>% 
    kable(align = "l")
}

Baixa avaliação e bilheteria

10 filmes
Avaliação: 11% - 43%
Bilheteria: $25,3M - $138,4M

O grupo contém o filme mais rejeitado pelos críticos: Collateral Beauty.
Também contém os dois primeiros primeiros filmes da franquia Bad Boys. O último filme, Bad Boys for Life, foi lançado 17 anos depois e está entre os filmes de maior sucesso do ator.

print_movies(1)
Filme Ano Bilheteria Avaliação
Made in America 1993 $ 41.8M 31%
Bad Boys 1995 $ 63.9M 42%
Wild Wild West 1999 $ 113.8M 17%
The Legend of Bagger Vance 2000 $ 30.7M 43%
Bad Boys II 2003 $ 138.4M 23%
Jersey Girl 2004 $ 25.3M 42%
Seven Pounds 2008 $ 70M 27%
After Earth 2013 $ 60.5M 11%
Collateral Beauty 2016 $ 31M 13%
Gemini Man 2019 $ 48.5M 26%

Sucessos de bilheteria aclamados pela crítica

5 filmes
Avaliação: 57% - 92%
Bilheteria: $204,3M - $355,6M

Esse grupo está no outro extremo em relação ao anterior. Os críticos e fãns concordam que esses são os melhores filmes da carreira do ator.

print_movies(2)
Filme Ano Bilheteria Avaliação
Independence Day 1996 $ 306.2M 67%
Men in Black 1997 $ 250.1M 92%
I Am Legend 2007 $ 256.4M 68%
Aladdin 2019 $ 355.6M 57%
Bad Boys for Life 2020 $ 204.3M 76%

Sucessos de bilheteria

7 filmes
Avaliação: 36% - 69%
Bilheteria: $144,8M - $227,9M

Grupo dos filmes com ótima bilheteria, mas com avaliações altas e baixas. Quase todos são da década de 2000. Inclui as continuações de Men in Black 2 e 3, que não fizeram tanto sucesso como o primeiro, mas ainda assim tiveram grande bilheteria.

print_movies(3)
Filme Ano Bilheteria Avaliação
Men in Black II 2002 $ 192.4M 39%
I, Robot 2004 $ 144.8M 56%
Shark Tale 2004 $ 160.8M 36%
Hitch 2005 $ 177.6M 69%
The Pursuit of Happyness 2006 $ 162.6M 67%
Hancock 2008 $ 227.9M 41%
Men in Black 3 2012 $ 179M 68%

Crítica ama, público nem tanto

6 filmes
Avaliação: 56% - 88%
Bilheteria: $6,3M - $111,5M

Aqui está incluso o filme de menor bilheteria da carreira do Will Smith, mas que ao mesmo tempo é o seu 2º filme mais bem recebido pela crítica: Six Degrees of Separation.

print_movies(4)
Filme Ano Bilheteria Avaliação
Six Degrees of Separation 1993 $ 6.3M 88%
Enemy of the State 1998 $ 111.5M 72%
Ali 2001 $ 58.2M 68%
Concussion 2015 $ 33.8M 58%
Focus 2015 $ 53.9M 56%
Spies in Disguise 2019 $ 66.7M 76%