Carregando os pacotes

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.0.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.4     v stringr 1.4.0
## v tidyr   1.1.2     v forcats 0.5.0
## v readr   1.4.0
## Warning: package 'ggplot2' was built under R version 4.0.3
## Warning: package 'tibble' was built under R version 4.0.3
## Warning: package 'tidyr' was built under R version 4.0.3
## Warning: package 'forcats' was built under R version 4.0.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(ggplot2)
library(readr)
library(knitr)
## Warning: package 'knitr' was built under R version 4.0.3
library(ggthemes)
## Warning: package 'ggthemes' was built under R version 4.0.3

Carregando o banco de dados

banco_moma <- read.csv("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", sep = ";", encoding = "UTF-8")

Atividade 1

# Quantas pinturas existem?
paste("Existem", banco_moma %>% nrow(), "pinturas no MoMA")
## [1] "Existem 2253 pinturas no MoMA"
# Quantas variáveis?
paste("Existem", banco_moma %>% ncol(), "variáveis no banco de pinturas do MoMA. São elas:")
## [1] "Existem 24 variáveis no banco de pinturas do MoMA. São elas:"
cat(names(banco_moma))
## X title artist artist_bio artist_birth_year artist_death_year num_artists n_female_artists n_male_artists artist_gender year_acquired year_created circumference_cm depth_cm diameter_cm height_cm length_cm width_cm seat_height_cm purchase gift exchange classification department
paste("Entretanto, 5 delas estão vazias. Logo, somente podemos trabalhar com 19 variáveis")
## [1] "Entretanto, 5 delas estão vazias. Logo, somente podemos trabalhar com 19 variáveis"

Atividade 2

# Qual a primeira pintura adquirida pelo MoMA?
paste("O MoMA possui", 
      banco_moma %>% 
        filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
        nrow(), 
      "quadros como os mais antigos. Ambos são do mesmo ano:", 
      banco_moma %>% 
        filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
        filter(row_number() == 1) %>% 
        pull(year_acquired))
## [1] "O MoMA possui 2 quadros como os mais antigos. Ambos são do mesmo ano: 1930"
# Quais os títulos?
cat("Os títulos dessas obras são:", 
    banco_moma %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(title) %>% 
      first(), 
    "e", 
    banco_moma %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(title) %>% 
      last(), 
    ", pertencentes respectivamente a", 
    banco_moma %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(artist) %>% 
      first(), 
    "e", 
    banco_moma %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(artist) %>% 
      last())
## Os títulos dessas obras são: House by the Railroad e Seated Nude , pertencentes respectivamente a Edward Hopper e Bernard Karfiol

Atividade 3

cat(paste("A obra mais antiga (em ano de criação) no MoMA é do ano de", 
      min(banco_moma$year_created, na.rm = T), 
      ", feita por", 
      banco_moma %>% 
        filter(year_created == min(year_created, na.rm = T)) %>% 
        pull(artist), 
      "e entitulada", 
      banco_moma %>% 
        filter(year_created == min(year_created, na.rm = T)) %>% 
        pull(title)))
## A obra mais antiga (em ano de criação) no MoMA é do ano de 1872 , feita por Odilon Redon e entitulada Landscape at Daybreak

Atividade 4

# Quantos artistas distintos existem?

paste("Existem ", 
      banco_moma %>% 
        count(artist) %>% 
        count() %>% 
        pull(n),
      "artistas diferentes no MoMA.")
## [1] "Existem  989 artistas diferentes no MoMA."

Atividade 5 e 6

# Qual artista tem mais pinturas na coleção?

paste(banco_moma %>% 
        count(artist) %>% 
        arrange(-n) %>% 
        pull(artist) %>% 
        first(),
      "é o artista com mais obras na coleção, totalizando",
      banco_moma %>% 
        count(artist) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(),
      "obras.")
## [1] "Pablo Picasso é o artista com mais obras na coleção, totalizando 55 obras."

Atividade 7

# Quantas obras existem por gênero?
banco_moma %>%
  count(artist_gender) %>%
  mutate(n = as.character(paste(n, "pinturas"))) %>% 
  kable() 
artist_gender n
Female 252 pinturas
Male 1991 pinturas
NA 10 pinturas

Atividade 8

# Quantos artistas existem em cada gênero?
banco_moma %>%
  count(artist_gender, artist) %>% 
  count(artist_gender) %>% 
  mutate(n = as.character(paste(n, "artistas"))) %>% 
  kable()
artist_gender n
Female 143 artistas
Male 837 artistas
NA 9 artistas

Atividade 9

# Em que ano foram adquiridas mais pinturas?
paste("Foram adquiridas", 
      banco_moma %>% 
        count(year_acquired) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(), 
      "obras no ano de",
      banco_moma %>% 
        count(year_acquired) %>% 
        arrange(-n) %>% 
        pull(year_acquired) %>% 
        first())
## [1] "Foram adquiridas 86 obras no ano de 1985"

Atividade 10

# Em que ano foram criadas mais pinturas?
paste("Foram criadas", 
      banco_moma %>% 
        count(year_created) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(), 
      "obras no ano de",
      banco_moma %>% 
        count(year_created) %>% 
        arrange(-n) %>% 
        pull(year_created) %>% 
        first())
## [1] "Foram criadas 57 obras no ano de 1977"

Atividade 11

# Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual título?

paste("A primeira pintura de uma artista feminina foi adquirida em",
      banco_moma %>% 
  filter(artist_gender == "Female") %>% 
  arrange(year_acquired) %>% 
  pull(year_acquired) %>% 
  first(), 
  "e foi feita por",
  banco_moma %>% 
  filter(artist_gender == "Female") %>% 
  arrange(year_acquired) %>% 
  pull(artist) %>% 
  first(),
  ". Tem como título",
  banco_moma %>% 
  filter(artist_gender == "Female") %>% 
  arrange(year_acquired) %>% 
  pull(title) %>% 
  first(),
  "e foi criada em",
  banco_moma %>% 
  filter(artist_gender == "Female") %>% 
  arrange(year_acquired) %>% 
  pull(year_created) %>% 
  first())
## [1] "A primeira pintura de uma artista feminina foi adquirida em 1937 e foi feita por Natalia Goncharova . Tem como título Landscape, 47 e foi criada em 1912"

Atividade 12

# Artista mais tempo vivo
paste("O artista que ficou mais tempo vivo foi",
      banco_moma %>% 
        mutate(idade = artist_death_year - artist_birth_year) %>% 
        arrange(-idade) %>% 
        pull(artist) %>% 
        first(),
      "que viveu por",
      banco_moma %>% 
        mutate(idade = artist_death_year - artist_birth_year) %>% 
        arrange(-idade) %>% 
        pull(idade) %>% 
        first(), 
      "anos.")
## [1] "O artista que ficou mais tempo vivo foi Dorothea Tanning que viveu por 102 anos."

Atividade 13

paste("A idade média de um artista do MoMa é de",
      banco_moma %>% 
        mutate(idade = artist_death_year - artist_birth_year) %>% 
        summarise(media = mean(idade, na.rm = T)) %>% 
        pull(media) %>% 
        format(., digits = 1),
      "anos.")
## [1] "A idade média de um artista do MoMa é de 75 anos."

Atividade 14

# Artistas homens vivem mais que mulheres?
banco_moma %>%
  mutate(idade = artist_death_year - artist_birth_year) %>%
  group_by(artist_gender) %>%
  summarise(media = mean(idade, na.rm = T)) %>% 
  mutate(media = format(media, digits = 3)) %>% 
  kable()
## `summarise()` ungrouping output (override with `.groups` argument)
artist_gender media
Female 74.0
Male 74.7
NA 72.0

Desafio: recria o gráfico fivethirtyeight

banco_moma %>% 
  mutate(height_cm = as.double(str_replace_all(height_cm, ",", ".")),
         width_cm = as.double(str_replace_all(width_cm, ",", "."))) %>% 
  filter(height_cm < 600, width_cm < 760) %>% 
  mutate(hw_ratio = height_cm / width_cm,
         hw_cat = case_when(hw_ratio > 1 ~ "mais alto que largo",
           hw_ratio < 1 ~ "mais largo que alto",
           hw_ratio == 1 ~ "quadrado perfeito"
         )) %>% 
  ggplot(aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5) +
  ggtitle("Pinturas do MoMA, altas e largas") +
  scale_colour_manual(name = "",
                      values = c("gray50", "#FF9900", "#B14CF0")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Largura", y = "Altura")