Atividade do MoMA

1. Objetivos pedagógicos dessas atividades

Revisar os conceitos de análise bi-variada aprendidas na última aula.
Praticar a utilização de base de dados para extrair informações e conhecer melhor os dados.
Gerar gráficos para variáveis (no ggplot2).

2. Inspiração + dados

Usaremos o banco de dados do Museu de Arte Moderna (MoMA).
Disponível publicamente no GitHub.
Foi analisado por fivethirtyeight.com, Alison Hill e por outros.

3. Pacotes necessários

Vamos usar quatro pacotes do R: readr,dplyr, ggplot2, e ggthemes.
library(dplyr)

library(ggplot2)

4. Carregar os dados

Esses não são os dados originais. A Alison Hill fez um pré-processamento e limpeza de dados. O banco abaixo contém apenas pinturas e desenhos da coleção MoMA.
Use este pedaço de código para ler o banco de dados disponível em https://github.com/DATAUNIRIO/Base_de_dados
library(readr)

Banco_Moma <- read_delim("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", delim = ";")
O banco de dados se chama arte_MOMA.csv e está armazenado no repositório de bases de dados do curso de estatística. Você pode usar esse código se quiser ler o arquivo CSV local.
library(readr)
Banco_Moma <- read_delim(“SEU DIRETÓRIO ATÉ O ARQUIVO/arte_MOMA.csv”, delim = “;”)

5. Conheça os seus dados

Tente responder a todas essas perguntas. (opcional: tente responder todas perguntas usando somente o pacote dplyr).

Atividade 1. Quantas pinturas existem no MoMA? Quantas variáveis existem no banco de dados?

Resposta:

dim(Banco_Moma)
[1] 2253   24
Existem no MoMA 2.253 pinturas e 24 variáveis.

Atividade 2. Qual é a primeira pintura adquirida pelo MoMA? Qual ano? Qual artista? Qual título?

Resposta:

library(flextable)

Banco_Moma %>% filter(year_acquired == min(year_acquired, na.rm = TRUE)) %>%
  group_by(year_acquired) %>% summarise(year_acquired,artist,title) %>% flextable()
No ano de 1.930 foram adquiridas as duas primeiras pinturas pelo MoMA: House by the Railroad e Seated Nude, dos artistas Edward Hopper e Bernard Karfiol, respectivamente.

Atividade 3. Qual é a pintura mais antiga da coleção? Qual ano? Qual artista? Qual título?

Resposta:

Banco_Moma %>% filter(year_created == min(year_created, na.rm = TRUE)) %>% 
  group_by(year_created)  %>% summarise(year_created,artist,title) %>% flextable()
A pintura mais antiga da coleção do MoMA, intitulada Landscape at Daybreak, foi criada por Odilon Redon em 1.872.

6. Análises descritivas dos dados

Atividade 4. Quantos artistas distintos existem?

Resposta:

Banco_Moma$artist<-as.factor(Banco_Moma$artist)

str(Banco_Moma$artist)
 Factor w/ 989 levels "\xc9douard Vuillard",..: 455 728 728 712 97 280 134 752 723 245 ...
Existem 989 artistas distintos no banco de dados do MoMA.

Atividade 5. Qual artista tem mais pinturas na coleção?

Resposta:

summary (Banco_Moma$artist)
                       Pablo Picasso                        Henri Matisse 
                                  55                                   32 
                           On Kawara                       Jacob Lawrence 
                                  32                                   30 
                    Batiste Madalena                        Jean Dubuffet 
                                  25                                   25 
                        Odilon Redon                          Ben Vautier 
                                  25                                   24 
                        Frank Stella                        Philip Guston 
                                  23                                   23 
                        Joan Mir<f3>                      Jackson Pollock 
                                  19                                   18 
                     Gerhard Richter                        Piet Mondrian 
                                  17                                   16 
                         Andy Warhol                     Fernand L<e9>ger 
                                  15                                   15 
                  Giorgio de Chirico                            Paul Klee 
                                  14                                   14 
                   Richard Pettibone                      Ellsworth Kelly 
                                  13                                   12 
                        Jasper Johns                       Sherrie Levine 
                                  12                                   12 
                         Yves Tanguy                         Ad Reinhardt 
                                  11                                   10 
                     Andr<e9> Derain                          Mark Rothko 
                                  10                                   10 
                     Adolph Gottlieb                         Agnes Martin 
                                   9                                    9 
                     Andr<e9> Masson                      Francis Picabia 
                                   9                                    9 
                      Georges Braque                            Max Ernst 
                                   9                                    9 
                     Paul C<e9>zanne                    Robert Motherwell 
                                   9                                    9 
                 Robert Rauschenberg                         Robert Ryman 
                                   9                                    9 
                    Roy Lichtenstein                        Arshile Gorky 
                                   9                                    8 
                    Elizabeth Murray             L<e1>szl<f3> Moholy-Nagy 
                                   8                                    8 
                      Marcel Duchamp                    Morris Hirshfield 
                                   8                                    8 
                    Susan Rothenberg                    Willem de Kooning 
                                   8                                    8 
                             Al Held                            Alex Katz 
                                   7                                    7 
                      Barnett Newman                         Brice Marden 
                                   7                                    7 
                       Edward Ruscha          Joaqu<ed>n Torres-Garc<ed>a 
                                   7                                    7 
                        Josef Albers                     Kazimir Malevich 
                                   7                                    7 
                  Marcel Broodthaers                     Ren<e9> Magritte 
                                   7                                    7 
                 Richard Artschwager                         Sigmar Polke 
                                   7                                    7 
                      Tom Wesselmann                     Umberto Boccioni 
                                   7                                    7 
                    Vasily Kandinsky                        Alfred Jensen 
                                   7                                    6 
                          Cy Twombly               David Alfaro Siqueiros 
                                   6                                    6 
                        Jake Berthot                        Joan Mitchell 
                                   6                                    6 
                         John Walker                           Josh Smith 
                                   6                                    6 
                           Juan Gris                        Loren MacIver 
                                   6                                    6 
                      R. H. Quaytman                        Roberto Matta 
                                   6                                    6 
                        Stuart Davis                   Alberto Giacometti 
                                   6                                    5 
                       Anselm Kiefer                          Chuck Close 
                                   5                                    5 
                        Claude Monet                        Eugene Berman 
                                   5                                    5 
                       Francis Bacon                      Frantisek Kupka 
                                   5                                    5 
                         Franz Kline                         Hans Hofmann 
                                   5                                    5 
                 Helen Frankenthaler                       Jacques Villon 
                                   5                                    5 
                    James Rosenquist                             Jim Dine 
                                   5                                    5 
                           John Kane                         Larry Rivers 
                                   5                                    5 
                         Luc Tuymans                     Lyonel Feininger 
                                   5                                    5 
                         Neil Jenney                          Peter Blume 
                                   5                                    5 
                      Pierre Bonnard                Richard Pousette-Dart 
                                   5                                    5 
                 <c9>douard Vuillard                       Auguste Herbin 
                                   4                                    4 
Balthus (Baltusz Klossowski de Rola)                        Ben Nicholson 
                                   4                                    4 
               Bradley Walker Tomlin                        Chaim Soutine 
                                   4                                    4 
                        Daniel Buren                              (Other) 
                                   4                                 1276 
O artista que tem mais pinturas na coleção é Pablo Picasso.

Atividade 6. Quantas pinturas existem por este artista?

Resposta:

summary (Banco_Moma$artist)
                       Pablo Picasso                        Henri Matisse 
                                  55                                   32 
                           On Kawara                       Jacob Lawrence 
                                  32                                   30 
                    Batiste Madalena                        Jean Dubuffet 
                                  25                                   25 
                        Odilon Redon                          Ben Vautier 
                                  25                                   24 
                        Frank Stella                        Philip Guston 
                                  23                                   23 
                        Joan Mir<f3>                      Jackson Pollock 
                                  19                                   18 
                     Gerhard Richter                        Piet Mondrian 
                                  17                                   16 
                         Andy Warhol                     Fernand L<e9>ger 
                                  15                                   15 
                  Giorgio de Chirico                            Paul Klee 
                                  14                                   14 
                   Richard Pettibone                      Ellsworth Kelly 
                                  13                                   12 
                        Jasper Johns                       Sherrie Levine 
                                  12                                   12 
                         Yves Tanguy                         Ad Reinhardt 
                                  11                                   10 
                     Andr<e9> Derain                          Mark Rothko 
                                  10                                   10 
                     Adolph Gottlieb                         Agnes Martin 
                                   9                                    9 
                     Andr<e9> Masson                      Francis Picabia 
                                   9                                    9 
                      Georges Braque                            Max Ernst 
                                   9                                    9 
                     Paul C<e9>zanne                    Robert Motherwell 
                                   9                                    9 
                 Robert Rauschenberg                         Robert Ryman 
                                   9                                    9 
                    Roy Lichtenstein                        Arshile Gorky 
                                   9                                    8 
                    Elizabeth Murray             L<e1>szl<f3> Moholy-Nagy 
                                   8                                    8 
                      Marcel Duchamp                    Morris Hirshfield 
                                   8                                    8 
                    Susan Rothenberg                    Willem de Kooning 
                                   8                                    8 
                             Al Held                            Alex Katz 
                                   7                                    7 
                      Barnett Newman                         Brice Marden 
                                   7                                    7 
                       Edward Ruscha          Joaqu<ed>n Torres-Garc<ed>a 
                                   7                                    7 
                        Josef Albers                     Kazimir Malevich 
                                   7                                    7 
                  Marcel Broodthaers                     Ren<e9> Magritte 
                                   7                                    7 
                 Richard Artschwager                         Sigmar Polke 
                                   7                                    7 
                      Tom Wesselmann                     Umberto Boccioni 
                                   7                                    7 
                    Vasily Kandinsky                        Alfred Jensen 
                                   7                                    6 
                          Cy Twombly               David Alfaro Siqueiros 
                                   6                                    6 
                        Jake Berthot                        Joan Mitchell 
                                   6                                    6 
                         John Walker                           Josh Smith 
                                   6                                    6 
                           Juan Gris                        Loren MacIver 
                                   6                                    6 
                      R. H. Quaytman                        Roberto Matta 
                                   6                                    6 
                        Stuart Davis                   Alberto Giacometti 
                                   6                                    5 
                       Anselm Kiefer                          Chuck Close 
                                   5                                    5 
                        Claude Monet                        Eugene Berman 
                                   5                                    5 
                       Francis Bacon                      Frantisek Kupka 
                                   5                                    5 
                         Franz Kline                         Hans Hofmann 
                                   5                                    5 
                 Helen Frankenthaler                       Jacques Villon 
                                   5                                    5 
                    James Rosenquist                             Jim Dine 
                                   5                                    5 
                           John Kane                         Larry Rivers 
                                   5                                    5 
                         Luc Tuymans                     Lyonel Feininger 
                                   5                                    5 
                         Neil Jenney                          Peter Blume 
                                   5                                    5 
                      Pierre Bonnard                Richard Pousette-Dart 
                                   5                                    5 
                 <c9>douard Vuillard                       Auguste Herbin 
                                   4                                    4 
Balthus (Baltusz Klossowski de Rola)                        Ben Nicholson 
                                   4                                    4 
               Bradley Walker Tomlin                        Chaim Soutine 
                                   4                                    4 
                        Daniel Buren                              (Other) 
                                   4                                 1276 
Existem 55 pinturas de Pablo Picasso na coleção do MoMA.

Atividade 7. Quantas pinturas de artistas masculinos e femininos?

Resposta:

Banco_Moma$artist_gender<-as.factor(Banco_Moma$artist_gender)

summary(Banco_Moma$artist_gender)
Female   Male   NA's 
   252   1991     10 
Das 2.253 pinturas da coleção, 1.991 têm criadores do gênero masculino, 252 têm criadoras do gênero feminino e 10 têm criadores não informados.

7. Se você quiser mais:

Atividade 8. Quantos artistas de cada gênero existem?

Resposta:

Banco_Moma %>% count(artist_gender, artist) %>% count(artist_gender)
# A tibble: 3 x 2
  artist_gender     n
  <fct>         <int>
1 Female          143
2 Male            837
3 <NA>              9
Existem, nesse banco de dados do MoMA, 837 artistas do gênero masculino, 143 artistas do gênero feminino e 9 artistas cujo gênero não foi informado.

Atividade 9. Em que ano foram adquiridas mais pinturas?

Resposta:

Banco_Moma %>% 
  count(year_acquired) %>% 
  arrange(-n)
# A tibble: 88 x 2
   year_acquired     n
           <dbl> <int>
 1          1985    86
 2          1942    71
 3          1979    71
 4          1991    67
 5          2005    67
 6          1967    65
 7          2008    55
 8          1961    45
 9          1969    45
10          1956    42
# ... with 78 more rows
Em 1985 o maior número de pinturas foi adquirido (86 pinturas).

Atividade 10. Em que ano foram Criada mais pinturas?

Resposta:

Banco_Moma %>% 
  count(year_created) %>% 
  arrange(-n)
# A tibble: 139 x 2
   year_created     n
          <dbl> <int>
 1         1977    57
 2         1940    56
 3         1964    56
 4         1961    50
 5         1962    49
 6         1963    44
 7         1959    42
 8         1968    40
 9         1960    39
10         1914    37
# ... with 129 more rows
Em 1977 o maior número de pinturas foi criado (57 pinturas).

Atividade 11. Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual título?

Resposta:

Banco_Moma %>% group_by(year_acquired) %>% 
  filter(year_acquired == min(year_acquired))%>% 
  filter(artist_gender=="Female") %>% 
  summarise(year_acquired,year_created,artist,title) %>%
  flextable()
A primeira obra adquirida (1937) de uma artista feminina, Landscape,47, foi criada em 1.912 por Natalia Goncharova.

8. Mais um desafio:

Atividade 12. Qual o artista ficou mais tempo vivo?

Resposta:

Banco_Moma$anos_de_vida <- Banco_Moma$artist_death_year - Banco_Moma$artist_birth_year

Banco_Moma %>% group_by(anos_de_vida) %>% 
  filter(anos_de_vida == min(anos_de_vida))%>% 
  summarise(artist,anos_de_vida) %>%
  flextable()
Dorotheaa Tanning foi a artista da base de dados que viveu mais tempo (102 anos).

Atividade 13. Qual a idade média de um artista?

Resposta:

library(dplyr)

library(tidyr)

Banco_Moma <- Banco_Moma %>% drop_na (anos_de_vida)

idade_media_artista <- Banco_Moma %>% select(artist, anos_de_vida) %>% distinct(artist,anos_de_vida) 

summary(idade_media_artista)
                       artist     anos_de_vida   
 <c9>douard Vuillard      :  1   Min.   : 27.00  
 <c9>mile Bernard         :  1   1st Qu.: 66.00  
 <d6>yvind Fahlstr<f6>m   :  1   Median : 76.00  
 A. E. Gallatin           :  1   Mean   : 73.78  
 A.R. Penck (Ralf Winkler):  1   3rd Qu.: 85.00  
 Abraham Rattner          :  1   Max.   :102.00  
 (Other)                  :666                   
A média de idade entre os artistas que têm ano de nascimento e de morte cadastrados no banco de dados é 73,78 anos.

Atividade 14. Artistas homens vivem mais do que as mulheres?

Resposta:

Banco_Moma <- Banco_Moma %>% drop_na (artist_gender)

idade_media_genero <- Banco_Moma %>% select(artist, artist_gender, anos_de_vida) %>% 
  distinct(artist,artist_gender,anos_de_vida) 

idade_media_genero %>% select(artist,artist_gender,anos_de_vida) %>% 
  group_by(artist_gender) %>%
  summarise(média=mean(anos_de_vida))
# A tibble: 2 x 2
  artist_gender média
  <fct>         <dbl>
1 Female         73.9
2 Male           73.8
A média de vida dos artistas do gênero masculino (aproximadamente 73,8 anos) é menor do que a média de idade das artistas do gênero feminino (aproximadamente 73,9 anos), nessa base de dados. Portanto, os artistas homens deste banco de dados vivem, em média, menos do que as artistas mulheres.

9. Um último desafio: recriar o gráfico do fivethirtyeight :

Vamos tentar recriar o diagrama de dispersão do fivethirtyeight chamado MoMA Paintings, Tall and Wide?
Para recriar, algumas coisas a considerar:
Tente filtrar todas as pinturas com altura menor que 600 cm e largura menor que 760 cm.
Se você deseja adicionar cores iguais ao original, precisará criar uma nova variável usando mutate.
moma_dim <- Banco_Moma %>% 
  filter(height_cm < 600, width_cm < 760) %>% 
  mutate(hw_ratio = height_cm / width_cm,
         hw_cat = case_when(
           hw_ratio > 1 ~ "mais alto que largo",
           hw_ratio < 1 ~ "mais largo que alto",
           hw_ratio == 1 ~ "quadrado perfeito"
         ))
library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5) +
  ggtitle("Pinturas do MoMA, altas e largas") +
  scale_colour_manual(name = "",
                      values = c("gray50", "#FF9900", "#B14CF0")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Largura", y = "Altura") 

Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o MOMA a partir dos dados. Qual ideia você passaria?

Resposta:

O presente estudo foi realizado através de análise de do banco de dados do MoMA. Com auxílio do operador pipe e de técnicas de filtragens, conseguiu-se obter relevantes informações a cerca dos dados investigados.
2.253 pinturas e 24 variáveis foram analisadas, sobretudo aquelas referentes ao ano de criação e aquisição das obras, aos títulos, além dos autores, seus gêneros e longevidades.