Carregando base de dados

library(readr)
Moma <- read_delim("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", delim = ";")

Carregando os pacotes

library(dplyr)
library(ggplot2)
library(ggthemes)

Conheça os seus dados

1- Quantas pinturas existem no MoMA? Quantas variáveis existem no banco de dados?

No MoMA existem 2253 pinturas. E o banco de dados conta com 24 variáveis.

dim(Moma)
## [1] 2253   24
tabela1 <- table(Moma$classification)
tabela1
## 
## Painting 
##     2253

2- Qual é a primeira pintura adquirida pelo MoMA? Qual ano? Qual artista? Qual título?

As duas primeiras pinturas adquiridas pelo MoMA foi em 1930, sendo uma do artista Edward Hopper, com o título House by the Railroad e criada no ano de 1925. A segunda é do artista Bernard Karfiol, nomeada Seated Nude, do ano de 1929.

library(flextable)

Moma %>% filter(year_acquired == min(year_acquired, na.rm = TRUE)) %>%
  group_by(year_acquired) %>% summarise(year_acquired,artist,title,year_created)%>%

flextable()
## `summarise()` has grouped output by 'year_acquired'. You can override using the `.groups` argument.

3- Qual é a pintura mais antiga da coleção? Qual ano? Qual artista? Qual título?

A pintura mais antiga é a Landscape at Daybreak, pintada por Odilon Redon em 1872 e adquirida pelo museu em 2000.

Moma %>% filter(year_created == min(year_created, na.rm = TRUE)) %>%
  group_by(year_created) %>% summarise(year_acquired,artist,title,year_created)%>%
  
  flextable()

Análises descritivas dos dados

4- Quantos artistas distintos existem?

Há 989 artistas distintos.

Moma %>% group_by(artist) %>%
    summarise(Contagem = length(unique(artist))) %>% nrow()
## [1] 989

5- Qual artista tem mais pinturas na coleção?

Pablo Picasso é o artista com mais pinturas.

paste(Moma %>% count(artist) %>% arrange(-n) %>% pull(artist) %>% 
        first(), "é o artista que possui mais pinturas na coleção.")
## [1] "Pablo Picasso é o artista que possui mais pinturas na coleção."

6- Quantas pinturas existem por este artista?

Onde ele possui 55 obras.

Moma %>% count(artist) %>% arrange(-n) 
## # A tibble: 989 x 2
##    artist               n
##    <chr>            <int>
##  1 Pablo Picasso       55
##  2 Henri Matisse       32
##  3 On Kawara           32
##  4 Jacob Lawrence      30
##  5 Batiste Madalena    25
##  6 Jean Dubuffet       25
##  7 Odilon Redon        25
##  8 Ben Vautier         24
##  9 Frank Stella        23
## 10 Philip Guston       23
## # ... with 979 more rows

7- Quantas pinturas de artistas masculinos e femininos?

Entre artistas femininos e masculinos existem 252 e 1991 pinturas, respectivamente.

table(Moma$artist_gender)
## 
## Female   Male 
##    252   1991

Se você quiser mais

8- Quantos artistas de cada gênero existem?

Do gênero feminino existem 143 artistas e do masculino são 837.

Moma %>% group_by(artist_gender) %>% summarise(Contagem = length(unique(artist)))
## # A tibble: 3 x 2
##   artist_gender Contagem
##   <chr>            <int>
## 1 Female             143
## 2 Male               837
## 3 <NA>                 9

9- Em que ano foram adquiridas mais pinturas?

Em 1985 foi o ano que mais adquiram pinturas no MoMA,sendo um total de 86.

Moma %>% count(year_acquired) %>% arrange(-n)
## # A tibble: 88 x 2
##    year_acquired     n
##            <dbl> <int>
##  1          1985    86
##  2          1942    71
##  3          1979    71
##  4          1991    67
##  5          2005    67
##  6          1967    65
##  7          2008    55
##  8          1961    45
##  9          1969    45
## 10          1956    42
## # ... with 78 more rows

10- Em que ano foram criada mais pinturas?

No ano de 1957 foram criadas mais pinturas, totalizando 57.

Moma %>% count(year_created) %>% arrange(-n)
## # A tibble: 139 x 2
##    year_created     n
##           <dbl> <int>
##  1         1977    57
##  2         1940    56
##  3         1964    56
##  4         1961    50
##  5         1962    49
##  6         1963    44
##  7         1959    42
##  8         1968    40
##  9         1960    39
## 10         1914    37
## # ... with 129 more rows

11- Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual título?

Em 1937 foi adquirida a primeira pintura de uma artista feminina, ela foi pintada por Natalia Goncharova em 1912 e foi intitulada como Landscape.

Moma %>% group_by(year_acquired) %>% 
  filter(year_acquired == min(year_acquired))%>% 
  filter(artist_gender=="Female") %>% 
  summarise(year_acquired,title,artist,year_created)
## `summarise()` has grouped output by 'year_acquired'. You can override using the `.groups` argument.
## # A tibble: 252 x 4
## # Groups:   year_acquired [68]
##    year_acquired title                      artist                  year_created
##            <dbl> <chr>                      <chr>                          <dbl>
##  1          1937 Landscape, 47              "Natalia Goncharova"            1912
##  2          1938 Shack                      "Loren MacIver"                 1934
##  3          1940 Hopscotch                  "Loren MacIver"                 1940
##  4          1941 Shadows with Painting      "Irene Rice Pereira"            1940
##  5          1941 Figure                     "Varvara Stepanova"             1921
##  6          1942 Still Life in Red          "Amelia Pel\xe1ez Del ~         1938
##  7          1942 White Lines                "Irene Rice Pereira"            1942
##  8          1942 Musical Squash             "Maud Morgan"                   1942
##  9          1942 Desolation                 "Raquel Forner"                 1942
## 10          1943 Self-Portrait with Croppe~ "Frida Kahlo"                   1940
## # ... with 242 more rows

Mais um desafio

12- Qual o artista ficou mais tempo vivo?

Dorothea Tanning foi a artista que viveu por mais tempo, ela faleceu com 102 anos.

Moma %>% group_by(artist_birth_year) %>% 
  filter(artist_birth_year == max(artist_death_year))%>% 
  summarise(artist,artist_birth_year,artist_death_year)
## `summarise()` has grouped output by 'artist_birth_year'. You can override using the `.groups` argument.
## # A tibble: 0 x 3
## # Groups:   artist_birth_year [0]
## # ... with 3 variables: artist_birth_year <dbl>, artist <chr>,
## #   artist_death_year <dbl>
idade <- (Moma$artist_death_year - Moma$artist_birth_year)
Moma["idade"] <- (Moma$artist_death_year - Moma$artist_birth_year)
Moma %>% select(idade,artist) %>% arrange(desc(idade))
## # A tibble: 2,253 x 2
##    idade artist                   
##    <dbl> <chr>                    
##  1   102 Dorothea Tanning         
##  2   101 Will Barnet              
##  3   101 Clara McDonald Williamson
##  4   101 Theodore Lux Feininger   
##  5    99 Georgia O'Keeffe         
##  6    99 Georgia O'Keeffe         
##  7    99 Enrico Donati            
##  8    99 Enrico Donati            
##  9    99 Georgia O'Keeffe         
## 10    99 Georgia O'Keeffe         
## # ... with 2,243 more rows

13- Qual a idade média de um artista?

A Idade média de um artista é de 74,7.

Moma %>% summarise(media=mean(idade,na.rm=TRUE))
## # A tibble: 1 x 1
##   media
##   <dbl>
## 1  74.7

14- Artistas homens vivem mais do que as mulheres?

De acordo com a média de idade entre homens e mulheres, nota-se que os homens vivem mais que as mulheres.

Moma %>% group_by(artist_gender)%>%
  summarise(media=mean(idade,na.rm=TRUE))
## # A tibble: 3 x 2
##   artist_gender media
##   <chr>         <dbl>
## 1 Female         74.0
## 2 Male           74.7
## 3 <NA>           72

Um último desafio: recriar o gráfico do fivethirtyeight

moma_dim <- Moma %>% 
  filter(height_cm < 600, width_cm < 760) %>% 
  mutate(hw_ratio = height_cm / width_cm,
         hw_cat = case_when(
           hw_ratio > 1 ~ "mais alto que largo",
           hw_ratio < 1 ~ "mais largo que alto",
           hw_ratio == 1 ~ "quadrado perfeito"))

ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5) +
  ggtitle("Pinturas do MoMA, altas e largas") +
  scale_colour_manual(name = "",
                      values = c("royalblue", "orchid", "tomato")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Largura", y = "Altura") 

Considerações finais

Através da análise de dados realizada no Rstudio, nota-se que o MoMA possui um extenso acervo de pinturas, contando com grandes nomes do mundo da arte. Ele tem pinturas criadas desde 1872 até os anos atuais, onde a maioria dos artistas são homens e também são os que possuem mais obras no museu. Dentre eles se destaca Pablo Picasso com a maior quantidade, sendo 55 obras ao todo. Com o gráfico do fivethirtyeight, percebe-se que o número de quadros com a altura e largura perfeita é menor em relação aos que são mais altos que largos e dos que são mais largos do que altos.