Carregar pacotes adicionais
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Carregar base de dados
library(readr)
Banco_Moma <- read_delim("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", delim = ";")
## Warning: Missing column names filled in: 'X1' [1]
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## title = col_character(),
## artist = col_character(),
## artist_bio = col_character(),
## artist_gender = col_character(),
## circumference_cm = col_logical(),
## depth_cm = col_number(),
## diameter_cm = col_logical(),
## height_cm = col_number(),
## length_cm = col_logical(),
## width_cm = col_number(),
## seat_height_cm = col_logical(),
## purchase = col_logical(),
## gift = col_logical(),
## exchange = col_logical(),
## classification = col_character(),
## department = col_character()
## )
## i Use `spec()` for the full column specifications.
Quantas pinturas existem no MoMA?
Banco_Moma %>% group_by(classification) %>% summarise(tamanho=n())
## # A tibble: 1 x 2
## classification tamanho
## <chr> <int>
## 1 Painting 2253
Resposta; Existem 2253 pinturas.
Quantas variáveis existem no banco de dados?
Banco_Moma %>% ncol()
## [1] 24
Existem 24 variáveis nesse banco de dados.
Atividade 2
Qual a primeira pintura adquirida pelo MoMA?
Existem duas obras adquiridas no ano de 1930, não sendo possível determinar qual das duas foi adquirida primeiro.
Qual artista?
As obras foram pintadas pelos artistas Edward Hopper e Bernard Karfiol.
Qual Título?
Estas obras são entituladas House by the Railroad e Seated Nude.
summarise() has grouped output by 'year_acquired'. You can override using the .groups argument.
Atividade 3
Qual é a pintura mais antiga da coleção?
Banco_Moma %>% filter(year_created == min(year_created, na.rm = TRUE)) %>%
group_by(year_created) %>% summarise(year_created,title,artist)
## # A tibble: 1 x 3
## year_created title artist
## <dbl> <chr> <chr>
## 1 1872 Landscape at Daybreak Odilon Redon
A obra mais antiga do MoMa data de 1872. Entitulada de Landscape at Daybreak, foi pintada pelo artista Odilon Redon.
Atividade 4
Quantos artistas distintos existem?
Banco_Moma %>% group_by(artist) %>%
summarise(Contagem = length(unique(artist))) %>% nrow()
## [1] 989
As obras expostas no MoMA foram criadas por 989 artistas diferentes.
Atividade 5
Qual artista tem mais pinturas na coleção?
Banco_Moma %>%
count(artist) %>%
arrange(-n) %>%
pull(artist) %>%
first()
## [1] "Pablo Picasso"
O artista com maior número de obras na coleção é Pablo Picasso.
Atividade 6
Quantas pinturas existem por este artista?
Banco_Moma %>%
count(artist) %>%
arrange(-n) %>%
pull(n) %>%
first()
## [1] 55
Pablo Picasso possui 55 obras na coleção do MoMA.
Atividade 7
Quantas pinturas de artistas masculinos e femininos?
table(Banco_Moma$artist_gender)
##
## Female Male
## 252 1991
Das 2253 obras da coleção, 1191 são assinadas por artistas do sexo masculino e 252 por artistas do sexo feminino. Existem ainda outras 10 obras às quais não foi possível atribuir o gênero do autor.
Atividade 8
Quantos artistas de cada gênero existem?
Banco_Moma %>%
count(artist_gender, artist) %>%
count(artist_gender)
## # A tibble: 3 x 2
## artist_gender n
## <chr> <int>
## 1 Female 143
## 2 Male 837
## 3 <NA> 9
São 837 artistas do sexo masculino, 143 artistas do sexo feminino e outros. Ainda existem na lista outros 9 artistas para os quais não foi possível atribuir gênero.
Atividade 9
Em que ano foram adquiridas mais pinturas?
Banco_Moma %>%
count(year_acquired) %>%
arrange(-n)
## # A tibble: 88 x 2
## year_acquired n
## <dbl> <int>
## 1 1985 86
## 2 1942 71
## 3 1979 71
## 4 1991 67
## 5 2005 67
## 6 1967 65
## 7 2008 55
## 8 1961 45
## 9 1969 45
## 10 1956 42
## # ... with 78 more rows
Foi no ano de 1985, totalizando 86 obras.
Atividade 10
Em que ano foram criadas mais pinturas?
Banco_Moma %>%
count(year_created) %>%
arrange(-n)
## # A tibble: 139 x 2
## year_created n
## <dbl> <int>
## 1 1977 57
## 2 1940 56
## 3 1964 56
## 4 1961 50
## 5 1962 49
## 6 1963 44
## 7 1959 42
## 8 1968 40
## 9 1960 39
## 10 1914 37
## # ... with 129 more rows
Foi no ano de 1977, totalizando 57 obras.
Atividade 11
A - Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)?
B- Quando essa pintura foi criada?
c - Qual artista?
D - Qual título?
Banco_Moma %>% group_by(year_acquired) %>%
filter(year_acquired == min(year_acquired))%>%
filter(artist_gender=="Female") %>%
summarise(year_acquired,title,artist,year_created)
## `summarise()` has grouped output by 'year_acquired'. You can override using the `.groups` argument.
## # A tibble: 252 x 4
## # Groups: year_acquired [68]
## year_acquired title artist year_created
## <dbl> <chr> <chr> <dbl>
## 1 1937 Landscape, 47 "Natalia Goncharova" 1912
## 2 1938 Shack "Loren MacIver" 1934
## 3 1940 Hopscotch "Loren MacIver" 1940
## 4 1941 Shadows with Painting "Irene Rice Pereira" 1940
## 5 1941 Figure "Varvara Stepanova" 1921
## 6 1942 Still Life in Red "Amelia Pel\xe1ez Del ~ 1938
## 7 1942 White Lines "Irene Rice Pereira" 1942
## 8 1942 Musical Squash "Maud Morgan" 1942
## 9 1942 Desolation "Raquel Forner" 1942
## 10 1943 Self-Portrait with Croppe~ "Frida Kahlo" 1940
## # ... with 242 more rows
RESPOSTAS
A - Foi no ano de 1937.
B - A obra foi criada em 1912.
C - A artista criadora da obra foi Natalia Goncharova.
D - A obra foi entitulada Landscape, 47
Atividade 12
Qual o artista ficou mais tempo vivo?
Banco_Moma$idade <- Banco_Moma$artist_death_year - Banco_Moma$artist_birth_year
summary(Banco_Moma$idade)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 27.00 67.00 77.00 74.66 85.00 102.00 629
Foi Dorothea Tanning, que viveu 102 anos.
table(Banco_Moma$idade=="102")
##
## FALSE TRUE
## 1623 1
Banco_Moma %>%
filter(Banco_Moma$idade=="102") %>%
pull(artist) %>%
first()
## [1] "Dorothea Tanning"
Atividade 13
Qual a idade média de um artista?
Banco_Moma %>% summarise(media_idade=mean(idade,na.rm=TRUE))
## # A tibble: 1 x 1
## media_idade
## <dbl>
## 1 74.7
A média de idade dos artistas que possuem obras expostas no MoMA é de 74,7 anos.
Atividade 14
Artistas homens vivem mais do que as mulheres?
Banco_Moma %>% group_by(artist_gender) %>% summarise(media_idade=mean(idade,na.rm=TRUE))
## # A tibble: 3 x 2
## artist_gender media_idade
## <chr> <dbl>
## 1 Female 74.0
## 2 Male 74.7
## 3 <NA> 72
Apesar de uma diferença de apenas 0,7 ano, os artistas do sexo masculino (74,7 anos) apresentam maior longevidade que as artistas do sexo feminino (74,0 anos).
Desafio: recriar o gráfico do fivethirtyeight
moma_dim <- Banco_Moma %>%
filter(height_cm < 600, width_cm < 760) %>%
mutate(hw_ratio = height_cm / width_cm,
hw_cat = case_when(
hw_ratio > 1 ~ "mais alto que largo",
hw_ratio < 1 ~ "mais largo que alto",
hw_ratio == 1 ~ "quadrado perfeito"
))
library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
geom_point(alpha = .5) +
ggtitle("Pinturas do MoMA, altas e largas") +
scale_colour_manual(name = "",
values = c("gray50", "#FF9900", "#B14CF0")) +
theme(axis.title = element_text()) +
labs(x = "Largura", y = "Altura")
