Carregar pacotes adicionais
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Carregar base de dados
library(readr)
Banco_Moma <- read_delim("D:/_Mestrado Civil UFF/Estatistica_Aplicada/Base_de_dados-master/arte_MOMA.csv", delim = ";")
## Warning: Missing column names filled in: 'X1' [1]
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## title = col_character(),
## artist = col_character(),
## artist_bio = col_character(),
## artist_gender = col_character(),
## circumference_cm = col_logical(),
## depth_cm = col_number(),
## diameter_cm = col_logical(),
## height_cm = col_number(),
## length_cm = col_logical(),
## width_cm = col_number(),
## seat_height_cm = col_logical(),
## purchase = col_logical(),
## gift = col_logical(),
## exchange = col_logical(),
## classification = col_character(),
## department = col_character()
## )
## i Use `spec()` for the full column specifications.
Atividade 1
Quantas pinturas existem no MoMA?
Existem 2253 pinturas.
Banco_Moma %>% group_by(classification) %>% summarise(tamanho=n())
## # A tibble: 1 x 2
## classification tamanho
## <chr> <int>
## 1 Painting 2253
Quantas variáveis existem no banco de dados?
Existem 24 variáveis nesse banco de dados.
Banco_Moma %>% ncol()
## [1] 24
Atividade 2
Qual a primeira pintura adquirida pelo MoMA?
Existem duas obras adquiridas no ano de 1930, não sendo possível determinar qual das duas foi adquirida primeiro.
Qual artista?
As obras foram pintadas pelos artistas Edward Hopper e Bernard Karfiol.
Qual Título?
Estas obras são entituladas House by the Railroad e Seated Nude.
Banco_Moma %>% filter(year_acquired == min(year_acquired, na.rm = TRUE)) %>%
group_by(year_acquired) %>% summarise(year_acquired,title,artist)
## `summarise()` has grouped output by 'year_acquired'. You can override using the `.groups` argument.
## # A tibble: 2 x 3
## # Groups: year_acquired [1]
## year_acquired title artist
## <dbl> <chr> <chr>
## 1 1930 House by the Railroad Edward Hopper
## 2 1930 Seated Nude Bernard Karfiol
Atividade 3
Qual é a pintura mais antiga da coleção?
A obra mais antiga do MoMa data de 1872. Entitulada de Landscape at Daybreak, foi pintada pelo artista Odilon Redon.
Banco_Moma %>% filter(year_created == min(year_created, na.rm = TRUE)) %>%
group_by(year_created) %>% summarise(year_created,title,artist)
## # A tibble: 1 x 3
## year_created title artist
## <dbl> <chr> <chr>
## 1 1872 Landscape at Daybreak Odilon Redon
Atividade 4
Quantos artistas distintos existem?
As obras expostas no MoMA foram criadas por 989 artistas diferentes.
Banco_Moma %>% group_by(artist) %>%
summarise(Contagem = length(unique(artist))) %>% nrow()
## [1] 989
Atividade 5
Qual artista tem mais pinturas na coleção?
Atividade 6
Quantas pinturas existem por este artista?
Pablo Picasso possui 55 obras na coleção do MoMA.
Banco_Moma %>%
count(artist) %>%
arrange(-n) %>%
pull(n) %>%
first()
## [1] 55
Atividade 7
Quantas pinturas de artistas masculinos e femininos?
Das 2253 obras da coleção, 1191 são assinadas por artistas do sexo masculino e 252 por artistas do sexo feminino. Existem ainda outras 10 obras às quais não foi possível atribuir o gênero do autor.
table(Banco_Moma$artist_gender)
##
## Female Male
## 252 1991
Atividade 8
Quantos artistas de cada gênero existem?
São 837 artistas do sexo masculino, 143 artistas do sexo feminino e outros. Ainda existem na lista outros 9 artistas para os quais não foi possível atribuir gênero.
Banco_Moma %>%
count(artist_gender, artist) %>%
count(artist_gender)
## # A tibble: 3 x 2
## artist_gender n
## <chr> <int>
## 1 Female 143
## 2 Male 837
## 3 <NA> 9
Atividade 9
Em que ano foram adquiridas mais pinturas?
Foi no ano de 1985, totalizando 86 obras.
Banco_Moma %>%
count(year_acquired) %>%
arrange(-n)
## # A tibble: 88 x 2
## year_acquired n
## <dbl> <int>
## 1 1985 86
## 2 1942 71
## 3 1979 71
## 4 1991 67
## 5 2005 67
## 6 1967 65
## 7 2008 55
## 8 1961 45
## 9 1969 45
## 10 1956 42
## # ... with 78 more rows
Atividade 10
Em que ano foram criadas mais pinturas?
Foi no ano de 1977, totalizando 57 obras.
Banco_Moma %>%
count(year_created) %>%
arrange(-n)
## # A tibble: 139 x 2
## year_created n
## <dbl> <int>
## 1 1977 57
## 2 1940 56
## 3 1964 56
## 4 1961 50
## 5 1962 49
## 6 1963 44
## 7 1959 42
## 8 1968 40
## 9 1960 39
## 10 1914 37
## # ... with 129 more rows
Atividade 11
Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)?
Foi no ano de 1937.
Quando essa pintura foi criada?
A obra foi criada em 1912.
Qual artista?
A artista criadora da obra foi Natalia Goncharova.
Qual título?
A obra foi entitulada Landscape, 47.
Banco_Moma %>% group_by(year_acquired) %>%
filter(year_acquired == min(year_acquired))%>%
filter(artist_gender=="Female") %>%
summarise(year_acquired,title,artist,year_created)
## `summarise()` has grouped output by 'year_acquired'. You can override using the `.groups` argument.
## # A tibble: 252 x 4
## # Groups: year_acquired [68]
## year_acquired title artist year_created
## <dbl> <chr> <chr> <dbl>
## 1 1937 Landscape, 47 "Natalia Goncharova" 1912
## 2 1938 Shack "Loren MacIver" 1934
## 3 1940 Hopscotch "Loren MacIver" 1940
## 4 1941 Shadows with Painting "Irene Rice Pereira" 1940
## 5 1941 Figure "Varvara Stepanova" 1921
## 6 1942 Still Life in Red "Amelia Pel\xe1ez Del ~ 1938
## 7 1942 White Lines "Irene Rice Pereira" 1942
## 8 1942 Musical Squash "Maud Morgan" 1942
## 9 1942 Desolation "Raquel Forner" 1942
## 10 1943 Self-Portrait with Croppe~ "Frida Kahlo" 1940
## # ... with 242 more rows
Atividade 12
Qual o artista ficou mais tempo vivo?
Foi Dorothea Tanning, que viveu 102 anos.
Banco_Moma$idade <- Banco_Moma$artist_death_year - Banco_Moma$artist_birth_year
summary(Banco_Moma$idade)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 27.00 67.00 77.00 74.66 85.00 102.00 629
table(Banco_Moma$idade=="102")
##
## FALSE TRUE
## 1623 1
Banco_Moma %>%
filter(Banco_Moma$idade=="102") %>%
pull(artist) %>%
first()
## [1] "Dorothea Tanning"
Atividade 13
Qual a idade média de um artista?
A média de idade dos artistas que possuem obras expostas no MoMA é de 74,7 anos.
Banco_Moma %>% summarise(media_idade=mean(idade,na.rm=TRUE))
## # A tibble: 1 x 1
## media_idade
## <dbl>
## 1 74.7
Atividade 14
Artistas homens vivem mais do que as mulheres?
Apesar de uma diferença de apenas 0,7 ano, os artistas do sexo masculino (74,7 anos) apresentam maior longevidade que as artistas do sexo feminino (74,0 anos).
Banco_Moma %>% group_by(artist_gender) %>% summarise(media_idade=mean(idade,na.rm=TRUE))
## # A tibble: 3 x 2
## artist_gender media_idade
## <chr> <dbl>
## 1 Female 74.0
## 2 Male 74.7
## 3 <NA> 72
Desafio: recriar o gráfico do fivethirtyeight
moma_dim <- Banco_Moma %>%
filter(height_cm < 600, width_cm < 760) %>%
mutate(hw_ratio = height_cm / width_cm,
hw_cat = case_when(
hw_ratio > 1 ~ "mais alto que largo",
hw_ratio < 1 ~ "mais largo que alto",
hw_ratio == 1 ~ "quadrado perfeito"
))
library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
geom_point(alpha = .5) +
ggtitle("Pinturas do MoMA, altas e largas") +
scale_colour_manual(name = "",
values = c("gray50", "#FF9900", "#B14CF0")) +
theme_fivethirtyeight() +
theme(axis.title = element_text()) +
labs(x = "Largura", y = "Altura")
