Carregando os pacotes
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.0.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2 v purrr 0.3.4
## v tibble 3.0.4 v stringr 1.4.0
## v tidyr 1.1.2 v forcats 0.5.0
## v readr 1.4.0
## Warning: package 'ggplot2' was built under R version 4.0.3
## Warning: package 'tibble' was built under R version 4.0.3
## Warning: package 'tidyr' was built under R version 4.0.3
## Warning: package 'forcats' was built under R version 4.0.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(ggplot2)
library(readr)
library(knitr)
## Warning: package 'knitr' was built under R version 4.0.3
library(ggthemes)
## Warning: package 'ggthemes' was built under R version 4.0.3
Carregando o banco de dados
banco_moma <- read.csv("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", sep = ";", encoding = "UTF-8")
Atividade 1
# Quantas pinturas existem?
paste("Existem", banco_moma %>% nrow(), "pinturas no MoMA")
## [1] "Existem 2253 pinturas no MoMA"
# Quantas variáveis?
paste("Existem", banco_moma %>% ncol(), "variáveis no banco de pinturas do MoMA. São elas:")
## [1] "Existem 24 variáveis no banco de pinturas do MoMA. São elas:"
cat(names(banco_moma))
## X title artist artist_bio artist_birth_year artist_death_year num_artists n_female_artists n_male_artists artist_gender year_acquired year_created circumference_cm depth_cm diameter_cm height_cm length_cm width_cm seat_height_cm purchase gift exchange classification department
paste("Entretanto, 5 delas estão vazias. Logo, somente podemos trabalhar com 19 variáveis")
## [1] "Entretanto, 5 delas estão vazias. Logo, somente podemos trabalhar com 19 variáveis"
Atividade 2
# Qual a primeira pintura adquirida pelo MoMA?
paste("O MoMA possui",
banco_moma %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
nrow(),
"quadros como os mais antigos. Ambos são do mesmo ano:",
banco_moma %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
filter(row_number() == 1) %>%
pull(year_acquired))
## [1] "O MoMA possui 2 quadros como os mais antigos. Ambos são do mesmo ano: 1930"
# Quais os tÃtulos?
cat("Os tÃtulos dessas obras são:",
banco_moma %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(title) %>%
first(),
"e",
banco_moma %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(title) %>%
last(),
", pertencentes respectivamente a",
banco_moma %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(artist) %>%
first(),
"e",
banco_moma %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(artist) %>%
last())
## Os tÃtulos dessas obras são: House by the Railroad e Seated Nude , pertencentes respectivamente a Edward Hopper e Bernard Karfiol
Atividade 3
cat(paste("A obra mais antiga (em ano de criação) no MoMA é do ano de",
min(banco_moma$year_created, na.rm = T),
", feita por",
banco_moma %>%
filter(year_created == min(year_created, na.rm = T)) %>%
pull(artist),
"e entitulada",
banco_moma %>%
filter(year_created == min(year_created, na.rm = T)) %>%
pull(title)))
## A obra mais antiga (em ano de criação) no MoMA é do ano de 1872 , feita por Odilon Redon e entitulada Landscape at Daybreak
Atividade 4
# Quantos artistas distintos existem?
paste("Existem ",
banco_moma %>%
count(artist) %>%
count() %>%
pull(n),
"artistas diferentes no MoMA.")
## [1] "Existem 989 artistas diferentes no MoMA."
Atividade 5 e 6
# Qual artista tem mais pinturas na coleção?
paste(banco_moma %>%
count(artist) %>%
arrange(-n) %>%
pull(artist) %>%
first(),
"é o artista com mais obras na coleção, totalizando",
banco_moma %>%
count(artist) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"obras.")
## [1] "Pablo Picasso é o artista com mais obras na coleção, totalizando 55 obras."
Atividade 7
# Quantas obras existem por gênero?
banco_moma %>%
count(artist_gender) %>%
mutate(n = as.character(paste(n, "pinturas"))) %>%
kable()
| Female |
252 pinturas |
| Male |
1991 pinturas |
| NA |
10 pinturas |
Atividade 8
# Quantos artistas existem em cada gênero?
banco_moma %>%
count(artist_gender, artist) %>%
count(artist_gender) %>%
mutate(n = as.character(paste(n, "artistas"))) %>%
kable()
| Female |
143 artistas |
| Male |
837 artistas |
| NA |
9 artistas |
Atividade 9
# Em que ano foram adquiridas mais pinturas?
paste("Foram adquiridas",
banco_moma %>%
count(year_acquired) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"obras no ano de",
banco_moma %>%
count(year_acquired) %>%
arrange(-n) %>%
pull(year_acquired) %>%
first())
## [1] "Foram adquiridas 86 obras no ano de 1985"
Atividade 10
# Em que ano foram criadas mais pinturas?
paste("Foram criadas",
banco_moma %>%
count(year_created) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"obras no ano de",
banco_moma %>%
count(year_created) %>%
arrange(-n) %>%
pull(year_created) %>%
first())
## [1] "Foram criadas 57 obras no ano de 1977"
Atividade 11
# Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual tÃtulo?
paste("A primeira pintura de uma artista feminina foi adquirida em",
banco_moma %>%
filter(artist_gender == "Female") %>%
arrange(year_acquired) %>%
pull(year_acquired) %>%
first(),
"e foi feita por",
banco_moma %>%
filter(artist_gender == "Female") %>%
arrange(year_acquired) %>%
pull(artist) %>%
first(),
". Tem como tÃtulo",
banco_moma %>%
filter(artist_gender == "Female") %>%
arrange(year_acquired) %>%
pull(title) %>%
first(),
"e foi criada em",
banco_moma %>%
filter(artist_gender == "Female") %>%
arrange(year_acquired) %>%
pull(year_created) %>%
first())
## [1] "A primeira pintura de uma artista feminina foi adquirida em 1937 e foi feita por Natalia Goncharova . Tem como tÃtulo Landscape, 47 e foi criada em 1912"
Atividade 12
# Artista mais tempo vivo
paste("O artista que ficou mais tempo vivo foi",
banco_moma %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
arrange(-idade) %>%
pull(artist) %>%
first(),
"que viveu por",
banco_moma %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
arrange(-idade) %>%
pull(idade) %>%
first(),
"anos.")
## [1] "O artista que ficou mais tempo vivo foi Dorothea Tanning que viveu por 102 anos."
Atividade 13
paste("A idade média de um artista do MoMa é de",
banco_moma %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
summarise(media = mean(idade, na.rm = T)) %>%
pull(media) %>%
format(., digits = 1),
"anos.")
## [1] "A idade média de um artista do MoMa é de 75 anos."
Atividade 14
# Artistas homens vivem mais que mulheres?
banco_moma %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
group_by(artist_gender) %>%
summarise(media = mean(idade, na.rm = T)) %>%
mutate(media = format(media, digits = 3)) %>%
kable()
## `summarise()` ungrouping output (override with `.groups` argument)
| Female |
74.0 |
| Male |
74.7 |
| NA |
72.0 |
Desafio: recria o gráfico fivethirtyeight
banco_moma %>%
mutate(height_cm = as.double(str_replace_all(height_cm, ",", ".")),
width_cm = as.double(str_replace_all(width_cm, ",", "."))) %>%
filter(height_cm < 600, width_cm < 760) %>%
mutate(hw_ratio = height_cm / width_cm,
hw_cat = case_when(hw_ratio > 1 ~ "mais alto que largo",
hw_ratio < 1 ~ "mais largo que alto",
hw_ratio == 1 ~ "quadrado perfeito"
)) %>%
ggplot(aes(x = width_cm, y = height_cm, colour = hw_cat)) +
geom_point(alpha = .5) +
ggtitle("Pinturas do MoMA, altas e largas") +
scale_colour_manual(name = "",
values = c("gray50", "#FF9900", "#B14CF0")) +
theme_fivethirtyeight() +
theme(axis.title = element_text()) +
labs(x = "Largura", y = "Altura")
