Carregando a base de dados
library(readr)
arte_MOMA <- read_delim("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", delim = ";")
## Warning: Missing column names filled in: 'X1' [1]
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## title = col_character(),
## artist = col_character(),
## artist_bio = col_character(),
## artist_gender = col_character(),
## circumference_cm = col_logical(),
## depth_cm = col_number(),
## diameter_cm = col_logical(),
## height_cm = col_number(),
## length_cm = col_logical(),
## width_cm = col_number(),
## seat_height_cm = col_logical(),
## purchase = col_logical(),
## gift = col_logical(),
## exchange = col_logical(),
## classification = col_character(),
## department = col_character()
## )
## i Use `spec()` for the full column specifications.
Atividade 6 - Atividades do MoMA
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(ggthemes)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v tibble 3.0.6 v stringr 1.4.0
## v tidyr 1.1.2 v forcats 0.5.1
## v purrr 0.3.4
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
arte_MOMA$artist_gender<-ifelse(arte_MOMA$n_female_artists==0,"masculino","feminino")
summary(arte_MOMA)
## X1 title artist artist_bio
## Min. : 1 Length:2253 Length:2253 Length:2253
## 1st Qu.: 564 Class :character Class :character Class :character
## Median :1127 Mode :character Mode :character Mode :character
## Mean :1127
## 3rd Qu.:1690
## Max. :2253
##
## artist_birth_year artist_death_year num_artists n_female_artists
## Min. :1839 Min. :1890 Min. : 1.000 Min. :0.0000
## 1st Qu.:1890 1st Qu.:1956 1st Qu.: 1.000 1st Qu.:0.0000
## Median :1913 Median :1976 Median : 1.000 Median :0.0000
## Mean :1912 Mean :1975 Mean : 1.009 Mean :0.1136
## 3rd Qu.:1933 3rd Qu.:1996 3rd Qu.: 1.000 3rd Qu.:0.0000
## Max. :1987 Max. :2018 Max. :10.000 Max. :2.0000
## NA's :6 NA's :629 NA's :1
## n_male_artists artist_gender year_acquired year_created
## Min. :0.0000 Length:2253 Min. :1930 Min. :1872
## 1st Qu.:1.0000 Class :character 1st Qu.:1957 1st Qu.:1933
## Median :1.0000 Mode :character Median :1975 Median :1956
## Mean :0.8953 Mean :1976 Mean :1954
## 3rd Qu.:1.0000 3rd Qu.:1996 3rd Qu.:1972
## Max. :9.0000 Max. :2017 Max. :2017
## NA's :9 NA's :5
## circumference_cm depth_cm diameter_cm height_cm
## Mode:logical Min. :0.000e+00 Mode:logical Min. :7.000e+00
## NA's:2253 1st Qu.:0.000e+00 NA's:2253 1st Qu.:4.890e+02
## Median :0.000e+00 Median :1.067e+03
## Mean :3.938e+09 Mean :1.208e+11
## 3rd Qu.:7.500e+01 3rd Qu.:2.185e+03
## Max. :6.096e+11 Max. :3.626e+12
## NA's :1955
## length_cm width_cm seat_height_cm purchase
## Mode:logical Min. :1.000e+01 Mode:logical Mode :logical
## NA's:2253 1st Qu.:4.580e+02 NA's:2253 FALSE:2055
## Median :9.720e+02 TRUE :198
## Mean :1.317e+11
## 3rd Qu.:2.286e+03
## Max. :9.147e+12
##
## gift exchange classification department
## Mode :logical Mode :logical Length:2253 Length:2253
## FALSE:1086 FALSE:2108 Class :character Class :character
## TRUE :1167 TRUE :145 Mode :character Mode :character
##
##
##
##
Quantidade de pinturas
table(arte_MOMA$classification)
##
## Painting
## 2253
1) Quantas pinturas existem no MoMA? Quantas variáveis existem no banco de dados?
Resposta:2253 pinturas
## [1] 24
table(arte_MOMA$classification)
##
## Painting
## 2253
2) Qual é a primeira pintura adquirida pelo MoMA? Qual ano? Qual artista? Qual título?
Resposta:
paste("tratam-se de",
arte_MOMA %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
nrow(),
"foram adquiridas em",
arte_MOMA %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
filter(row_number() == 1) %>%
pull(year_acquired))
## [1] "tratam-se de 2 foram adquiridas em 1930"
cat(" título:",
arte_MOMA %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(title) %>%
first(),
"e",
arte_MOMA %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(title) %>%
last(),
", dos artistas",
arte_MOMA %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(artist) %>%
first(),
"e",
arte_MOMA %>%
filter(year_acquired == min(year_acquired, na.rm = T)) %>%
pull(artist) %>%
last())
## título: House by the Railroad e Seated Nude , dos artistas Edward Hopper e Bernard Karfiol
table(arte_MOMA$year_acquired)
##
## 1930 1931 1932 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946
## 2 2 1 14 22 18 19 8 31 18 39 71 22 17 15 5
## 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962
## 14 11 29 23 27 20 22 30 36 42 18 39 37 34 45 21
## 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978
## 33 36 38 23 65 20 45 37 28 7 16 11 24 19 17 21
## 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994
## 71 20 23 20 30 15 86 15 11 8 7 26 67 30 7 41
## 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
## 13 33 21 26 24 29 11 25 4 27 67 21 13 55 21 18
## 2011 2012 2013 2014 2015 2016 2017
## 27 27 22 20 21 33 17
arte_MOMA[33:33,c("year_acquired","artist","title")]
## # A tibble: 1 x 3
## year_acquired artist title
## <dbl> <chr> <chr>
## 1 1930 Edward Hopper House by the Railroad
arte_MOMA[42:42,c("year_acquired","artist","title")]
## # A tibble: 1 x 3
## year_acquired artist title
## <dbl> <chr> <chr>
## 1 1930 Bernard Karfiol Seated Nude
Gênero dos Artistas mulher x Artistas Homens
table(arte_MOMA$n_female_artists)
##
## 0 1 2
## 1998 254 1
3) Qual é a pintura mais antiga da coleção? Qual ano? Qual artista? Qual título?
cat(paste("A pintura mais antiga da coleção no arte_MOMA é do ano de",
min(arte_MOMA$year_created, na.rm = T),
", do artista",
arte_MOMA %>%
filter(year_created == min(year_created, na.rm = T)) %>%
pull(artist),
"com título",
arte_MOMA %>%
filter(year_created == min(year_created, na.rm = T)) %>%
pull(title)))
## A pintura mais antiga da coleção no arte_MOMA é do ano de 1872 , do artista Odilon Redon com título Landscape at Daybreak
table(arte_MOMA$year_created)
##
## 1872 1875 1879 1882 1883 1885 1886 1887 1888 1889 1890 1891 1892 1893 1894 1895
## 1 6 2 1 2 2 1 2 4 5 2 1 2 3 2 3
## 1896 1897 1898 1899 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911
## 1 2 1 2 6 1 2 1 1 11 6 15 14 12 18 19
## 1912 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1925 1926 1927
## 33 21 37 18 11 14 13 9 11 13 13 11 14 25 23 27
## 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943
## 32 22 21 13 21 13 13 16 15 18 24 26 56 24 31 18
## 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959
## 28 13 22 18 25 32 37 16 27 27 23 28 34 32 26 42
## 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975
## 39 50 49 44 56 36 36 26 40 29 17 13 19 16 26 19
## 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
## 26 57 13 23 10 27 13 13 31 15 12 24 11 12 5 9
## 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
## 9 6 9 5 6 10 4 3 10 8 7 5 6 19 6 4
## 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
## 22 6 4 11 5 13 7 6 2 2
arte_MOMA[697:697,c("year_created","artist","title")]
## # A tibble: 1 x 3
## year_created artist title
## <dbl> <chr> <chr>
## 1 1872 Odilon Redon Landscape at Daybreak
4) Quantos artistas distintos existem?
paste("Tratam-se de:",
arte_MOMA %>%
count(artist) %>%
count() %>%
pull(n),
"artistas distintos no MoMA.")
## [1] "Tratam-se de: 989 artistas distintos no MoMA."
length(unique(arte_MOMA$artist))
## [1] 989
5) Qual artista tem mais pinturas na coleção?
paste(arte_MOMA %>%
count(artist) %>%
arrange(-n) %>%
pull(artist) %>%
first(),
"é aquele que tem mais pinturas na coleção.")
## [1] "Pablo Picasso é aquele que tem mais pinturas na coleção."
sort(table(arte_MOMA$artist),decreasing=TRUE)[1:1]
## Pablo Picasso
## 55
``{r}
### 6) Quantas pinturas existem por este artista?
```r
paste("Existem", arte_MOMA %>%
count(artist) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"Pinturas.")
## [1] "Existem 55 Pinturas."
7) Quantas pinturas de artistas masculinos e femininos?
paste("Existem", arte_MOMA %>%
count(n_female_artists) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"pinturas de artistas masculinos e 255 de pinturas de artistas femininas.")
## [1] "Existem 1998 pinturas de artistas masculinos e 255 de pinturas de artistas femininas."
table(arte_MOMA$artist_gender)
##
## feminino masculino
## 255 1998
8) Quantos artistas de cada gênero existem?
```r
arte_MOMA %>%
count(artist_gender, artist) %>%
count(artist_gender) %>%
mutate(n = as.character(paste(n, "artistas"))) %>%
kable()
feminino |
146 artistas |
masculino |
843 artistas |
9) Em que ano foram adquiridas mais pinturas?
paste("Existem", arte_MOMA %>%
count(year_acquired) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"Pinturas no ano de",
arte_MOMA %>%
count(year_acquired) %>%
arrange(-n) %>%
pull(year_acquired) %>%
first())
## [1] "Existem 86 Pinturas no ano de 1985"
10) Em que ano foram Criada mais pinturas?
paste("Foram criadas", arte_MOMA %>%
count(year_created) %>%
arrange(-n) %>%
pull(n) %>%
first(),
"pinturas no ano de",
arte_MOMA %>%
count(year_created) %>%
arrange(-n) %>%
pull(year_created) %>%
first())
## [1] "Foram criadas 57 pinturas no ano de 1977"
11) Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual título?
table(arte_MOMA$year_acquired,arte_MOMA$artist_gender)
##
## feminino masculino
## 1930 0 2
## 1931 0 2
## 1932 0 1
## 1934 0 14
## 1935 0 22
## 1936 0 18
## 1937 1 18
## 1938 1 7
## 1939 0 31
## 1940 1 17
## 1941 2 37
## 1942 4 67
## 1943 1 21
## 1944 3 14
## 1945 2 13
## 1946 0 5
## 1947 1 13
## 1948 0 11
## 1949 1 28
## 1950 1 22
## 1951 1 26
## 1952 0 20
## 1953 1 21
## 1954 4 26
## 1955 4 32
## 1956 3 39
## 1957 0 18
## 1958 2 37
## 1959 0 37
## 1960 5 29
## 1961 4 41
## 1962 1 20
## 1963 1 32
## 1964 4 32
## 1965 4 34
## 1966 1 22
## 1967 0 65
## 1968 3 17
## 1969 5 40
## 1970 3 34
## 1971 3 25
## 1972 0 7
## 1973 0 16
## 1974 1 10
## 1975 1 23
## 1976 2 17
## 1977 2 15
## 1978 0 21
## 1979 7 64
## 1980 1 19
## 1981 1 22
## 1982 2 18
## 1983 6 24
## 1984 3 12
## 1985 9 77
## 1986 2 13
## 1987 4 7
## 1988 4 4
## 1989 1 6
## 1990 3 23
## 1991 5 62
## 1992 3 27
## 1993 0 7
## 1994 9 32
## 1995 1 12
## 1996 2 31
## 1997 5 16
## 1998 1 25
## 1999 0 24
## 2000 1 28
## 2001 2 9
## 2002 7 18
## 2003 0 4
## 2004 16 11
## 2005 15 52
## 2006 3 18
## 2007 4 9
## 2008 6 49
## 2009 9 12
## 2010 5 13
## 2011 5 22
## 2012 3 24
## 2013 7 15
## 2014 7 13
## 2015 7 14
## 2016 7 26
## 2017 9 8
arte_MOMA %>%
filter(year_acquired=="1937", n_female_artists == "1") %>%
pull(artist) %>%
first()
## [1] "Natalia Goncharova"
arte_MOMA %>%
filter(year_acquired=="1937", n_female_artists == "1") %>%
pull(title) %>%
first()
## [1] "Landscape, 47"
arte_MOMA %>%
filter(year_acquired=="1937", n_female_artists == "1") %>%
pull(year_created) %>%
first()
## [1] 1912
12) Qual o artista ficou mais tempo vivo?
paste("O artista que ficou mais tempo vivo foi",
arte_MOMA %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
arrange(-idade) %>%
pull(artist) %>%
first(),
"que viveu por",
arte_MOMA %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
arrange(-idade) %>%
pull(idade) %>%
first(),
"anos.")
## [1] "O artista que ficou mais tempo vivo foi Dorothea Tanning que viveu por 102 anos."
13) Qual a idade média de um artista?
paste("A idade média de um artista do MoMa é de",
arte_MOMA %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
summarise(media = mean(idade, na.rm = T)) %>%
pull(media) %>%
format(., digits = 1),
"anos.")
## [1] "A idade média de um artista do MoMa é de 75 anos."
14) Artistas homens vivem mais do que as mulheres?
arte_MOMA %>%
mutate(idade = artist_death_year - artist_birth_year) %>%
group_by(artist_gender) %>%
summarise(media = mean(idade, na.rm = T)) %>%
mutate(media = format(media, digits = 3)) %>%
kable()
feminino |
73.9 |
masculino |
74.7 |