• Carregando a base de dados
  • Atividade 6 - Atividades do MoMA
    • Quantidade de pinturas
    • 1) Quantas pinturas existem no MoMA? Quantas variáveis existem no banco de dados?
    • Resposta:2253 pinturas
    • 2) Qual é a primeira pintura adquirida pelo MoMA? Qual ano? Qual artista? Qual título?
    • Resposta:
    • Gênero dos Artistas mulher x Artistas Homens
    • 3) Qual é a pintura mais antiga da coleção? Qual ano? Qual artista? Qual título?
    • 4) Quantos artistas distintos existem?
    • 5) Qual artista tem mais pinturas na coleção?
    • 7) Quantas pinturas de artistas masculinos e femininos?
    • 8) Quantos artistas de cada gênero existem?
    • 9) Em que ano foram adquiridas mais pinturas?
    • 10) Em que ano foram Criada mais pinturas?
    • 11) Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual título?
    • 12) Qual o artista ficou mais tempo vivo?
    • 13) Qual a idade média de um artista?
    • 14) Artistas homens vivem mais do que as mulheres?
  • recriar o gráfico do fivethirtyeight

Carregando a base de dados

library(readr)
arte_MOMA <- read_delim("https://raw.githubusercontent.com/DATAUNIRIO/Base_de_dados/master/arte_MOMA.csv", delim = ";")
## Warning: Missing column names filled in: 'X1' [1]
## 
## -- Column specification --------------------------------------------------------
## cols(
##   .default = col_double(),
##   title = col_character(),
##   artist = col_character(),
##   artist_bio = col_character(),
##   artist_gender = col_character(),
##   circumference_cm = col_logical(),
##   depth_cm = col_number(),
##   diameter_cm = col_logical(),
##   height_cm = col_number(),
##   length_cm = col_logical(),
##   width_cm = col_number(),
##   seat_height_cm = col_logical(),
##   purchase = col_logical(),
##   gift = col_logical(),
##   exchange = col_logical(),
##   classification = col_character(),
##   department = col_character()
## )
## i Use `spec()` for the full column specifications.

Atividade 6 - Atividades do MoMA

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(ggthemes)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v tibble  3.0.6     v stringr 1.4.0
## v tidyr   1.1.2     v forcats 0.5.1
## v purrr   0.3.4
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(knitr)
arte_MOMA$artist_gender<-ifelse(arte_MOMA$n_female_artists==0,"masculino","feminino")

summary(arte_MOMA)
##        X1          title              artist           artist_bio       
##  Min.   :   1   Length:2253        Length:2253        Length:2253       
##  1st Qu.: 564   Class :character   Class :character   Class :character  
##  Median :1127   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :1127                                                           
##  3rd Qu.:1690                                                           
##  Max.   :2253                                                           
##                                                                         
##  artist_birth_year artist_death_year  num_artists     n_female_artists
##  Min.   :1839      Min.   :1890      Min.   : 1.000   Min.   :0.0000  
##  1st Qu.:1890      1st Qu.:1956      1st Qu.: 1.000   1st Qu.:0.0000  
##  Median :1913      Median :1976      Median : 1.000   Median :0.0000  
##  Mean   :1912      Mean   :1975      Mean   : 1.009   Mean   :0.1136  
##  3rd Qu.:1933      3rd Qu.:1996      3rd Qu.: 1.000   3rd Qu.:0.0000  
##  Max.   :1987      Max.   :2018      Max.   :10.000   Max.   :2.0000  
##  NA's   :6         NA's   :629       NA's   :1                        
##  n_male_artists   artist_gender      year_acquired   year_created 
##  Min.   :0.0000   Length:2253        Min.   :1930   Min.   :1872  
##  1st Qu.:1.0000   Class :character   1st Qu.:1957   1st Qu.:1933  
##  Median :1.0000   Mode  :character   Median :1975   Median :1956  
##  Mean   :0.8953                      Mean   :1976   Mean   :1954  
##  3rd Qu.:1.0000                      3rd Qu.:1996   3rd Qu.:1972  
##  Max.   :9.0000                      Max.   :2017   Max.   :2017  
##                                      NA's   :9      NA's   :5     
##  circumference_cm    depth_cm         diameter_cm      height_cm        
##  Mode:logical     Min.   :0.000e+00   Mode:logical   Min.   :7.000e+00  
##  NA's:2253        1st Qu.:0.000e+00   NA's:2253      1st Qu.:4.890e+02  
##                   Median :0.000e+00                  Median :1.067e+03  
##                   Mean   :3.938e+09                  Mean   :1.208e+11  
##                   3rd Qu.:7.500e+01                  3rd Qu.:2.185e+03  
##                   Max.   :6.096e+11                  Max.   :3.626e+12  
##                   NA's   :1955                                          
##  length_cm         width_cm         seat_height_cm  purchase      
##  Mode:logical   Min.   :1.000e+01   Mode:logical   Mode :logical  
##  NA's:2253      1st Qu.:4.580e+02   NA's:2253      FALSE:2055     
##                 Median :9.720e+02                  TRUE :198      
##                 Mean   :1.317e+11                                 
##                 3rd Qu.:2.286e+03                                 
##                 Max.   :9.147e+12                                 
##                                                                   
##     gift          exchange       classification      department       
##  Mode :logical   Mode :logical   Length:2253        Length:2253       
##  FALSE:1086      FALSE:2108      Class :character   Class :character  
##  TRUE :1167      TRUE :145       Mode  :character   Mode  :character  
##                                                                       
##                                                                       
##                                                                       
## 

Quantidade de pinturas

table(arte_MOMA$classification) 
## 
## Painting 
##     2253

1) Quantas pinturas existem no MoMA? Quantas variáveis existem no banco de dados?

Resposta:2253 pinturas

NCOL(arte_MOMA)
## [1] 24
table(arte_MOMA$classification)
## 
## Painting 
##     2253

2) Qual é a primeira pintura adquirida pelo MoMA? Qual ano? Qual artista? Qual título?

Resposta:

paste("tratam-se de", 
     arte_MOMA %>% 
        filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
        nrow(), 
      "foram adquiridas em", 
      arte_MOMA %>% 
        filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
        filter(row_number() == 1) %>% 
        pull(year_acquired))
## [1] "tratam-se de 2 foram adquiridas em 1930"
cat(" título:", 
    arte_MOMA %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(title) %>% 
      first(), 
    "e", 
    arte_MOMA %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(title) %>% 
      last(), 
    ", dos artistas", 
    arte_MOMA %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(artist) %>% 
      first(), 
    "e", 
    arte_MOMA %>% 
      filter(year_acquired == min(year_acquired, na.rm = T)) %>% 
      pull(artist) %>% 
      last())
##  título: House by the Railroad e Seated Nude , dos artistas Edward Hopper e Bernard Karfiol
table(arte_MOMA$year_acquired)
## 
## 1930 1931 1932 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 
##    2    2    1   14   22   18   19    8   31   18   39   71   22   17   15    5 
## 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 
##   14   11   29   23   27   20   22   30   36   42   18   39   37   34   45   21 
## 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 
##   33   36   38   23   65   20   45   37   28    7   16   11   24   19   17   21 
## 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 
##   71   20   23   20   30   15   86   15   11    8    7   26   67   30    7   41 
## 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 
##   13   33   21   26   24   29   11   25    4   27   67   21   13   55   21   18 
## 2011 2012 2013 2014 2015 2016 2017 
##   27   27   22   20   21   33   17
arte_MOMA[33:33,c("year_acquired","artist","title")]
## # A tibble: 1 x 3
##   year_acquired artist        title                
##           <dbl> <chr>         <chr>                
## 1          1930 Edward Hopper House by the Railroad
arte_MOMA[42:42,c("year_acquired","artist","title")]
## # A tibble: 1 x 3
##   year_acquired artist          title      
##           <dbl> <chr>           <chr>      
## 1          1930 Bernard Karfiol Seated Nude

Gênero dos Artistas mulher x Artistas Homens

table(arte_MOMA$n_female_artists) 
## 
##    0    1    2 
## 1998  254    1

3) Qual é a pintura mais antiga da coleção? Qual ano? Qual artista? Qual título?

cat(paste("A pintura mais antiga da coleção no arte_MOMA é do ano de", 
      min(arte_MOMA$year_created, na.rm = T), 
      ", do artista", 
      arte_MOMA %>% 
        filter(year_created == min(year_created, na.rm = T)) %>% 
        pull(artist), 
      "com título", 
      arte_MOMA %>% 
        filter(year_created == min(year_created, na.rm = T)) %>% 
        pull(title)))
## A pintura mais antiga da coleção no arte_MOMA é do ano de 1872 , do artista Odilon Redon com título Landscape at Daybreak
table(arte_MOMA$year_created)
## 
## 1872 1875 1879 1882 1883 1885 1886 1887 1888 1889 1890 1891 1892 1893 1894 1895 
##    1    6    2    1    2    2    1    2    4    5    2    1    2    3    2    3 
## 1896 1897 1898 1899 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 
##    1    2    1    2    6    1    2    1    1   11    6   15   14   12   18   19 
## 1912 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1925 1926 1927 
##   33   21   37   18   11   14   13    9   11   13   13   11   14   25   23   27 
## 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 
##   32   22   21   13   21   13   13   16   15   18   24   26   56   24   31   18 
## 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 
##   28   13   22   18   25   32   37   16   27   27   23   28   34   32   26   42 
## 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 
##   39   50   49   44   56   36   36   26   40   29   17   13   19   16   26   19 
## 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 
##   26   57   13   23   10   27   13   13   31   15   12   24   11   12    5    9 
## 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 
##    9    6    9    5    6   10    4    3   10    8    7    5    6   19    6    4 
## 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 
##   22    6    4   11    5   13    7    6    2    2
arte_MOMA[697:697,c("year_created","artist","title")]
## # A tibble: 1 x 3
##   year_created artist       title                
##          <dbl> <chr>        <chr>                
## 1         1872 Odilon Redon Landscape at Daybreak

4) Quantos artistas distintos existem?

paste("Tratam-se de:", 
      arte_MOMA %>% 
        count(artist) %>% 
        count() %>% 
        pull(n),
      "artistas distintos no MoMA.")
## [1] "Tratam-se de: 989 artistas distintos no MoMA."
length(unique(arte_MOMA$artist))
## [1] 989

5) Qual artista tem mais pinturas na coleção?

paste(arte_MOMA %>% 
        count(artist) %>% 
        arrange(-n) %>% 
        pull(artist) %>% 
        first(),
      "é aquele que tem mais pinturas na coleção.")
## [1] "Pablo Picasso é aquele que tem mais pinturas na coleção."
sort(table(arte_MOMA$artist),decreasing=TRUE)[1:1]
## Pablo Picasso 
##            55

``{r}



### 6) Quantas pinturas existem por este artista?


```r
paste("Existem", arte_MOMA %>% 
        count(artist) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(),
      "Pinturas.")
## [1] "Existem 55 Pinturas."

7) Quantas pinturas de artistas masculinos e femininos?

paste("Existem", arte_MOMA %>% 
        count(n_female_artists) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(),
      "pinturas de artistas masculinos e 255 de pinturas de artistas femininas.")
## [1] "Existem 1998 pinturas de artistas masculinos e 255 de pinturas de artistas femininas."
table(arte_MOMA$artist_gender)
## 
##  feminino masculino 
##       255      1998

8) Quantos artistas de cada gênero existem?


```r
arte_MOMA %>%
  count(artist_gender, artist) %>% 
  count(artist_gender) %>% 
  mutate(n = as.character(paste(n, "artistas"))) %>% 
  kable()
artist_gender n
feminino 146 artistas
masculino 843 artistas

9) Em que ano foram adquiridas mais pinturas?

paste("Existem", arte_MOMA %>% 
        count(year_acquired) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(),
      "Pinturas no ano de",
      arte_MOMA %>% 
        count(year_acquired) %>% 
        arrange(-n) %>% 
        pull(year_acquired) %>% 
        first())
## [1] "Existem 86 Pinturas no ano de 1985"

10) Em que ano foram Criada mais pinturas?

paste("Foram criadas", arte_MOMA %>% 
        count(year_created) %>% 
        arrange(-n) %>% 
        pull(n) %>% 
        first(),
      "pinturas no ano de",
       arte_MOMA %>% 
        count(year_created) %>% 
        arrange(-n) %>% 
        pull(year_created) %>% 
        first())
## [1] "Foram criadas 57 pinturas no ano de 1977"

11) Em que ano foi adquirida a primeira pintura de uma artista feminina (solo)? Quando essa pintura foi criada? Qual artista? Qual título?

table(arte_MOMA$year_acquired,arte_MOMA$artist_gender)
##       
##        feminino masculino
##   1930        0         2
##   1931        0         2
##   1932        0         1
##   1934        0        14
##   1935        0        22
##   1936        0        18
##   1937        1        18
##   1938        1         7
##   1939        0        31
##   1940        1        17
##   1941        2        37
##   1942        4        67
##   1943        1        21
##   1944        3        14
##   1945        2        13
##   1946        0         5
##   1947        1        13
##   1948        0        11
##   1949        1        28
##   1950        1        22
##   1951        1        26
##   1952        0        20
##   1953        1        21
##   1954        4        26
##   1955        4        32
##   1956        3        39
##   1957        0        18
##   1958        2        37
##   1959        0        37
##   1960        5        29
##   1961        4        41
##   1962        1        20
##   1963        1        32
##   1964        4        32
##   1965        4        34
##   1966        1        22
##   1967        0        65
##   1968        3        17
##   1969        5        40
##   1970        3        34
##   1971        3        25
##   1972        0         7
##   1973        0        16
##   1974        1        10
##   1975        1        23
##   1976        2        17
##   1977        2        15
##   1978        0        21
##   1979        7        64
##   1980        1        19
##   1981        1        22
##   1982        2        18
##   1983        6        24
##   1984        3        12
##   1985        9        77
##   1986        2        13
##   1987        4         7
##   1988        4         4
##   1989        1         6
##   1990        3        23
##   1991        5        62
##   1992        3        27
##   1993        0         7
##   1994        9        32
##   1995        1        12
##   1996        2        31
##   1997        5        16
##   1998        1        25
##   1999        0        24
##   2000        1        28
##   2001        2         9
##   2002        7        18
##   2003        0         4
##   2004       16        11
##   2005       15        52
##   2006        3        18
##   2007        4         9
##   2008        6        49
##   2009        9        12
##   2010        5        13
##   2011        5        22
##   2012        3        24
##   2013        7        15
##   2014        7        13
##   2015        7        14
##   2016        7        26
##   2017        9         8
arte_MOMA %>%
  filter(year_acquired=="1937", n_female_artists == "1") %>% 
  pull(artist) %>% 
  first()
## [1] "Natalia Goncharova"
arte_MOMA %>%
  filter(year_acquired=="1937", n_female_artists == "1") %>% 
  pull(title) %>% 
  first()
## [1] "Landscape, 47"
arte_MOMA %>%
  filter(year_acquired=="1937", n_female_artists == "1") %>% 
  pull(year_created) %>% 
  first()
## [1] 1912

12) Qual o artista ficou mais tempo vivo?

paste("O artista que ficou mais tempo vivo foi",
      arte_MOMA %>% 
        mutate(idade = artist_death_year - artist_birth_year) %>% 
        arrange(-idade) %>% 
        pull(artist) %>% 
        first(),
      "que viveu por",
      arte_MOMA %>% 
        mutate(idade = artist_death_year - artist_birth_year) %>% 
        arrange(-idade) %>% 
        pull(idade) %>% 
        first(), 
      "anos.")
## [1] "O artista que ficou mais tempo vivo foi Dorothea Tanning que viveu por 102 anos."

13) Qual a idade média de um artista?

paste("A idade média de um artista do MoMa é de",
      arte_MOMA %>% 
        mutate(idade = artist_death_year - artist_birth_year) %>% 
        summarise(media = mean(idade, na.rm = T)) %>% 
        pull(media) %>% 
        format(., digits = 1),
      "anos.")
## [1] "A idade média de um artista do MoMa é de 75 anos."

14) Artistas homens vivem mais do que as mulheres?

arte_MOMA %>%
  mutate(idade = artist_death_year - artist_birth_year) %>%
  group_by(artist_gender) %>%
  summarise(media = mean(idade, na.rm = T)) %>% 
  mutate(media = format(media, digits = 3)) %>% 
  kable()
artist_gender media
feminino 73.9
masculino 74.7

recriar o gráfico do fivethirtyeight

moma_dim <- arte_MOMA %>% 
  filter(height_cm < 600, width_cm < 760) %>% 
  mutate(hw_ratio = height_cm / width_cm,
         hw_cat = case_when(
           hw_ratio > 1 ~ "mais alto que largo",
           hw_ratio < 1 ~ "mais largo que alto",
           hw_ratio == 1 ~ "quadrado perfeito"
         ))
library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5) +
  ggtitle("Pinturas do MoMA, altas e largas") +
  scale_colour_manual(name = "",
                      values = c("#25a308", "#f51d8d", "yellow")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Largura", y = "Altura")