Import data

# excel file
data <- read_excel("../00_data/my data q&a.xlsx")
data
## # A tibble: 269,732 × 15
##       id name     sex   age   height weight team  noc   games  year season city 
##    <dbl> <chr>    <chr> <chr> <chr>  <chr>  <chr> <chr> <chr> <dbl> <chr>  <chr>
##  1     1 A Dijia… M     24    180    80     China CHN   1992…  1992 Summer Barc…
##  2     2 A Lamusi M     23    170    60     China CHN   2012…  2012 Summer Lond…
##  3     3 Gunnar … M     24    NA     NA     Denm… DEN   1920…  1920 Summer Antw…
##  4     4 Edgar L… M     34    NA     NA     Denm… DEN   1900…  1900 Summer Paris
##  5     5 Christi… F     21    185    82     Neth… NED   1988…  1988 Winter Calg…
##  6     5 Christi… F     21    185    82     Neth… NED   1988…  1988 Winter Calg…
##  7     5 Christi… F     25    185    82     Neth… NED   1992…  1992 Winter Albe…
##  8     5 Christi… F     25    185    82     Neth… NED   1992…  1992 Winter Albe…
##  9     5 Christi… F     27    185    82     Neth… NED   1994…  1994 Winter Lill…
## 10     5 Christi… F     27    185    82     Neth… NED   1994…  1994 Winter Lill…
## # ℹ 269,722 more rows
## # ℹ 3 more variables: sport <chr>, event <chr>, medal <chr>

Apply the following dplyr verbs to your data

Filter rows

filter(data, season== "Summer")
## # A tibble: 221,166 × 15
##       id name     sex   age   height weight team  noc   games  year season city 
##    <dbl> <chr>    <chr> <chr> <chr>  <chr>  <chr> <chr> <chr> <dbl> <chr>  <chr>
##  1     1 "A Diji… M     24    180    80     China CHN   1992…  1992 Summer Barc…
##  2     2 "A Lamu… M     23    170    60     China CHN   2012…  2012 Summer Lond…
##  3     3 "Gunnar… M     24    NA     NA     Denm… DEN   1920…  1920 Summer Antw…
##  4     4 "Edgar … M     34    NA     NA     Denm… DEN   1900…  1900 Summer Paris
##  5     8 "Cornel… F     18    168    NA     Neth… NED   1932…  1932 Summer Los …
##  6     8 "Cornel… F     18    168    NA     Neth… NED   1932…  1932 Summer Los …
##  7    10 "Einar … M     26    NA     NA     Finl… FIN   1952…  1952 Summer Hels…
##  8    12 "Jyri T… M     31    172    70     Finl… FIN   2000…  2000 Summer Sydn…
##  9    13 "Minna … F     30    159    55.5   Finl… FIN   1996…  1996 Summer Atla…
## 10    13 "Minna … F     34    159    55.5   Finl… FIN   2000…  2000 Summer Sydn…
## # ℹ 221,156 more rows
## # ℹ 3 more variables: sport <chr>, event <chr>, medal <chr>

Arrange rows

arrange(data, desc(age))
## # A tibble: 269,732 × 15
##       id name     sex   age   height weight team  noc   games  year season city 
##    <dbl> <chr>    <chr> <chr> <chr>  <chr>  <chr> <chr> <chr> <dbl> <chr>  <chr>
##  1    54 "Mohame… M     NA    NA     NA     Iran  IRI   1948…  1948 Summer Lond…
##  2    58 "Georgi… M     NA    NA     NA     Bulg… BUL   1924…  1924 Summer Paris
##  3    58 "Georgi… M     NA    NA     NA     Bulg… BUL   1924…  1924 Summer Paris
##  4    66 "Mohame… M     NA    156    48     Sudan SUD   1972…  1972 Summer Muni…
##  5   102 "Sayed … M     NA    NA     NA     Egypt EGY   1920…  1920 Summer Antw…
##  6   102 "Sayed … M     NA    NA     NA     Egypt EGY   1928…  1928 Summer Amst…
##  7   133 "Franz … M     NA    NA     NA     Germ… GER   1900…  1900 Summer Paris
##  8   139 "George… M     NA    NA     NA     Thes… GRE   1906…  1906 Summer Athi…
##  9   163 "Ismail… M     NA    NA     NA     Unit… UAR   1960…  1960 Summer Roma 
## 10   163 "Ismail… M     NA    NA     NA     Unit… UAR   1960…  1960 Summer Roma 
## # ℹ 269,722 more rows
## # ℹ 3 more variables: sport <chr>, event <chr>, medal <chr>

Select columns

select(data, id:year)
## # A tibble: 269,732 × 10
##       id name                  sex   age   height weight team  noc   games  year
##    <dbl> <chr>                 <chr> <chr> <chr>  <chr>  <chr> <chr> <chr> <dbl>
##  1     1 A Dijiang             M     24    180    80     China CHN   1992…  1992
##  2     2 A Lamusi              M     23    170    60     China CHN   2012…  2012
##  3     3 Gunnar Nielsen Aaby   M     24    NA     NA     Denm… DEN   1920…  1920
##  4     4 Edgar Lindenau Aabye  M     34    NA     NA     Denm… DEN   1900…  1900
##  5     5 Christine Jacoba Aaf… F     21    185    82     Neth… NED   1988…  1988
##  6     5 Christine Jacoba Aaf… F     21    185    82     Neth… NED   1988…  1988
##  7     5 Christine Jacoba Aaf… F     25    185    82     Neth… NED   1992…  1992
##  8     5 Christine Jacoba Aaf… F     25    185    82     Neth… NED   1992…  1992
##  9     5 Christine Jacoba Aaf… F     27    185    82     Neth… NED   1994…  1994
## 10     5 Christine Jacoba Aaf… F     27    185    82     Neth… NED   1994…  1994
## # ℹ 269,722 more rows

Add columns

Summarize by groups