Import data
# excel file
data <- read_excel("../00_data/my data q&a.xlsx")
data
## # A tibble: 269,732 × 15
## id name sex age height weight team noc games year season city
## <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <chr>
## 1 1 A Dijia… M 24 180 80 China CHN 1992… 1992 Summer Barc…
## 2 2 A Lamusi M 23 170 60 China CHN 2012… 2012 Summer Lond…
## 3 3 Gunnar … M 24 NA NA Denm… DEN 1920… 1920 Summer Antw…
## 4 4 Edgar L… M 34 NA NA Denm… DEN 1900… 1900 Summer Paris
## 5 5 Christi… F 21 185 82 Neth… NED 1988… 1988 Winter Calg…
## 6 5 Christi… F 21 185 82 Neth… NED 1988… 1988 Winter Calg…
## 7 5 Christi… F 25 185 82 Neth… NED 1992… 1992 Winter Albe…
## 8 5 Christi… F 25 185 82 Neth… NED 1992… 1992 Winter Albe…
## 9 5 Christi… F 27 185 82 Neth… NED 1994… 1994 Winter Lill…
## 10 5 Christi… F 27 185 82 Neth… NED 1994… 1994 Winter Lill…
## # ℹ 269,722 more rows
## # ℹ 3 more variables: sport <chr>, event <chr>, medal <chr>
Apply the following dplyr verbs to your data
Filter rows
filter(data, season== "Summer")
## # A tibble: 221,166 × 15
## id name sex age height weight team noc games year season city
## <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <chr>
## 1 1 "A Diji… M 24 180 80 China CHN 1992… 1992 Summer Barc…
## 2 2 "A Lamu… M 23 170 60 China CHN 2012… 2012 Summer Lond…
## 3 3 "Gunnar… M 24 NA NA Denm… DEN 1920… 1920 Summer Antw…
## 4 4 "Edgar … M 34 NA NA Denm… DEN 1900… 1900 Summer Paris
## 5 8 "Cornel… F 18 168 NA Neth… NED 1932… 1932 Summer Los …
## 6 8 "Cornel… F 18 168 NA Neth… NED 1932… 1932 Summer Los …
## 7 10 "Einar … M 26 NA NA Finl… FIN 1952… 1952 Summer Hels…
## 8 12 "Jyri T… M 31 172 70 Finl… FIN 2000… 2000 Summer Sydn…
## 9 13 "Minna … F 30 159 55.5 Finl… FIN 1996… 1996 Summer Atla…
## 10 13 "Minna … F 34 159 55.5 Finl… FIN 2000… 2000 Summer Sydn…
## # ℹ 221,156 more rows
## # ℹ 3 more variables: sport <chr>, event <chr>, medal <chr>
Arrange rows
arrange(data, desc(age))
## # A tibble: 269,732 × 15
## id name sex age height weight team noc games year season city
## <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <chr>
## 1 54 "Mohame… M NA NA NA Iran IRI 1948… 1948 Summer Lond…
## 2 58 "Georgi… M NA NA NA Bulg… BUL 1924… 1924 Summer Paris
## 3 58 "Georgi… M NA NA NA Bulg… BUL 1924… 1924 Summer Paris
## 4 66 "Mohame… M NA 156 48 Sudan SUD 1972… 1972 Summer Muni…
## 5 102 "Sayed … M NA NA NA Egypt EGY 1920… 1920 Summer Antw…
## 6 102 "Sayed … M NA NA NA Egypt EGY 1928… 1928 Summer Amst…
## 7 133 "Franz … M NA NA NA Germ… GER 1900… 1900 Summer Paris
## 8 139 "George… M NA NA NA Thes… GRE 1906… 1906 Summer Athi…
## 9 163 "Ismail… M NA NA NA Unit… UAR 1960… 1960 Summer Roma
## 10 163 "Ismail… M NA NA NA Unit… UAR 1960… 1960 Summer Roma
## # ℹ 269,722 more rows
## # ℹ 3 more variables: sport <chr>, event <chr>, medal <chr>
Select columns
select(data, id:year)
## # A tibble: 269,732 × 10
## id name sex age height weight team noc games year
## <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <dbl>
## 1 1 A Dijiang M 24 180 80 China CHN 1992… 1992
## 2 2 A Lamusi M 23 170 60 China CHN 2012… 2012
## 3 3 Gunnar Nielsen Aaby M 24 NA NA Denm… DEN 1920… 1920
## 4 4 Edgar Lindenau Aabye M 34 NA NA Denm… DEN 1900… 1900
## 5 5 Christine Jacoba Aaf… F 21 185 82 Neth… NED 1988… 1988
## 6 5 Christine Jacoba Aaf… F 21 185 82 Neth… NED 1988… 1988
## 7 5 Christine Jacoba Aaf… F 25 185 82 Neth… NED 1992… 1992
## 8 5 Christine Jacoba Aaf… F 25 185 82 Neth… NED 1992… 1992
## 9 5 Christine Jacoba Aaf… F 27 185 82 Neth… NED 1994… 1994
## 10 5 Christine Jacoba Aaf… F 27 185 82 Neth… NED 1994… 1994
## # ℹ 269,722 more rows
Add columns
Summarize by groups