PS 4160 Lab Assignment 3

Hi all–

Great lab! Hope we figured out some of the flexibility and power of the dplyr and tidyverse approach.

The Lab

Q1

The first questions asks us to generate a new variable, called d1$decade, which will allow us to group together all the separate charting results within decade-long groups, and do calculations inside those groups.

we’ll start by loading the data

library(plyr)
library(tidyverse)
library(magrittr)
library(lubridate)

d1 <- "https://github.com/thomasjwood/ps4160/raw/master/billboard_58_21.rds" %>%
  url %>%
  gzcon %>%
  readRDS

Then we’ll generate our decade indicator. Let’s step through this process piece by piece.

d1$decade <- d1$week_id %>% 
  floor_date(years(10)) %>% 
  year %>% 
  as.numeric %>% 
  str_c("s") %>% 
  fct_inorder

The first bit

d1$week_id %>% 
  floor_date(years(10))

takes the week indicator, and rounds them down to the nearest decade. We could have said years(1) to round to the year, or we could have said years(100) to round down to the nearest century. To round up, we helpfully would use the command ceiling_date.)

The next bit

d1$week_id %>% 
  floor_date(years(10)) %>% 
  year

Takes the new date vector and keeps only the year.

The final bit

d1$decade <- d1$week_id %>% 
  floor_date(years(10)) %>% 
  year %>% 
  as.numeric %>% 
  str_c("s") %>% 
  fct_inorder

replaces the year with a nice labelled factor, which will be in a nice chronological order.

Armed with this variable, we want to:

For every artist decade–that is, if an artist has charted in separate decade–compute the number of charted songs separately by decade, within artists—Taylor Swift demonstrates this possibility in our answer!
Sort the table, by decade, and then by the number of charted unique songs
By decade, return the top 3 rows (are artist decade)

which should be

d1 %>% 
  group_by(
    decade, performer
  ) %>% 
  summarize(
    tracks = song_id %>% unique %>% length
  ) %>% 
  arrange(desc(tracks)) %>% 
  slice(1:3) %>% 
  arrange(
    desc(decade)
  ) %>% 
  print(n = 24)

which should return

whoa Rascal Flatts, Toby Keith. Country music fans really kept buying singles longer than anyone else, in the face of downloading. Gosh.

Q2

Ok, the cursed question, withdrawn as soon as it was issued. What did it ask?

Compare songs that debuted in the top 40 to those which debuted outside the top 40. By decade, which group of songs spend longer on the charts?

I’ll show you how I did this:

t1 <- d1 %>%
  left_join(
    d1 %>% 
      select(
        song_id, week_id, week_position
      ) %>% 
      arrange(song_id, week_id) %>% 
      group_by(song_id) %>% 
      slice(1) %>% 
      mutate(
        debut = case_when(
          week_position %>% 
            is_weakly_less_than(40) ~ "debut_in_top40",
          TRUE ~ "debut_out_top40"
        )
      ) %>% 
      select(song_id, debut)
  ) %>% 
  select(
    song_id, week_id, song, performer, decade, debut, weeks_on_chart
  ) %>% 
  arrange(
    song_id, week_id
  ) %>% 
  group_by(song_id) %>% 
  slice(n()) %>% 
  group_by(decade, debut) %>% 
  summarize(
    week_mu = weeks_on_chart %>% mean
    ) %>% 
  spread(debut, week_mu) %>% 
  ungroup %>% 
  mutate(
    time  = debut_in_top40 - debut_out_top40
    )

Which should return

You can maybe why I needed to use left_join – I needed a separate indicator, for each song, to indicate whether that song debuted in the top 40 (ie, what its chart position was in its first week.) Then I used that indicator to compare the total number of charting weeks.

Q3

This question asks:

By my estimation, there are six artists who’ve had at least one top ten charting single in four (or more) separate decades. Who are they?

So we need to:

Look at only those songs which have charted in the top 10, for at least 1 week
Among this sub group of songs, by performer, report the unique number of decades

which is given by


d1 %>% 
  filter(
    week_position %>% 
      is_in(1:10)
    ) %>% 
  group_by(performer) %>% 
  summarize(
    nd = decade %>% unique %>% length
  ) %>% 
  arrange(desc(nd)) %>% 
  filter(
    nd >= 4
  )

which should return

  performer          nd
  <chr>           <int>
1 Andy Williams       5
2 Aerosmith           4
3 Cher                4
4 Mariah Carey        4
5 Michael Jackson     4
6 Whitney Houston     4

LS0tDQp0aXRsZTogIlBTIDQxNjAgTGFiIEFzc2lnbm1lbnQgMyINCmF1dGhvcjogIlRob21hcyBXb29kLCBQb2xpdGljYWwgU2NpZW5jZS0tT2hpbyBTdGF0ZSwgd29vZC4xMDgwQG9zdS5lZHUiDQpvdXRwdXQ6DQogIGh0bWxfbm90ZWJvb2s6DQogICAgdGhlbWU6IGNlcnVsZWFuDQogIGh0bWxfZG9jdW1lbnQ6DQogICAgZGZfcHJpbnQ6IHBhZ2VkDQotLS0NCg0KSGkgYWxsLS0NCg0KR3JlYXQgbGFiISBIb3BlIHdlIGZpZ3VyZWQgb3V0IHNvbWUgb2YgdGhlIGZsZXhpYmlsaXR5IGFuZCBwb3dlciBvZiB0aGUgYGRwbHlyYCBhbmQgYHRpZHl2ZXJzZWAgYXBwcm9hY2guDQoNCiMjIFRoZSBMYWINCg0KIyMjIFExDQoNClRoZSBmaXJzdCBxdWVzdGlvbnMgYXNrcyB1cyB0byBnZW5lcmF0ZSBhIG5ldyB2YXJpYWJsZSwgY2FsbGVkIGBkMSRkZWNhZGVgLCB3aGljaCB3aWxsIGFsbG93IHVzIHRvIGdyb3VwIHRvZ2V0aGVyIGFsbCB0aGUgc2VwYXJhdGUgY2hhcnRpbmcgcmVzdWx0cyB3aXRoaW4gZGVjYWRlLWxvbmcgZ3JvdXBzLCBhbmQgZG8gY2FsY3VsYXRpb25zIGluc2lkZSB0aG9zZSBncm91cHMuDQoNCndlJ2xsIHN0YXJ0IGJ5IGxvYWRpbmcgdGhlIGRhdGENCg0KYGBgIHsjbG9hZF9kYXRhIC5yIC5SfQ0KbGlicmFyeShwbHlyKQ0KbGlicmFyeSh0aWR5dmVyc2UpDQpsaWJyYXJ5KG1hZ3JpdHRyKQ0KbGlicmFyeShsdWJyaWRhdGUpDQoNCmQxIDwtICJodHRwczovL2dpdGh1Yi5jb20vdGhvbWFzandvb2QvcHM0MTYwL3Jhdy9tYXN0ZXIvYmlsbGJvYXJkXzU4XzIxLnJkcyIgJT4lDQogIHVybCAlPiUNCiAgZ3pjb24gJT4lDQogIHJlYWRSRFMgDQpgYGANCg0KVGhlbiB3ZSdsbCBnZW5lcmF0ZSBvdXIgZGVjYWRlIGluZGljYXRvci4gTGV0J3Mgc3RlcCB0aHJvdWdoIHRoaXMgcHJvY2VzcyBwaWVjZSBieSBwaWVjZS4NCg0KYGBgIHINCmQxJGRlY2FkZSA8LSBkMSR3ZWVrX2lkICU+JSANCiAgZmxvb3JfZGF0ZSh5ZWFycygxMCkpICU+JSANCiAgeWVhciAlPiUgDQogIGFzLm51bWVyaWMgJT4lIA0KICBzdHJfYygicyIpICU+JSANCiAgZmN0X2lub3JkZXINCmBgYA0KDQpUaGUgZmlyc3QgYml0DQoNCmBgYCByDQpkMSR3ZWVrX2lkICU+JSANCiAgZmxvb3JfZGF0ZSh5ZWFycygxMCkpDQpgYGANCg0KdGFrZXMgdGhlIHdlZWsgaW5kaWNhdG9yLCBhbmQgcm91bmRzIHRoZW0gZG93biB0byB0aGUgbmVhcmVzdCBkZWNhZGUuIFdlIGNvdWxkIGhhdmUgc2FpZCBgeWVhcnMoMSlgIHRvIHJvdW5kIHRvIHRoZSB5ZWFyLCBvciB3ZSBjb3VsZCBoYXZlIHNhaWQgYHllYXJzKDEwMClgIHRvIHJvdW5kIGRvd24gdG8gdGhlIG5lYXJlc3QgY2VudHVyeS4gVG8gcm91bmQgdXAsIHdlIGhlbHBmdWxseSB3b3VsZCB1c2UgdGhlIGNvbW1hbmQgYGNlaWxpbmdfZGF0ZWAuKQ0KDQpUaGUgbmV4dCBiaXQNCg0KYGBgIHINCmQxJHdlZWtfaWQgJT4lIA0KICBmbG9vcl9kYXRlKHllYXJzKDEwKSkgJT4lIA0KICB5ZWFyDQpgYGANCg0KVGFrZXMgdGhlIG5ldyBkYXRlIHZlY3RvciBhbmQga2VlcHMgb25seSB0aGUgeWVhci4NCg0KVGhlIGZpbmFsIGJpdA0KDQpgYGAgcg0KZDEkZGVjYWRlIDwtIGQxJHdlZWtfaWQgJT4lIA0KICBmbG9vcl9kYXRlKHllYXJzKDEwKSkgJT4lIA0KICB5ZWFyICU+JSANCiAgYXMubnVtZXJpYyAlPiUgDQogIHN0cl9jKCJzIikgJT4lIA0KICBmY3RfaW5vcmRlcg0KYGBgDQoNCnJlcGxhY2VzIHRoZSB5ZWFyIHdpdGggYSBuaWNlIGxhYmVsbGVkIGZhY3Rvciwgd2hpY2ggd2lsbCBiZSBpbiBhIG5pY2UgY2hyb25vbG9naWNhbCBvcmRlci4NCg0KQXJtZWQgd2l0aCB0aGlzIHZhcmlhYmxlLCB3ZSB3YW50IHRvOg0KDQoxLiAgRm9yIGV2ZXJ5IGFydGlzdCBkZWNhZGUtLXRoYXQgaXMsIGlmIGFuIGFydGlzdCBoYXMgY2hhcnRlZCBpbiBzZXBhcmF0ZSBkZWNhZGUtLWNvbXB1dGUgdGhlIG51bWJlciBvZiBjaGFydGVkIHNvbmdzIHNlcGFyYXRlbHkgYnkgZGVjYWRlLCB3aXRoaW4gYXJ0aXN0cy0tLVRheWxvciBTd2lmdCBkZW1vbnN0cmF0ZXMgdGhpcyBwb3NzaWJpbGl0eSBpbiBvdXIgYW5zd2VyIQ0KDQoyLiAgU29ydCB0aGUgdGFibGUsIGJ5IGRlY2FkZSwgYW5kIHRoZW4gYnkgdGhlIG51bWJlciBvZiBjaGFydGVkIHVuaXF1ZSBzb25ncw0KDQozLiAgQnkgZGVjYWRlLCByZXR1cm4gdGhlIHRvcCAzIHJvd3MgKGFyZSBhcnRpc3QgZGVjYWRlKQ0KDQp3aGljaCBzaG91bGQgYmUNCg0KYGBgIHINCmQxICU+JSANCiAgZ3JvdXBfYnkoDQogICAgZGVjYWRlLCBwZXJmb3JtZXINCiAgKSAlPiUgDQogIHN1bW1hcml6ZSgNCiAgICB0cmFja3MgPSBzb25nX2lkICU+JSB1bmlxdWUgJT4lIGxlbmd0aA0KICApICU+JSANCiAgYXJyYW5nZShkZXNjKHRyYWNrcykpICU+JSANCiAgc2xpY2UoMTozKSAlPiUgDQogIGFycmFuZ2UoDQogICAgZGVzYyhkZWNhZGUpDQogICkgJT4lIA0KICBwcmludChuID0gMjQpDQpgYGANCg0Kd2hpY2ggc2hvdWxkIHJldHVybg0KDQohW10odGFibGVzX2FydGlzdHNfc29uZ3MucG5nKQ0KDQp3aG9hIFJhc2NhbCBGbGF0dHMsIFRvYnkgS2VpdGguIENvdW50cnkgbXVzaWMgZmFucyByZWFsbHkga2VwdCBidXlpbmcgc2luZ2xlcyBsb25nZXIgdGhhbiBhbnlvbmUgZWxzZSwgaW4gdGhlIGZhY2Ugb2YgZG93bmxvYWRpbmcuIEdvc2guDQoNCiMjIyBRMg0KDQpPaywgdGhlIGN1cnNlZCBxdWVzdGlvbiwgd2l0aGRyYXduIGFzIHNvb24gYXMgaXQgd2FzIGlzc3VlZC4gV2hhdCBkaWQgaXQgYXNrPw0KDQo+IENvbXBhcmUgc29uZ3MgdGhhdCBkZWJ1dGVkIGluIHRoZSB0b3AgNDAgdG8gdGhvc2Ugd2hpY2ggZGVidXRlZCBvdXRzaWRlIHRoZSB0b3AgNDAuIEJ5IGRlY2FkZSwgd2hpY2ggZ3JvdXAgb2Ygc29uZ3Mgc3BlbmQgbG9uZ2VyIG9uIHRoZSBjaGFydHM/DQoNCkknbGwgc2hvdyB5b3UgaG93IEkgZGlkIHRoaXM6DQoNCmBgYHtyfQ0KdDEgPC0gZDEgJT4lDQogIGxlZnRfam9pbigNCiAgICBkMSAlPiUgDQogICAgICBzZWxlY3QoDQogICAgICAgIHNvbmdfaWQsIHdlZWtfaWQsIHdlZWtfcG9zaXRpb24NCiAgICAgICkgJT4lIA0KICAgICAgYXJyYW5nZShzb25nX2lkLCB3ZWVrX2lkKSAlPiUgDQogICAgICBncm91cF9ieShzb25nX2lkKSAlPiUgDQogICAgICBzbGljZSgxKSAlPiUgDQogICAgICBtdXRhdGUoDQogICAgICAgIGRlYnV0ID0gY2FzZV93aGVuKA0KICAgICAgICAgIHdlZWtfcG9zaXRpb24gJT4lIA0KICAgICAgICAgICAgaXNfd2Vha2x5X2xlc3NfdGhhbig0MCkgfiAiZGVidXRfaW5fdG9wNDAiLA0KICAgICAgICAgIFRSVUUgfiAiZGVidXRfb3V0X3RvcDQwIg0KICAgICAgICApDQogICAgICApICU+JSANCiAgICAgIHNlbGVjdChzb25nX2lkLCBkZWJ1dCkNCiAgKSAlPiUgDQogIHNlbGVjdCgNCiAgICBzb25nX2lkLCB3ZWVrX2lkLCBzb25nLCBwZXJmb3JtZXIsIGRlY2FkZSwgZGVidXQsIHdlZWtzX29uX2NoYXJ0DQogICkgJT4lIA0KICBhcnJhbmdlKA0KICAgIHNvbmdfaWQsIHdlZWtfaWQNCiAgKSAlPiUgDQogIGdyb3VwX2J5KHNvbmdfaWQpICU+JSANCiAgc2xpY2UobigpKSAlPiUgDQogIGdyb3VwX2J5KGRlY2FkZSwgZGVidXQpICU+JSANCiAgc3VtbWFyaXplKA0KICAgIHdlZWtfbXUgPSB3ZWVrc19vbl9jaGFydCAlPiUgbWVhbg0KICAgICkgJT4lIA0KICBzcHJlYWQoZGVidXQsIHdlZWtfbXUpICU+JSANCiAgdW5ncm91cCAlPiUgDQogIG11dGF0ZSgNCiAgICB0aW1lICA9IGRlYnV0X2luX3RvcDQwIC0gZGVidXRfb3V0X3RvcDQwDQogICAgKQ0KDQpgYGANCg0KV2hpY2ggc2hvdWxkIHJldHVybg0KDQohW10ocXVlc190aHJlZV90YWIuanBnKQ0KDQpZb3UgY2FuIG1heWJlIHdoeSBJIG5lZWRlZCB0byB1c2UgYGxlZnRfam9pbmAgLS0gSSBuZWVkZWQgYSBzZXBhcmF0ZSBpbmRpY2F0b3IsIGZvciBlYWNoIHNvbmcsIHRvIGluZGljYXRlIHdoZXRoZXIgdGhhdCBzb25nIGRlYnV0ZWQgaW4gdGhlIHRvcCA0MCAoaWUsIHdoYXQgaXRzIGNoYXJ0IHBvc2l0aW9uIHdhcyBpbiBpdHMgZmlyc3Qgd2Vlay4pIFRoZW4gSSB1c2VkIHRoYXQgaW5kaWNhdG9yIHRvIGNvbXBhcmUgdGhlIHRvdGFsIG51bWJlciBvZiBjaGFydGluZyB3ZWVrcy4NCg0KIyMjIFEzDQoNClRoaXMgcXVlc3Rpb24gYXNrczoNCg0KPiBCeSBteSBlc3RpbWF0aW9uLCB0aGVyZSBhcmUgc2l4IGFydGlzdHMgd2hvJ3ZlIGhhZCBhdCBsZWFzdCBvbmUgdG9wIHRlbiBjaGFydGluZyBzaW5nbGUgaW4gZm91ciAob3IgbW9yZSkgc2VwYXJhdGUgZGVjYWRlcy4gV2hvIGFyZSB0aGV5Pw0KDQpTbyB3ZSBuZWVkIHRvOg0KDQoxLiAgTG9vayBhdCAqb25seSB0aG9zZSBzb25ncyogd2hpY2ggaGF2ZSBjaGFydGVkIGluIHRoZSB0b3AgMTAsIGZvciBhdCBsZWFzdCAxIHdlZWsNCg0KMi4gIEFtb25nIHRoaXMgc3ViIGdyb3VwIG9mIHNvbmdzLCBieSBwZXJmb3JtZXIsIHJlcG9ydCB0aGUgdW5pcXVlIG51bWJlciBvZiBkZWNhZGVzDQoNCndoaWNoIGlzIGdpdmVuIGJ5DQoNCmBgYHtyfQ0KDQpkMSAlPiUgDQogIGZpbHRlcigNCiAgICB3ZWVrX3Bvc2l0aW9uICU+JSANCiAgICAgIGlzX2luKDE6MTApDQogICAgKSAlPiUgDQogIGdyb3VwX2J5KHBlcmZvcm1lcikgJT4lIA0KICBzdW1tYXJpemUoDQogICAgbmQgPSBkZWNhZGUgJT4lIHVuaXF1ZSAlPiUgbGVuZ3RoDQogICkgJT4lIA0KICBhcnJhbmdlKGRlc2MobmQpKSAlPiUgDQogIGZpbHRlcigNCiAgICBuZCA+PSA0DQogICkNCg0KYGBgDQoNCndoaWNoIHNob3VsZCByZXR1cm4NCg0KICAgICAgcGVyZm9ybWVyICAgICAgICAgIG5kDQogICAgICA8Y2hyPiAgICAgICAgICAgPGludD4NCiAgICAxIEFuZHkgV2lsbGlhbXMgICAgICAgNQ0KICAgIDIgQWVyb3NtaXRoICAgICAgICAgICA0DQogICAgMyBDaGVyICAgICAgICAgICAgICAgIDQNCiAgICA0IE1hcmlhaCBDYXJleSAgICAgICAgNA0KICAgIDUgTWljaGFlbCBKYWNrc29uICAgICA0DQogICAgNiBXaGl0bmV5IEhvdXN0b24gICAgIDQNCg==

PS 4160 Lab Assignment 3

Thomas Wood, Political Science–Ohio State, wood.1080@osu.edu

The Lab

Q1

Q2

Q3