Tracking Daily Swedish Vaccination Rates

Sweden has a data problem!

During the COVID-19 pandemic, it became increasingly clear that Sweden has a data problem, at least coming from the health agency, Folkhälsomyndigheten.

Problems

No data reporting on weekends
No data reporting on Mondays
No data reporting on public holidays
Daily vaccination data difficult to find
Daily vaccination data exists only for a week, otherwise it’s collated weekly.

A small piece of the solution

To address one of the issues, this project is keeping a daily update of the vaccination rates in Sweden.

Data comes from Folkhälsomyndigheten.

Libraries

This project uses tidyverse (for data manipulation), rvest (for webscraping) and ggrepell (for advance graphics manipulation).

library(tidyverse)
library(rvest)
library(ggrepel)
library(scales)
library(ggthemr)
library(urbanthemes)

Webscraping

This piece of code first of all goes to the URL of FHM and then grabs the second table on the page, which is the one that gives us the most information. Then it renames the columns from Swedish into English.

fhm <- read_html("https://www.folkhalsomyndigheten.se/smittskydd-beredskap/utbrott/aktuella-utbrott/covid-19/vaccination-mot-covid-19/statistik/statistik-over-registrerade-vaccinationer-covid-19/")
getTab <- fhm %>%
    html_table(header = TRUE)
weeklyVacTab <- getTab[[2]]
#Tidy Names
colnames(weeklyVacTab) = c("date", "total_first", "percent_first", "total_second", "percent_second")

More cleaning

The data in the table is not immediately useable because it uses odd separators. Therefore, this part of the code goes through and removes erroneous spaces and other separators so that the data can be used. It also converts the table data from strings to dates and numbers.

After cleaning, I also add two new columns that calculate the number/percent of those that have received only one dose. That is because the first dose number includes thoses that have received a second dose too. It is unclear when the J&J vaccine begins usage whether FHM will include a count in both first and second dose.

After the new variable is calculated, one final clean is performed. This essentially rotates the table so that each of the doses becomes a factor and not a separate column. You can see the differences below.

weeklyVacTab$date <- as.Date(weeklyVacTab$date)
weeklyVacTab$total_first <- as.numeric(gsub(" ", "", weeklyVacTab$total_first))
weeklyVacTab$percent_first <- as.numeric(gsub(",", ".", weeklyVacTab$percent_first))
weeklyVacTab$total_second <- gsub(" ", "", weeklyVacTab$total_second)
#This was added due to poor(er) data entry on 31/03/2021 which included a new separator. 
weeklyVacTab$total_second <- gsub(" ", "", weeklyVacTab$total_second)
weeklyVacTab$total_second <- as.numeric(weeklyVacTab$total_second)
weeklyVacTab$percent_second <- as.numeric((gsub(",", ".", weeklyVacTab$percent_second)))

#Add Only 1 Dose 
weeklyVacTab <- weeklyVacTab %>% 
  mutate(total_firstOnly = total_first - total_second) %>% 
  mutate(percent_firstOnly = percent_first - percent_second)

vacUpdateT <- weeklyVacTab %>%
  pivot_longer(cols = c("total_first", "total_second", "percent_first", "percent_second", "total_firstOnly", "percent_firstOnly"), 
               names_to = c("type", "dose"),    names_pattern = "(.*)_(.*)", values_to = "number") %>%
  pivot_wider(names_from = type, values_from = number)

Load in the old and save the new…

Now I load in the old data, join the new data, and then save over the old data.

#Load and Rename
vacOld <- readRDS(file="vacTotal.Rda")
#Join
vacUpdateN <- bind_rows(vacOld, vacUpdateT) %>%
    arrange(date)
saveRDS(vacUpdateN, file="vacTotal.Rda")

Let’s get visual

Now to graph! First of all, I create a new data frame that collects the numbers from the most recent date so they can be displayed. Then, ggplot works its magic.

LS0tDQp0aXRsZTogIlRyYWNraW5nIERhaWx5IFN3ZWRpc2ggVmFjY2luYXRpb24gUmF0ZXMiDQphdXRob3I6IG5vemxlYWYNCm91dHB1dDogaHRtbF9ub3RlYm9vaw0KLS0tDQojIyBTd2VkZW4gaGFzIGEgZGF0YSBwcm9ibGVtIQ0KRHVyaW5nIHRoZSBDT1ZJRC0xOSBwYW5kZW1pYywgaXQgYmVjYW1lIGluY3JlYXNpbmdseSBjbGVhciB0aGF0IFN3ZWRlbiBoYXMgYSBkYXRhIHByb2JsZW0sIGF0IGxlYXN0IGNvbWluZyBmcm9tIHRoZSBoZWFsdGggYWdlbmN5LCBGb2xraMOkbHNvbXluZGlnaGV0ZW4uICANCg0KIyMjIyBQcm9ibGVtcw0KKiBObyBkYXRhIHJlcG9ydGluZyBvbiB3ZWVrZW5kcw0KKiBObyBkYXRhIHJlcG9ydGluZyBvbiBNb25kYXlzDQoqIE5vIGRhdGEgcmVwb3J0aW5nIG9uIHB1YmxpYyBob2xpZGF5cw0KKiBEYWlseSB2YWNjaW5hdGlvbiBkYXRhIGRpZmZpY3VsdCB0byBmaW5kDQoqIERhaWx5IHZhY2NpbmF0aW9uIGRhdGEgZXhpc3RzIG9ubHkgZm9yIGEgd2Vlaywgb3RoZXJ3aXNlIGl0J3MgY29sbGF0ZWQgd2Vla2x5LiAgDQoNCiMjIyMgQSBzbWFsbCBwaWVjZSBvZiB0aGUgc29sdXRpb24NClRvIGFkZHJlc3Mgb25lIG9mIHRoZSBpc3N1ZXMsIHRoaXMgcHJvamVjdCBpcyBrZWVwaW5nIGEgZGFpbHkgdXBkYXRlIG9mIHRoZSB2YWNjaW5hdGlvbiByYXRlcyBpbiBTd2VkZW4uIA0KDQpEYXRhIGNvbWVzIGZyb20gW0ZvbGtow6Rsc29teW5kaWdoZXRlbi5dKGh0dHBzOi8vZm9sa2hhbHNvbXluZGlnaGV0ZW4uc2UvKSAgDQoNCioqKg0KIyMjIyMgTGlicmFyaWVzDQpUaGlzIHByb2plY3QgdXNlcyB0aWR5dmVyc2UgKGZvciBkYXRhIG1hbmlwdWxhdGlvbiksIHJ2ZXN0IChmb3Igd2Vic2NyYXBpbmcpIGFuZCBnZ3JlcGVsbCAoZm9yIGFkdmFuY2UgZ3JhcGhpY3MgbWFuaXB1bGF0aW9uKS4NCmBgYHtyfQ0KbGlicmFyeSh0aWR5dmVyc2UpDQpsaWJyYXJ5KHJ2ZXN0KQ0KbGlicmFyeShnZ3JlcGVsKQ0KbGlicmFyeShzY2FsZXMpDQpsaWJyYXJ5KGdndGhlbXIpDQpsaWJyYXJ5KHVyYmFudGhlbWVzKQ0KYGBgDQoqKiogIA0KIyMjIyMgV2Vic2NyYXBpbmcNClRoaXMgcGllY2Ugb2YgY29kZSBmaXJzdCBvZiBhbGwgZ29lcyB0byB0aGUgVVJMIG9mIEZITSBhbmQgdGhlbiBncmFicyB0aGUgc2Vjb25kIHRhYmxlIG9uIHRoZSBwYWdlLCB3aGljaCBpcyB0aGUgb25lIHRoYXQgZ2l2ZXMgdXMgdGhlIG1vc3QgaW5mb3JtYXRpb24uIFRoZW4gaXQgcmVuYW1lcyB0aGUgY29sdW1ucyBmcm9tIFN3ZWRpc2ggaW50byBFbmdsaXNoLiANCmBgYHtyfQ0KZmhtIDwtIHJlYWRfaHRtbCgiaHR0cHM6Ly93d3cuZm9sa2hhbHNvbXluZGlnaGV0ZW4uc2Uvc21pdHRza3lkZC1iZXJlZHNrYXAvdXRicm90dC9ha3R1ZWxsYS11dGJyb3R0L2NvdmlkLTE5L3ZhY2NpbmF0aW9uLW1vdC1jb3ZpZC0xOS9zdGF0aXN0aWsvc3RhdGlzdGlrLW92ZXItcmVnaXN0cmVyYWRlLXZhY2NpbmF0aW9uZXItY292aWQtMTkvIikNCmdldFRhYiA8LSBmaG0gJT4lDQogICAgaHRtbF90YWJsZShoZWFkZXIgPSBUUlVFKQ0Kd2Vla2x5VmFjVGFiIDwtIGdldFRhYltbMl1dDQojVGlkeSBOYW1lcw0KY29sbmFtZXMod2Vla2x5VmFjVGFiKSA9IGMoImRhdGUiLCAidG90YWxfZmlyc3QiLCAicGVyY2VudF9maXJzdCIsICJ0b3RhbF9zZWNvbmQiLCAicGVyY2VudF9zZWNvbmQiKQ0KYGBgDQoqKiogIA0KIyMjIyMgTW9yZSBjbGVhbmluZw0KVGhlIGRhdGEgaW4gdGhlIHRhYmxlIGlzIG5vdCBpbW1lZGlhdGVseSB1c2VhYmxlIGJlY2F1c2UgaXQgdXNlcyBvZGQgc2VwYXJhdG9ycy4gVGhlcmVmb3JlLCB0aGlzIHBhcnQgb2YgdGhlIGNvZGUgZ29lcyB0aHJvdWdoIGFuZCByZW1vdmVzIGVycm9uZW91cyBzcGFjZXMgYW5kIG90aGVyIHNlcGFyYXRvcnMgc28gdGhhdCB0aGUgZGF0YSBjYW4gYmUgdXNlZC4gSXQgYWxzbyBjb252ZXJ0cyB0aGUgdGFibGUgZGF0YSBmcm9tIHN0cmluZ3MgdG8gZGF0ZXMgYW5kIG51bWJlcnMuDQoNCkFmdGVyIGNsZWFuaW5nLCBJIGFsc28gYWRkIHR3byBuZXcgY29sdW1ucyB0aGF0IGNhbGN1bGF0ZSB0aGUgbnVtYmVyL3BlcmNlbnQgb2YgdGhvc2UgdGhhdCBoYXZlIHJlY2VpdmVkIF9fb25seV9fIG9uZSBkb3NlLiBUaGF0IGlzIGJlY2F1c2UgdGhlIGZpcnN0IGRvc2UgbnVtYmVyIGluY2x1ZGVzIHRob3NlcyB0aGF0IGhhdmUgcmVjZWl2ZWQgYSBzZWNvbmQgZG9zZSB0b28uIEl0IGlzIHVuY2xlYXIgd2hlbiB0aGUgSiZKIHZhY2NpbmUgYmVnaW5zIHVzYWdlIHdoZXRoZXIgRkhNIHdpbGwgaW5jbHVkZSBhIGNvdW50IGluIGJvdGggZmlyc3QgYW5kIHNlY29uZCBkb3NlLiAgDQoNCkFmdGVyIHRoZSBuZXcgdmFyaWFibGUgaXMgY2FsY3VsYXRlZCwgb25lIGZpbmFsIGNsZWFuIGlzIHBlcmZvcm1lZC4gVGhpcyBlc3NlbnRpYWxseSByb3RhdGVzIHRoZSB0YWJsZSBzbyB0aGF0IGVhY2ggb2YgdGhlIGRvc2VzIGJlY29tZXMgYSBmYWN0b3IgYW5kIG5vdCBhIHNlcGFyYXRlIGNvbHVtbi4gWW91IGNhbiBzZWUgdGhlIGRpZmZlcmVuY2VzIGJlbG93Lg0KYGBge3J9DQp3ZWVrbHlWYWNUYWIkZGF0ZSA8LSBhcy5EYXRlKHdlZWtseVZhY1RhYiRkYXRlKQ0Kd2Vla2x5VmFjVGFiJHRvdGFsX2ZpcnN0IDwtIGFzLm51bWVyaWMoZ3N1YigiICIsICIiLCB3ZWVrbHlWYWNUYWIkdG90YWxfZmlyc3QpKQ0Kd2Vla2x5VmFjVGFiJHBlcmNlbnRfZmlyc3QgPC0gYXMubnVtZXJpYyhnc3ViKCIsIiwgIi4iLCB3ZWVrbHlWYWNUYWIkcGVyY2VudF9maXJzdCkpDQp3ZWVrbHlWYWNUYWIkdG90YWxfc2Vjb25kIDwtIGdzdWIoIiAiLCAiIiwgd2Vla2x5VmFjVGFiJHRvdGFsX3NlY29uZCkNCiNUaGlzIHdhcyBhZGRlZCBkdWUgdG8gcG9vcihlcikgZGF0YSBlbnRyeSBvbiAzMS8wMy8yMDIxIHdoaWNoIGluY2x1ZGVkIGEgbmV3IHNlcGFyYXRvci4gDQp3ZWVrbHlWYWNUYWIkdG90YWxfc2Vjb25kIDwtIGdzdWIoIsKgIiwgIiIsIHdlZWtseVZhY1RhYiR0b3RhbF9zZWNvbmQpDQp3ZWVrbHlWYWNUYWIkdG90YWxfc2Vjb25kIDwtIGFzLm51bWVyaWMod2Vla2x5VmFjVGFiJHRvdGFsX3NlY29uZCkNCndlZWtseVZhY1RhYiRwZXJjZW50X3NlY29uZCA8LSBhcy5udW1lcmljKChnc3ViKCIsIiwgIi4iLCB3ZWVrbHlWYWNUYWIkcGVyY2VudF9zZWNvbmQpKSkNCg0KI0FkZCBPbmx5IDEgRG9zZSANCndlZWtseVZhY1RhYiA8LSB3ZWVrbHlWYWNUYWIgJT4lIA0KICBtdXRhdGUodG90YWxfZmlyc3RPbmx5ID0gdG90YWxfZmlyc3QgLSB0b3RhbF9zZWNvbmQpICU+JSANCiAgbXV0YXRlKHBlcmNlbnRfZmlyc3RPbmx5ID0gcGVyY2VudF9maXJzdCAtIHBlcmNlbnRfc2Vjb25kKQ0KDQp2YWNVcGRhdGVUIDwtIHdlZWtseVZhY1RhYiAlPiUNCiAgcGl2b3RfbG9uZ2VyKGNvbHMgPSBjKCJ0b3RhbF9maXJzdCIsICJ0b3RhbF9zZWNvbmQiLCAicGVyY2VudF9maXJzdCIsICJwZXJjZW50X3NlY29uZCIsICJ0b3RhbF9maXJzdE9ubHkiLCAicGVyY2VudF9maXJzdE9ubHkiKSwgDQogICAgICAgICAgICAgICBuYW1lc190byA9IGMoInR5cGUiLCAiZG9zZSIpLCAgICBuYW1lc19wYXR0ZXJuID0gIiguKilfKC4qKSIsIHZhbHVlc190byA9ICJudW1iZXIiKSAlPiUNCiAgcGl2b3Rfd2lkZXIobmFtZXNfZnJvbSA9IHR5cGUsIHZhbHVlc19mcm9tID0gbnVtYmVyKQ0KYGBgDQoqKiogIA0KIyMjIyMgTG9hZCBpbiB0aGUgb2xkIGFuZCBzYXZlIHRoZSBuZXcuLi4NCk5vdyBJIGxvYWQgaW4gdGhlIG9sZCBkYXRhLCBqb2luIHRoZSBuZXcgZGF0YSwgYW5kIHRoZW4gc2F2ZSBvdmVyIHRoZSBvbGQgZGF0YS4gDQpgYGB7cn0NCiNMb2FkIGFuZCBSZW5hbWUNCnZhY09sZCA8LSByZWFkUkRTKGZpbGU9InZhY1RvdGFsLlJkYSIpDQojSm9pbg0KdmFjVXBkYXRlTiA8LSBiaW5kX3Jvd3ModmFjT2xkLCB2YWNVcGRhdGVUKSAlPiUNCiAgICBhcnJhbmdlKGRhdGUpDQpzYXZlUkRTKHZhY1VwZGF0ZU4sIGZpbGU9InZhY1RvdGFsLlJkYSIpDQpgYGANCioqKiAgDQojIyMjIyBMZXQncyBnZXQgdmlzdWFsDQpOb3cgdG8gZ3JhcGghIEZpcnN0IG9mIGFsbCwgSSBjcmVhdGUgYSBuZXcgZGF0YSBmcmFtZSB0aGF0IGNvbGxlY3RzIHRoZSBudW1iZXJzIGZyb20gdGhlIG1vc3QgcmVjZW50IGRhdGUgc28gdGhleSBjYW4gYmUgZGlzcGxheWVkLiBUaGVuLCBnZ3Bsb3Qgd29ya3MgaXRzIG1hZ2ljLiANCmBgYHtyIGVjaG89VFJVRSwgZmlnLmhlaWdodD02LCBmaWcud2lkdGg9MTB9DQp2YWNMIDwtIHZhY1VwZGF0ZVQgJT4lDQogIGdyb3VwX2J5KGRvc2UpICU+JQ0KICB0b3BfbigxLCBwZXJjZW50KQ0KDQoNCmdncGxvdCh2YWNVcGRhdGVOLCBhZXMoZGF0ZSwgcGVyY2VudCwgY29sb3IgPSBkb3NlKSkgKw0KICBnZW9tX2xpbmUoc2l6ZSA9IDEpICsNCiAgZ2VvbV9wb2ludChzaGFwZSA9IDIxLCBzaXplID0gMykgKw0KICBsYWJzKA0KICAgIHRpdGxlID0gIiUgVmFjY2luYXRlZCBTd2VkZW4iLA0KICAgIHN1YnRpdGxlID0gIkZpcnN0IGFuZCBTZWNvbmQgRG9zZXMgYW5kIE9ubHkgT25lIERvc2UiLA0KICAgIGNhcHRpb24gPSAiU291cmNlOiBGb2xraMOkbHNvbXluZGlnaGV0ZW4iLA0KICAgIHggPSAiRGF0ZSIsDQogICAgeSA9ICIlIFZhY2NpbmF0ZWQiKSArDQogIHNjYWxlX3hfZGF0ZShkYXRlX2xhYmVscyA9ICIlZCAlYiIpICsNCiAgdGhlbWUoYXNwZWN0LnJhdGlvID0gMC42NjYpICsNCiAgc2NhbGVfeV9jb250aW51b3VzKGxpbWl0cyA9IGMoMCwgMzApLCBicmVha3MgPSBzZXEoMCwgMzAsIGJ5ID0gNSkpICsNCiAgc2NhbGVfY29sb3JfbWFudWFsKGxhYmVscyA9IGMoIkF0IGxlYXN0IE9uZSBEb3NlIiwgIk9ubHkgT25lIERvc2UiLCAiRnVsbHkgVmFjY2luYXRlZCIpLCB2YWx1ZXMgPSBjKCJyZWQiLCAiZ29sZCIsICJvcmFuZ2UiKSkgKw0KICBnZW9tX3RleHRfcmVwZWwoYWVzKGxhYmVsID0gcGVyY2VudCksIGRhdGEgPSB2YWNMLCBjb2xvciA9ICJibGFjayIsIG51ZGdlX3kgPSAtMSwgc2l6ZSA9IDMpICsNCiAgdGhlbWVfbWluaW1hbCgpDQpgYGANCg0KYGBge3IgZXZhbD1GQUxTRSwgaW5jbHVkZT1GQUxTRX0NCiNNb2RlbCBNYWtpbmcNCmxpYnJhcnkoImZvcmVjYXN0IikNCmFsX29uZSA8LSB2YWNVcGRhdGVOICU+JQ0KICBmaWx0ZXIoZG9zZSA9PSAiZmlyc3QiKQ0KDQptb2RlbCA8LSBtYSgpDQoNCndyaXRlLmNzdihhbF9vbmUsICJhdGxlYXN0b25lZG9zZS5jc3YiKQ0KDQpgYGANCg0KDQo=