Ist der Geburtsdatumeffekt im Eishockey noch vorherrschend

Author

Manfred Stückler

Published

July 26, 2024

1 Einführung.

BLAHBLAH

1.1 Libraries einlesen

# Nötige Librarys laden
library(tidyverse)
library(httr)
library(scales)
library(ggimage)
library(ggtext)
library(knitr)

1.2 Einlesen der Daten

# Einlesen der Daten
canada_raw <- GET('https://www150.statcan.gc.ca/t1/tbl1/en/dtl!downloadDbLoadingData-nonTraduit.action?pid=1310041501&latestN=0&startDate=19910101&endDate=20220101&csvLocale=en&selectedMembers=%5B%5B1%5D%2C%5B%5D%2C%5B1%5D%5D&checkedLevels=1D1%2C1D2') %>%
  content()

1.3 Umbau des Datensatzes

can_birt <- canada_raw %>%
  filter(!str_detect(`Month of birth`, "Total")) %>%        # Die Spalten Total rausnehmen
  transmute(                                                # Tabelle auf 3 Werte reduzieren
    REF_DATE,
    MONTH = str_extract(`Month of birth`, "Month of birth, (\\w+)", 1),  # Nur das Monat auslesen
    VALUE
  ) %>%
  group_by(MONTH) %>%                                      # Nach Monat groupieren
  summarize(country_births = sum(VALUE)) %>%               # Summe der Geburten 
  mutate(country_pct = country_births/sum(country_births))  # Prozensats


# Tabelle erschaffen für Verteilung
can_dist <- can_birt %>%
  transmute(
    `Kanada in %` = country_pct,
    `Erwartete % nach Monatstage` = case_when(
      MONTH %in% c("April", "June", "September", "November") ~ 30/365,
      MONTH == "February" ~ 28/365,
      TRUE ~ 31/365
    ),
    `Differenz` = `Kanada in %` - `Erwartete % nach Monatstage`,
    Monat = factor(MONTH, levels = c('January', 'February', 'March', 'April',
                                     'May', 'June', 'July', 'August',
                                     'September', 'October', 'November', 'December'))
  ) %>%
  mutate( Monat = factor(Monat, levels = month.name)) %>%
  arrange(Monat)


# Tabelle invertieren
can_dist2 <- can_dist %>%
  # 1. Allte Werte in eine Spalte transponieren
  pivot_longer(cols = !Monat,                
               names_to = "Bezeichnung",
               values_to = "Werte") %>%
  pivot_wider(names_from = Monat,
              values_from = Werte)

kable(can_dist2,
      align = "lccccccccccc",
      caption = "Geburten in Kanada nach Monaten")
Geburten in Kanada nach Monaten
Bezeichnung January February March April May June July August September October November December
Kanada in % 0.0801527 0.0754510 0.0848022 0.0837281 0.0876597 0.0852353 0.0887541 0.0871899 0.0868042 0.0836742 0.0781998 0.0783489
Erwartete % nach Monatstage 0.0849315 0.0767123 0.0849315 0.0821918 0.0849315 0.0821918 0.0849315 0.0849315 0.0821918 0.0849315 0.0821918 0.0849315
Differenz -0.0047789 -0.0012614 -0.0001293 0.0015364 0.0027282 0.0030435 0.0038226 0.0022584 0.0046124 -0.0012574 -0.0039920 -0.0065826