class: center, middle, inverse, title-slide # Förstå eller förutspå? ## Hönan eller ägget? ### Erik Bülow, PhD, statistiker ### 2021-01-20 --- class: inverse, center, middle # Förstå eller förutspå? --- background-image: url("figs/abstract.jpg") background-position: right, top background-size: 33% # Stort intresse för predektiva modeller -- - **Titel:** prediktorer via maksininlärning -- - **Abstract:** logistisk regression -- - **Brödtext:** hypotesprövning med signifikanta koefficienter --- # Traditionell statistik -- - små datamängder -- - forskare generaliserar resultat för grupper/populationer -- - Anta exponering `\(X\)` (behandling) och utfall `\(Y\)` (nöjdhet) -- - oberoende/okorrelerade/ortogonala variabler -- - `\(Y = f(X)\)` -- - `\(f(X) = \beta_0 + \beta_1x + \varepsilon\)` för `\(\varepsilon \sim N(0, \sigma^2)\)` för något `\(\sigma > 0\)` -- - `\(\hat \beta_0, \hat \beta_1, \hat \sigma\)` -- - `\(H_0 \colon \beta_1 = 0\)` vs `\(H_1 \colon \beta_1 \neq 0\)` -- - p-värden, konfidensintervall, signifikansnivå --- # ("Ren") Prediktion -- - berörda (kliniker/patienter/anhöriga) ges individuell skattning -- - stora datamängder, stor beräkningskraft -- - "Svarta lådor" -- - korrelerade variabler -- - **Ofta:** många prediktorer -- - **Kliniska sammanhang:** variabelselektion för relevanta prediktorer -- - Svårt att skatta osäkerheten (~~p-värden, konfidensintervall, signifikans~~) --- # Validering - hur bra är modellen för oberoende observationer? -- - intern: split sample, korsvalidering eller bootstrapping -- - extern -- - temporär -- - diskriminerande förmåga, kalibrering, klinisk nytta -- - sensitivitet/specificitet/ROC-kurva/AUC-värde/konkordans-index/Harrel's C/Brier score ... -- - etisk --- background-image: url("figs/useless.jpg") background-position: right background-size: 60% # Konflikt? -- - förstå **vs** förutspå -- - statistiker **vs** datavetare -- - forskare **vs** ingengör -- - teoretiker **vs** praktiker -- - akademiskt **vs** kommersielt -- - hjärna **vs** muskler -- - stofiler **vs** oppurtunister -- **Fredlig samexistens möjlig!?** -- **JA!** -- **"The emperor has nice clothes but they’re not suitable for every occasion." /Efron** --- class: center, middle background-image: url("figs/leo.png") background-size: contain --- class: center, middle background-image: url("figs/isi.png") background-size: contain --- class: center, middle background-image: url("figs/steyerberg.jpeg") background-size: contain --- class: inverse, center, middle # Hönan eller ägget? --- # Lätt som en plätt ... - `\(X_1, X_2\)` (ålder, kön) -- - oberoende -- - `\(Y = f(X_1, X_2)\)` (längd beror på ålder och kön) -- ## Oberoende variabler - **Intervention:** påverkansbar (behandling vs kontroll) -- - **Exponering:** ej påverkansbar (demografiska variabler etc) -- ## Beroende variabel/Utfall/resultat - Primär (längd) - Sekundär (vikt) --- # ... eller inte? - oberoende variabler korrelerade -- - Kausal inferens är ett stort och växande fält -- - Olika fokus och terminologi (biostatistik vs epidemiologi) --- class: center, middle background-image: url("figs/dags.PNG") background-size: contain --- class: center, middle background-image: url("figs/dagitty.PNG") background-size: contain --- class: center, middle background-image: url("figs/greenland.png") background-size: contain --- # Effektmodifierare -- - Exponeringen ger olika effekt i olika strata -- - ålder, `\(X\)`, "påverkar" längden, `\(Y\)`, endast för unga, `\(U \in \{0,1\}\)`. -- `$$Y = \beta_0 + \beta_XX + \beta_U U + \beta_{UX}UX + \varepsilon$$` -- - **Effektmodifiering:** `\(\beta_X = 0, \beta_U = 0, \beta_{UX} \neq 0\)` -- - **Interaktionseffekt:** `\(\beta_X \neq 0, \beta_U \neq 0, \beta_{UX} \neq 0\)` --- # Störfaktor (confounder) -- > lateralt snitt påverkar risken för luxation efter THA. -- <!-- --> -- - **Känd:** justeras bort/kontrolleras för -- - **Okänd:** Snedvriden tolkning ("residual confounding") -- - Termen används på tre olika sätt (Greenland et al. Confounding and Collapsibility in Causal Inference. Statistical Science. 1999;14(1):29-46). --- # Mediator <img src="figs/mediator.png" width="50%" /> - **Effekt:** direkt + indirekt = total -- - denna relation med både störfaktor och mediator -- - inte självklart att justera -- - Table 2 fallacy -- - mediation analysis och bakdörrstest --- # Collider <img src="figs/collider.png" width="335" /> - faktor som påverkas av två andra faktorer, `\(X, Y\)` -- - `\(X\)` och `\(Y\)` kan vara oberoende av varandra ... -- - ... men kan felaktigt uppfattas som associerade om man beaktar (justerar för) "collidern" --- # Ska man orka bry sig? - **Ja:** annars risk för bias och extra osäkerhet -- - **Nej:** felaktiga antaganden kan ge mer fel än inga antaganden alls -- - **Gyllene medelväg:** lek lite med DAGitty och se vart det leder! --- class: center, middle background-image: url("figs/schisterman.png") background-size: contain --- # För en regning dag Hill AB. The environment and disease: association or causation? 1965. J R Soc Med. 2015;108(1):32-37 doi:10.1177/0141076814562718 Corraini, Priscila, Morten Olsen, Lars Pedersen, Olaf M. Dekkers, och Jan P. Vandenbroucke. Effect modification, interaction and mediation: An overview of theoretical insights for clinical investigators. Clinical Epidemiology 9 (2017): 331–38. https://doi.org/10.2147/CLEP.S129728. MacKinnon, David P., Amanda J. Fairchild, och Matthew S. Fritz. Mediation Analysis. Annual Review of Psychology 58, nr 1 (januari 2007): 593–614. https://doi.org/10.1146/annurev.psych.58.110405.085542. --- class: center, middle background-image: url("figs/hernan.PNG") background-size: contain