Onnettomuudesta posteriksi - FinnEM Akatemia Workshop 2024
https://rpubs.com/anssis/1169163
Arvioida kahden tekijän välistä:
suhdetta
sen suuruutta
ja merkiktystä
Tutki käytössä olevaa dataa (http://anssis.shinyapps.io/costafinlandia <- Datasetti)
Valitse kaksi asiaa joiden yhteyttä haluat tutkia
Luo hypoteesi ja tavoite tutkimukselle -> Kirjaa ne posteriin
Mitattavan muuttujan tyyppi vaikuttaa merkittävästi lähestymistapaan
Luokitteleva
Järjestys
Jatkuva
(aka kategorinen, faktori)
Selvät kategoriat
esim. kansallisuus, matkustaja/henkilökunta
Ei välimalleja
Tunnusluku: Moodi
(aka. Binomiaalinen, looginen, boolean, bivariaatti, tosiarvo)
Luokittelevan muuttujan erityistapaus
Voi saada vain yhden kahdesta arvosta
Tosi/Epätosi
Kyllä/Ei
Kuollut/Elossa
0/1
(aka. järjestysmuuttuja)
Luokitteleva muuttuja, jolla voidaan määritellä järjestys
Askel luokkien välillä ei tarvitse yhtäsuuri/määritettävissä
Luokittelevan ja jatkuvan välimuoto
Tunnuslukuja: moodi, mediaani
(aka. skalaari, mitta-asteikko)
Voi saada minkä hyvänsä lukuarvon
Esim. Ikä, pituus
Tunnuslukuja: moodi, mediaani, keskiarvo
“The greatest value of a picture is when it forces us to notice what we never expected to see.”
- John Tukey, Amerikkalainen tilastotieteilijä
Box-plot havainnollistaa hyvin:
Mille välille valtaosa havainnoista sijoittuu
Ryhmän mediaanin
Ryhmän raja-arvot
Box-plot soveltuu hyvin jakaumien vertailuun
Histogrammi antaa paremman kuvan jakaumasta:
Scatter-plot:
Jokainen havainto = yksi piste
Auttaa hahmottamaan
Korrelaatioita
Muita patterneja
Ryppäitä
Pisteiden väriä voi käyttää luokkien erotteluun
Voidaan yrittää sovittaa suoraa tai käyrää
Tutki kuvien avulla valitsemiesi muuttujien välisiä yhteyksiä (http://anssis.shinyapps.io/costafinlandia)
Tutki myös muiden muuttujien yhyettä valitsemiisi muuttujiin
Pohdi voiko jokin näistä olla sekoittava tekijä
Tarvittaessa kokeile eriilaisia rajauksia (eli tee sensitiivisyysanalyysi)
Valitse parhaiten tutkimuskysymykseen vastaava kuvaaja -> Siirrä se posteriin
Ristiin taulukoidaan tutkittavat luokittelevat muuttujat
Mikä on todennäköisyys saada vähintään näin suuri ero sattumalta?
-> Sen kertoo χ²-testi (khiin neliö -testi)
P = 0,028 -> 2,8 % todennäköisyys nähdä vähintään vastaava ero sattumasta johtuen
| Nainen | Mies | |
|---|---|---|
| Miehistö | 109 (11%) | 84 (8%) |
| Matkustaja | 377 (38%) | 419 (42%) |
Valitse oikea tilastollinen testi sen mukaan mitä vertasit
Kirjaa käytetty testi ja verrattavat suureet posterin menetelmiin
Kirjaa molempien ryhmien verrattavat tulokset ja p-arvot posterin tuloksiin.
Lisää vielä tulosten alkuun tutkimusjoukon kuvailu
Havaintojen lukumäärä yhteensä
Sukupuolijakauma
Muu kysymyksen kannalta olennainen kuvailu
Kuinka paljon tutkitusta asiasta oli havaintoja