Määrällinen tutkimus

Onnettomuudesta posteriksi - FinnEM Akatemia Workshop 2024

https://rpubs.com/anssis/1169163

Määrällinen tutkimus

Tavoite:

Arvioida kahden tekijän välistä:

  • suhdetta

  • sen suuruutta

  • ja merkiktystä

Tehtävä:

  1. Tutki käytössä olevaa dataa (http://anssis.shinyapps.io/costafinlandia <- Datasetti)

  2. Valitse kaksi asiaa joiden yhteyttä haluat tutkia

  3. Luo hypoteesi ja tavoite tutkimukselle -> Kirjaa ne posteriin

Mitattavat muuttujat

Mitattavan muuttujan tyyppi vaikuttaa merkittävästi lähestymistapaan

  • Luokitteleva

  • Järjestys

  • Jatkuva

Luokitteleva

(aka kategorinen, faktori)

  • Selvät kategoriat

  • esim. kansallisuus, matkustaja/henkilökunta

  • Ei välimalleja

  • Tunnusluku: Moodi

Binääri

(aka. Binomiaalinen, looginen, boolean, bivariaatti, tosiarvo)

  • Luokittelevan muuttujan erityistapaus

  • Voi saada vain yhden kahdesta arvosta

  • Tosi/Epätosi

  • Kyllä/Ei

  • Kuollut/Elossa

  • 0/1

Ordinaali

(aka. järjestysmuuttuja)

  • Luokitteleva muuttuja, jolla voidaan määritellä järjestys

  • Askel luokkien välillä ei tarvitse yhtäsuuri/määritettävissä

  • Luokittelevan ja jatkuvan välimuoto

  • Tunnuslukuja: moodi, mediaani

Jatkuva

(aka. skalaari, mitta-asteikko)

  • Voi saada minkä hyvänsä lukuarvon

  • Esim. Ikä, pituus

  • Tunnuslukuja: moodi, mediaani, keskiarvo

Kuvaajat

“The greatest value of a picture is when it forces us to notice what we never expected to see.”

- John Tukey, Amerikkalainen tilastotieteilijä

Luokitteleva muuttuja

Luokitteleva - Luokitteleva

Jatkuva muuttuja

Box-plot havainnollistaa hyvin:

  • Mille välille valtaosa havainnoista sijoittuu

  • Ryhmän mediaanin

  • Ryhmän raja-arvot

Jatkuva - Luokitteleva

Box-plot soveltuu hyvin jakaumien vertailuun

Jatkuva

Histogrammi antaa paremman kuvan jakaumasta:

  • Pylvään korkeus kertoo havaintojen lukumäärän
  • Yleiset arvot korostuvat

Jatkuva - Jatkuva

Scatter-plot:

  • Jokainen havainto = yksi piste

  • Auttaa hahmottamaan

    • Korrelaatioita

    • Muita patterneja

    • Ryppäitä

Jatkuva - Jatkuva

Pisteiden väriä voi käyttää luokkien erotteluun

Jatkuva - Jatkuva

Voidaan yrittää sovittaa suoraa tai käyrää

Tehtävä:

  1. Tutki kuvien avulla valitsemiesi muuttujien välisiä yhteyksiä (http://anssis.shinyapps.io/costafinlandia)

    • Pohdi tukevatko löydökset hypoteesiasi
  2. Tutki myös muiden muuttujien yhyettä valitsemiisi muuttujiin

    • Pohdi voiko jokin näistä olla sekoittava tekijä

    • Tarvittaessa kokeile eriilaisia rajauksia (eli tee sensitiivisyysanalyysi)

  3. Valitse parhaiten tutkimuskysymykseen vastaava kuvaaja -> Siirrä se posteriin

Methods - Menetelmät

Osuuksien vertailu

  • Ristiin taulukoidaan tutkittavat luokittelevat muuttujat

  • Mikä on todennäköisyys saada vähintään näin suuri ero sattumalta?

  • -> Sen kertoo χ²-testi (khiin neliö -testi)

  • P = 0,028 -> 2,8 % todennäköisyys nähdä vähintään vastaava ero sattumasta johtuen

Nainen Mies
Miehistö 109 (11%) 84 (8%)
Matkustaja 377 (38%) 419 (42%)

Keskiarvojen vertailu

  • Normaalisti keskiarvoa esiintyy eniten
  • Mitä poikkeavampi, sitä epätodennäköisempi
  • “Normaalijakauma”
  • Yksinkertaista laskea kuinka todennäköisiä erisuuruiset poikkeamat
  • t-testi

Jos aineisto ei ole normaalisti jakautunut

  • Todennäköisyydet pääteltävä itse aineistosta
  • Monimutkisempi testi (tietokoneelle)
  • Tarvitaan isompi aineisto
  • Suurempi p-arvo samalla aiineistolla

Tehtävä:

  1. Valitse oikea tilastollinen testi sen mukaan mitä vertasit

  2. Kirjaa käytetty testi ja verrattavat suureet posterin menetelmiin

  3. Kirjaa molempien ryhmien verrattavat tulokset ja p-arvot posterin tuloksiin.

  4. Lisää vielä tulosten alkuun tutkimusjoukon kuvailu

    1. Havaintojen lukumäärä yhteensä

    2. Sukupuolijakauma

    3. Muu kysymyksen kannalta olennainen kuvailu

    4. Kuinka paljon tutkitusta asiasta oli havaintoja