Selle praktikumi eesmärkideks on läbi teha järgmised tegevused:
(1) kahe sõltumatu grupi keskmiste võrdlemine parameetrilise ja mitteparameetrilise testiga (t test),
(2) kahe sõltuva grupi keskmiste võrdlemine parameetrilise ja mitteparameetrilise testiga,
Joonis 1. Keskmiste võrdlemine kahe grupi korral.
(3) rohkem kui kahe grupiga keskmiste võrdlemine parameetrilise (ANOVA) ja mitteparameetrilise (Kurskal-Wallis) testiga.

Konspektis kasutatavad andmed.

Sõltumatute gruppidega t-test

Parameetriline

Kasutame andmestikku nimega “test11”.

Järelduste tegemisel ei piisa sellest, kui näidata, et kahe grupi keskmised on erinevad – lisaks on vaja teada, kas see leid on statistiliselt oluline või mitte. Kahe sõltumatu grupi keskmiste erinevuse uurimiseks kasutame kahe sõltumatu grupiga (Student’i) t-testi; ei tasu aga unustada esmalt testida parameetrilisi eeldusi. (parameetrilise testi eelduste kohta vaadake konspekti: …..)

Uurime hüpoteesi: poiste matemaatika tulemused on paremad kui tüdrukute omad.

Selle testi tegemiseks kasutame funktsiooni t.test():
t.test(y~x), kus y on numbriline tunnus ja x on kategooria (binaarne).

# kahe sõltumatu grupiga t-test
t.test(test11$matemaatika ~ test11$Sugu) 
## 
##  Welch Two Sample t-test
## 
## data:  test11$matemaatika by test11$Sugu
## t = 9.1097, df = 1198.4, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.654612 2.562937
## sample estimates:
## mean in group 1 mean in group 2 
##        9.460526        7.351752
#aggregate(test11$matemaatika ~ test11$Sugu, FUN = sd) 

Statistikas on saanud traditsiooniks kasutada olulisusnivoosid 0.01 (ehk 1%) ja 0.05 (ehk 5%). Valides olulisusnivooks 0.05, peab olulisustõenäosus selleks, et nullhüpoteesi ümber lükata, olema väiksem kui 0.05 ning vastavalt olulisusnivoo 0.01 korral peab ta olema väiksem kui 0.01.

Antud väljundist tuleks seega vaadata p-väärtust (p-value). Antud juhul on p-väärtus <2.2e-16 ehk p-väärtus on \(2.2∗10^{-16}\). Sellist kirjapilti kasutatakse väga väikeste väärtuste esitamiseks. Saame julgelt öelda, et p-väärtus on väiksem kui 0.01.

Kuid teadmisest, kuidas näevad välja gruppide keskmised ning kas gruppidevaheline erinevus on oluline või mitte, üksi ei piisa. Need tulemused tuleb kuidagi ka kirjapilti saada. T-testi raporteeritakse järgnevalt:

“T-test näites, et poiste (M = (antud grupi keskmine), SD = (antud grupi sdandardhälve)) keskmine tulemus matemaatika testis oli statistiliselt oluliselt kõrgem kui tüdrukute oma (M = (antud grupi keskmine), SD = (antud grupi sdandardhälve)), t(kirjuta siia df väärtus) = (kirjuta siia t väärtus), p = (kirjuta siia p-väärtus), [efektisuuruse statistik] = (kirjuta siia efekti suurus).”

“T-test näites, et poiste (M = 11.39, SD = 4.52) keskmine tulemus matemaatika testis oli statistiliselt oluliselt kõrgem kui tüdrukute oma (M = 2.92, SD = 3.86), t(1198) = 9.11, p < 0.01.”

Mitteparameetriline

Kasutame andmestikku nimega “koolid”.
Mis juhtub siis, kui parameetriliste testide parameetrid (ehk eeldused siin kontekstis) ei ole täidetud? Väga lihtne – appi saab võtta mitteparameetrilised testid.

Vaatame, kas antisotsiaalsuse (tunnus “antisotsiaalsus2”“) keskmised tulemused erinevad sugude lõikes.
Selle testi tegemiseks kasutame Mann-Whitney U testi. R-is saame seda teha funktsiooniga wilcox.test():
wilcox.test(y ~ x), kus y on numbriline tunnus ja x on kategooria (binaarne).

# kahe sõltumatu grupiga Mann-Whitney U Test 
wilcox.test(koolid$antisots2 ~ koolid$sugu) 
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  koolid$antisots2 by koolid$sugu
## W = 8970.5, p-value = 2.673e-06
## alternative hypothesis: true location shift is not equal to 0

Sõltuvate gruppidega t-test

Kasutame andmestikku nimega “AUhinnangud”.
Tegemist on ühe koolitöö raames kogutud andmestikuga, milles näidati naisterahvastele 10 mehe pilte, mida paluti atraktiivsuse (A) ja usaldusväärsuse (U) 10-palli-skaalal hinnata. Igast pildist oli 2 versiooni: (1) ühel juhul vaatas isik otse, (2) teisel juhul oli pilti töödeldud nii, et pilk oli suunatud kõrvale (andmestikus on märge “a”“, mis tuleneb ingliskeelsest sõnast averted). Hüpoteesideks oli, et otsepilguga pilte hinnati keskmiselt (H1) atraktiivsemaks ning (H2) usaldusväärsemaks. Kas need hüpoteesid leidsid kinnitust ka andmestikust?
Katsetingimuste keskmised tulemused on juba välja arvutatud:

  1. U_kesk - usaldusväärsuse hinnang, isik pildil vaatas otse
# Arvutuskäigu näide:  
# loob andmestikku uue veeru nimega "U_kesk"
AUhinnangud$U_kesk = mean(U1.1,U1.2,U1.3,U1.4,U1.5,U1.6,U1.7,U1.8, U1.9, U1.10, na.rm =TRUE) #na.rm =TRUE - arvutuskäik ignoreerib puuduvaid väärtusi
  1. U_kesk_a - usaldusväärsuse hinnang, isik pildil vaatas kõrvale
  2. A_kesk - atraktiivsuse hinnang, isik pildil vaatas otse
  3. A_kesk_a - atraktiivsuse hinnang, isik pildil vaatas kõrvale

Parameetriline

Uurime välja, kas hüpotees, et otsepilguga pilte hinnati usaldusväärsemaks, leidis kinnitust. Selle testi tegemiseks kasutame sõltuvate valimitega t-testi.
Seda saame teha funktsiooniga t.test(), aga seekord lisame argumendi “paired=TRUE”:
t.test(y1,y2,paired=TRUE), kus y1 ja y2 on mõlemad numbrilised muutujad

Kas otsepilguga pilte hinnati keskmiselt usaldusväärsemaks?

# sõltuvate gruppidega t-test
t.test(AUhinnangud$U_kesk, AUhinnangud$U_kesk_a,paired=TRUE) 
## 
##  Paired t-test
## 
## data:  AUhinnangud$U_kesk and AUhinnangud$U_kesk_a
## t = 5.0326, df = 29, p-value = 2.317e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.2235895 0.5297438
## sample estimates:
## mean of the differences 
##               0.3766667

Kas otsepilguga pilte hinnati keskmiselt atraktiivsemaks?

# sõltuvate gruppidega t-test
t.test(AUhinnangud$A_kesk, AUhinnangud$A_kesk_a,paired=TRUE) 
## 
##  Paired t-test
## 
## data:  AUhinnangud$A_kesk and AUhinnangud$A_kesk_a
## t = 4.9505, df = 29, p-value = 2.911e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.2347442 0.5652558
## sample estimates:
## mean of the differences 
##                     0.4

Mitteparameetriline

Kui parameetrilise testi eeldused on rikutud, siis tuleks siinkohal kasutada Wilcoxon Signed Rank testi.
Võrdleme atraktiivsusele ja usaldusväärsusele antud hinnaguid ka mitteparameetriliste testidega.

Selle testi tegemiseks kasutame funktsiooni wilcox.test(), aga seekord lisame argumendi “paired=TRUE”:
wilcox.test(y1,y2,paired=TRUE), kus y1 ja y2 on mõlemad numbrilised muutujad

# kahe sõltuva grupiga Wilcoxon Signed Rank Test 
wilcox.test(AUhinnangud$U_kesk, AUhinnangud$U_kesk_a,paired=TRUE) 
# kahe sõltuva grupiga  Wilcoxon Signed Rank Test 
wilcox.test(AUhinnangud$A_kesk, AUhinnangud$A_kesk_a,paired=TRUE) 

Ülesanded I

  1. Kas meeste ja naiste keskmised tulemused tekstimõistmise testis on erinevad? Mis on selle väite olulisuse tõenäosus? (andmestik “test11”)

  2. Kas meeste ja naiste keskmised tulemused ruumilise võimekuse testis on erinevad? Mis on selle väite olulisuse tõenäosus? (andmestik “test11”)

  3. Kas meest ja naiste keskmised tulemused sõnavara testis on erinevad? Mis on selle väite olulisuse tõenäosus? (andmestik “test11”)

Keskmiste võrdlemine rohkem kui 2 rühma korral

Sageli hõlmavad eksperimentaalsed uuringud enam kui kahe grupi või tingimuse võrdlusi. Näiteks võib ravimiuurijaid huvitada, kas (a) ravim on parem kui platseebo ning (b) kui suur doos ravimit on parima mõjuga? Tihtipeale võrreldakse sellistes olukordades nt kolme gruppi – platseebot saanud, madala ning kõrge doosiga eksperimentaalsed rühmad. Mitme grupi võrdlemiseks kasutatakse dispersioonanalüüsi(ANOVA).

Parameetriline

Kasutame andmestikku nimega “iqdata”.
Tegemist on simuleeritud andmestikuga tudengite kohta; muutujateks on eriala, IQ skoor ning vanus. Andmestiku allikas: http://staff.bath.ac.uk/pssiw/stats2/page16/page16.html

Uurime, kas erialade vahel esineb erinevusi IQ skooris.

Vaatame, kuidas teha ühesuunalist ANOVA’t “ez” paketiga.

install.packages("ez")
library(ez)

Tavalise ühesuunalise ANOVA puhul kasutatakse järgmisi argumente:

ezANOVA(
    data = andmestiku nimi,
    dv = sõltuv muutuja,
    wid = veerg, kus on katseisiku tunnus,
    between = sõltumatu muutuja,
    type = 3 # ruutude summa arvutamise meetod
)

Meie uurimisküsimuse puhul näeks analüüs välja järgmine:

iq_anova <- ezANOVA(data = iqdata,
                    dv  = iq,
                    wid = subject,
                    between = group,
                    type = 3,
                    detailed = TRUE)
## Warning: Converting "subject" to factor for ANOVA.
## Coefficient covariances computed by hccm()
print(iq_anova)
## $ANOVA
##        Effect DFn DFd       SSn      SSd          F            p p<.05
## 1 (Intercept)   1  42 71840.089 1604.533 1880.47432 1.657565e-36     *
## 2       group   2  42  1529.378 1604.533   20.01637 7.843384e-07     *
##         ges
## 1 0.9781532
## 2 0.4880093
## 
## $`Levene's Test for Homogeneity of Variance`
##   DFn DFd      SSn      SSd        F          p p<.05
## 1   2  42 113.6444 874.6667 2.728506 0.07690009

Post-hoc testide tegemiseks saab kasutada funtksiooni pairwise.t.test():
pairwise.t.test(y, g), kus y on sõltuv tunnus ja g on sõltumatu muutuja ehk grupeeriv tunnus.

pairwise.t.test(iqdata$iq,iqdata$group)

Mitteparameetriline

ANOVA mitteparameetriliseks analoogiks on Kruskall-Wallis test.
Testime hüpoteesi ka mitteparameetrilise testiga.
Selle testi tegemiseks kasutame funktsiooni kurskal.test():
kruskal.test(y ~ A, data=mydataframe), kus y on sõltuv tunnus ja A on sõltumatu muutuja ehk erinevad grupid.

kruskal.test(iq ~group, data = iqdata) 
## 
##  Kruskal-Wallis rank sum test
## 
## data:  iq by group
## Kruskal-Wallis chi-squared = 29.205, df = 2, p-value = 4.552e-07

Post-hoc testide tegemiseks saab kasutada funtksiooni pairwise.wilcox.test():
pairwise.wilcox.test(y, g), kus y on sõltuv tunnus ja g on sõltumatu muutuja ehk grupeeriv tunnus.

pairwise.wilcox.test(iqdata$iq,iqdata$group)

Ülesanded II

Kasutage andmefaili “diet”. Andmete allikas on https://www.sheffield.ac.uk/mash/data. Andmestikus on 76 katseisikut, kes kasutasid kümne nädala jooksul ühte kolmest dieediplaanist.

  1. Missugune dieediplaan (andmestikus veerg nimega “diet”; kolm erinevat dieediplaani: 1,2,3) oli kõige parem kaalulangetamiseks? Vaadake ANOVA’ga, kas dieediplaanide vahel oli statistiliselt oluline erinevus kaalulangetamise suhtes (“weightLost”). Tehke ka post-hoc testid.
  2. Kas kaalulangetamine erines sugude lõikes?