Kasutame andmestikku nimega “tabel”.
Konspektis kasutatavad andmed.
Korrelatsiooni kasutatakse selleks, et uurida muutujate vahelisi seoseid ning nende seoste tugevust. Parameetriline seosekordaja on Pearsoni r, mitteparameetrilisteks seosekordajateks on Spearmani roo.
Korrelatsioonikordajate väärtused jäävad vahemikku -1 ja 1, kusjuures mida enam selle vahemiku piiridele lähemal, seda tugevam seos (korrelatsioon väärtusega 0 tähendab seose puudumist); ühtlasi näitab väärtuse ees olev pluss- või miinusmärk ka seos suunda. Positiivne korrelatsioonikordaja tähendab, et kui ühe muutuja väärtused kasvavad, kasvavad ka teise muutuja väärtused; negatiivne korrelatsioonikordaja aga näitab, et kui ühe muutuja väärtused kasvavad, teise muutuja väärtused kahanevad. Väga oluline on tähele panna ja meelde jätta, et korrelatsioon ei näita põhjuslikkust. Ka tulemuste raporteerimisel saame rääkida muutujatevahelisest seosest, mitte ühe muutuja mõjust teisele.
Vaatame, kas sotsiaalsuse ja ekstravertsuse skooride vahel on korrelatsioon R’is saame korrelatsiooni kahe muutuja vahel arvutada funtksiooniga cor.test(). Kui parameetrilise testi eeldused on täidetud, siis saame kasutada Perasoni korrelatsioonikordajat. Vaikimisi leiavadki korrelatsioonifunktsioonid R’is just selle väärtuse.
cor.test(tabel$sotsiaalsus, tabel$ekstravertsus)# saab kasutada kahete muutujat
##
## Pearson's product-moment correlation
##
## data: tabel$sotsiaalsus and tabel$ekstravertsus
## t = 7.4918, df = 197, p-value = 2.239e-12
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.3550503 0.5724810
## sample estimates:
## cor
## 0.470886
Kui parameetrilise testi eeldused ei ole aga täidetud, siis peaksime leidma Spearmani rho. Selle leidmiseks peame lisama ühe argumendi funtksioonile juurde:
cor.test(tabel$sotsiaalsus, tabel$ekstravertsus, method = "spearman")# saab kasutada kahete muutujat
## Warning in cor.test.default(tabel$sotsiaalsus, tabel$ekstravertsus, method
## = "spearman"): Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: tabel$sotsiaalsus and tabel$ekstravertsus
## S = 679840, p-value = 5.411e-13
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.4823826
R’is saab arvutada mitu korrelatsiooni korraga. Psych paketi funktsioon corr.test() teeb meile korrelatsioonimaatriksi.
# install.packages("psych")
library("psych") #nüüd saame kasutada paketi funktsioone
## Warning: package 'psych' was built under R version 3.5.1
corr.test(tabel[,c("avatus","depressioon","traitanx")])
## Call:corr.test(x = tabel[, c("avatus", "depressioon", "traitanx")])
## Correlation matrix
## avatus depressioon traitanx
## avatus 1.00 -0.06 -0.08
## depressioon -0.06 1.00 0.66
## traitanx -0.08 0.66 1.00
## Sample Size
## [1] 200
## Probability values (Entries above the diagonal are adjusted for multiple tests.)
## avatus depressioon traitanx
## avatus 0.00 0.48 0.48
## depressioon 0.40 0.00 0.00
## traitanx 0.24 0.00 0.00
##
## To see confidence intervals of the correlations, print with the short=FALSE option
Seost kahe muutuja vahel saab illustreerida hajuvusdiagrammiga:
plot(x = tabel$sotsiaalsus, y = tabel$ekstravertsus)
reg1 <- lm(tabel$ekstravertsus~tabel$sotsiaalsus)#arvutab regressioonisirge
abline(reg1)#lisme regressioonisirge eelnevale joonisele
Teeme joonise ilusamaks:
plot(x = tabel$sotsiaalsus, y = tabel$ekstravertsus, main ="Korrelatsioon", ylab = "ekstravertsus", xlab ="sotsiaalsus")
abline(reg1, col = "blue", lwd = 2)#lisme regressioonisirge eelnevale joonisele