Kasutatav andmefail: WV_est.RData.
Tegemist on World Values Survey Eesti andmefailiga (2011. a.), milles on muutujate hulka vähendatud. WVS on ülemaailmne projekt, milles uuritakse inimeste väärtusi ja uskumusi, kuidas need muutuvad aja jooksul ning mis mõju on neil sotsiaalsetele ja poliitilistele nähtustele. Projekti on läbiviidud alates 1981. Aastast ning selles on osalenud peaaegu 100 riiki.
Ülesanne 1. Tekitame uue muutuja – vanusegrupp. Grupeerime nii, et kuni 26-aastased (k.a.) on noortegrupp (kodeerime 1-ga), 65-aastased ja vanemad on pensioniealiste grupp (kodeerime 2-ga) ning ülejäänud vanused kodeerime 3-ga.
WV_est$GruppVanus <- NA # tekitame andmestikku uue muutuja nimega "GruppVanus". Esialgu anname igale reale puuduva väärtuse ehk NA. Järgenvalt hakkame vanuse alusel grupp moodustama.
WV_est$GruppVanus[WV_est$Age <=26] <- 1 #kõik vastajad, kelle vanus on alla või võrdne 26'ga
WV_est$GruppVanus[WV_est$Age >= 65] <- 2#kõik vastajad, kelle vanus on üle või võrdne 65'ga
WV_est$GruppVanus[WV_est$Age < 65 & WV_est$Age >26] <- 3 # vastajad, kelle vanus on alla 65 ja üle 26
table(WV_est$GruppVanus) # vaatame moodustatud gruppide suurusi
##
## 1 2 3
## 241 373 919
Ülesanne 2. Kas noored ja pensioniealised erinevad statistiliselt oluliselt
WV_est_NV <- WV_est[WV_est$GruppVanus == 1 | WV_est$GruppVanus == 2, ] # teeme uue andmestiku, kus on ainult kaks vanusegruppi: noored (grupp1) ja vanad (grupp 2)
2.1 enesekohaselt raporteeritud õnnelikkuse skaalal (feeling of happiness)?
Antud juhul on andmed järjestusskaalal. Seega peaskime kasutama mitteparameetrilisi analüüsimeetodeid.
# Kui andmed on aga intervall- või suhteskaalal, siis kontrolliga järgnevate käskudega andmete nomraaljaotust:
library(psych)
describe(WV_est_NV$FeelingOfHappiness[WV_est_NV$GruppVanus ==1])
hist(WV_est_NV$FeelingOfHappiness[WV_est_NV$GruppVanus ==1])
describe(WV_est_NV$FeelingOfHappiness[WV_est_NV$GruppVanus ==2])
hist(WV_est_NV$FeelingOfHappiness[WV_est_NV$GruppVanus ==2])
wilcox.test(FeelingOfHappiness ~ GruppVanus, data = WV_est_NV)
##
## Wilcoxon rank sum test with continuity correction
##
## data: FeelingOfHappiness by GruppVanus
## W = 27218, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
2.2 enesekohaselt raporteeritud terviseseisundi skaalal (state of health)?
wilcox.test(StateOfHealth ~ GruppVanus, data = WV_est_NV)
##
## Wilcoxon rank sum test with continuity correction
##
## data: StateOfHealth by GruppVanus
## W = 10523, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
2.3 enesekohaselt raporteeritud eluga rahulolu skaalal (satisfaction with life)?
wilcox.test(SatisfactionWithLife ~ GruppVanus, data = WV_est_NV)
##
## Wilcoxon rank sum test with continuity correction
##
## data: SatisfactionWithLife by GruppVanus
## W = 59638, p-value = 9.127e-13
## alternative hypothesis: true location shift is not equal to 0
Ülesanne 3. Haridustase ja leibkonna finantsseisuga rahulolu. Tekitame muutujast Education muutuja Haridus. Arvestame ainult keskkoolide ning ülikoolide lõpetajaid (ei arvesta ülikooli mittelõpetanuid). Kodeerime nii: 5 (Complete secondary school: technical/ vocational type) = 1 (Rak_KK) 7 (Complete secondary school: university-preparatory type) = 2 (KK) 9 (University - level education, with degree) = 3 (ylikool) All other values = NA Saame neli gruppi, millest ühte eirame oma analüüsides (4, muu).
WV_est$Haridus <- NA
WV_est$Haridus[WV_est$Education == 5] <- 1
WV_est$Haridus[WV_est$Education == 7] <- 2
WV_est$Haridus[WV_est$Education == 9] <- 3
table(WV_est$Haridus)
##
## 1 2 3
## 396 328 325
kruskal.test(FeelingOfHappiness ~Haridus, data = WV_est)
##
## Kruskal-Wallis rank sum test
##
## data: FeelingOfHappiness by Haridus
## Kruskal-Wallis chi-squared = 17.587, df = 2, p-value = 0.0001517
pairwise.wilcox.test(WV_est$FeelingOfHappiness,WV_est$Haridus)
##
## Pairwise comparisons using Wilcoxon rank sum test
##
## data: WV_est$FeelingOfHappiness and WV_est$Haridus
##
## 1 2
## 2 0.056 -
## 3 8.8e-05 0.054
##
## P value adjustment method: holm
Ülesanne 4. Uurige, kas vanus on seotud:
4.1 õnnelikkusega:
cor.test(WV_est$Age, WV_est$FeelingOfHappiness, mehtod = "spearman")
##
## Pearson's product-moment correlation
##
## data: WV_est$Age and WV_est$FeelingOfHappiness
## t = 11.988, df = 1507, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.2482942 0.3404526
## sample estimates:
## cor
## 0.2950595
4.2 terviseseisundiga:
cor.test(WV_est$Age, WV_est$StateOfHealth, mehtod = "spearman")
##
## Pearson's product-moment correlation
##
## data: WV_est$Age and WV_est$StateOfHealth
## t = 25.9, df = 1528, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.5165240 0.5862286
## sample estimates:
## cor
## 0.552341
4.3 eluga rahuloluga:
cor.test(WV_est$Age, WV_est$SatisfactionWithLife, mehtod = "spearman")
##
## Pearson's product-moment correlation
##
## data: WV_est$Age and WV_est$SatisfactionWithLife
## t = -8.9282, df = 1525, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.2700229 -0.1746671
## sample estimates:
## cor
## -0.2228781