1. Histogramm matemaatika alatesti tulemuste kohta (lisa joonisele pealkiri):
hist(pisa$PV1MATH, main = "Matemaatika alatesti skooride jaotus")
2. Tee karpdiagramm, mis illustreerib meeste ja naiste matemaatika alatestide skoore
boxplot(pisa$PV1MATH ~ pisa$Gender)
3. Matemaatika ja lugemise alatestide tulemuste seos (lisa joonisele regressioonisirge)
plot(pisa$PV1MATH, pisa$PV1READ)
abline(lm(pisa$PV1READ~pisa$PV1MATH), lwd=3, col="blue")
4. Lugemise ja loodusteaduste alatestide tulemuste seos (lisa joonisele regressioonisirge)
plot(pisa$PV1READ, pisa$PV1SCI)
abline(lm(pisa$PV1SCI~pisa$PV1READ), lwd=3, col="blue")
5. Tulpdiagramm erinevate klasside lugemise alatesti skooride kohta
barplot(tapply(pisa$PV1READ, pisa$GR, mean, na.rm=TRUE))
6. Tee eraldi histogramm naiste ja meeste matemaatika alatesti tulemuste kohta: # Vihje # Ainult 9. klassi tulemuste eraldamiseks tabelist saab kasutada koodil?iku pisa[pisa$Grade == 9,]. # Naised: 1 # Mehed: 2
hist(pisa[pisa$Gender == 1,]$PV1MATH, xlab= "naised")
hist(pisa[pisa$Gender == 2,]$PV1MATH, xlab = "mehed")
Meeldetuletus
Esimese praktikumi teemad:
1. Osalejate keskmine vanus?
mean(pisa$AGE)
## [1] 15.81886
2. Kui palju tüdrukuid ja poisse oli uuringus?
table(pisa$Gender)
##
## 1 2
## 345 401
3. Kui palju õpilasi oli erinevates klassides?
table(pisa$GR)
##
## 7 8 9
## 15 202 529
4. Võta korrelatsioon matemaatik, lugemise ja loodusteaduste alatestide tulemuste vahel
library(psych)
corr.test(pisa[,25:27])
## Call:corr.test(x = pisa[, 25:27])
## Correlation matrix
## PV1MATH PV1READ PV1SCIE
## PV1MATH 1.00 0.77 0.83
## PV1READ 0.77 1.00 0.84
## PV1SCIE 0.83 0.84 1.00
## Sample Size
## [1] 746
## Probability values (Entries above the diagonal are adjusted for multiple tests.)
## PV1MATH PV1READ PV1SCIE
## PV1MATH 0 0 0
## PV1READ 0 0 0
## PV1SCIE 0 0 0
##
## To see confidence intervals of the correlations, print with the short=FALSE option
5. Võrdle meeste ja naiste keskmisi t-testiga:
lugemine…
t.test(pisa$PV1READ ~ pisa$Gender)
##
## Welch Two Sample t-test
##
## data: pisa$PV1READ by pisa$Gender
## t = 7.251, df = 735.99, p-value = 1.049e-12
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 29.83468 51.98782
## sample estimates:
## mean in group 1 mean in group 2
## 513.5414 472.6302
matemaatika…
t.test(pisa$PV1MATH ~ pisa$Gender)
##
## Welch Two Sample t-test
##
## data: pisa$PV1MATH by pisa$Gender
## t = -2.4794, df = 726.74, p-value = 0.01339
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -25.273729 -2.936305
## sample estimates:
## mean in group 1 mean in group 2
## 498.0201 512.1252
loodusteadus…
t.test(pisa$PV1SCIE ~ pisa$Gender)
##
## Welch Two Sample t-test
##
## data: pisa$PV1SCIE by pisa$Gender
## t = -0.37242, df = 728.92, p-value = 0.7097
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -13.866146 9.444211
## sample estimates:
## mean in group 1 mean in group 2
## 525.7908 528.0017
Millised olid alatestide keskmised väärtused?
apply(pisa[,25:27], 2, mean)
## PV1MATH PV1READ PV1SCIE
## 505.6021 491.5503 526.9792