JÄLKITEHTÄVÄT 1

Tehtävä 1.

Heikki mittasi lepopulssiaan ja sai seuraavat tulokset: 67, 62, 58, 74, 65, 66, 63. Määritä 95 % luottamusväli Heikin keskimääräiselle lepopulssille.

data <- c(67, 62, 58, 74, 65, 66, 63)
n <- length(data)
m <- mean(data)
conf.level <- 0.95
z <- qt((1+conf.level)/2, df=n-1)
se <- sd(data)/sqrt(n)
ci <- z*se
ci
## [1] 4.593297
low <- m-ci
low
## [1] 60.4067
high <- m+ci
high
## [1] 69.5933

Vastaus: luottamusväli on +-4.5932 -> 60.4067 - 69.5933

Tehtävä 2.

Estimoitaessa normaalisti N(u;2,2) jakautuneen satunnaissuureen odotusarvoa u, otetaan n kpl:n otos. Kuinka suuri otos on valittava, että u:n 99 %:n luottamusvälin pituus ei ole suurempi kuin 1,5?

ci <- 1.5/2
sd <- 2.2
conf.level <- 0.99
z <- qnorm((1+conf.level)/2, mean = 0, sd = sd)
#ci = z * sd / sqrt(n) -> n = (z * sd / ci)^2
n <- (z*sd/ci)^2
n
## [1] 276.3137

Vastaus: n=276.3137 -> 276

Tehtävä 3.

Internetgallupissa kysyttiin 1500 suomalaiselta, onko heillä ilmalämpöpumppua. Ilmalämpöpumpun sanoi omistavansa 52,9 %. Määritä 95 %:n luottamusväli ilmalämpöpumpun omistavien suhteelliselle osuudelle.

n <- 1500
conf.level <- 0.95
successes.level <- 0.529
alpha <- 1-conf.level
binconf(n*successes.level, n, alpha = alpha)
##  PointEst     Lower     Upper
##     0.529 0.5036977 0.5541542

Vastaus: luottamusväli on 50,4 - 55,4 %

Tehtävä 4.

Otoksesta, jonka koko on a) 35 b) 100, saadaan otoskeskiarvoksi 168.1 cm? Perusjoukon keskihajonta on sd=10,0 cm. Testaa, poikkeaako u arvosta 172 tilastollisesti. H0 ei poikkea merkitsevästi H1 poikkeaa

qnorm((1+0.95)/2)
## [1] 1.959964
# < 0,05 (α = 5 %) on tilastollisesti melkein merkitsevä z=1.959964
qnorm((1+0.99)/2) 
## [1] 2.575829
# < 0,01 (α = 1 %) on tilastollisesti merkitsevä z=2.575829
qnorm((1+0.999)/2)
## [1] 3.290527
# < 0,001 (α = 0,1 %) on tilastollisesti erittäin merkitsevä. z=3.290527
m <- 168.1
mu <- 172
sd <- 10

# a
a.n <- 35
a.z <- (m-mu)/(sd/sqrt(a.n))
a.z
## [1] -2.307271
# b
b.n <- 100
b.z <- (m-mu)/(sd/sqrt(b.n))
b.z
## [1] -3.9

Vastaus: Az = 2.307271 < 2.575829 (1%), H0 säilyy: poikkeama on tilastollisesti melkein merkitsevästi Bz = 3.9 > 3.290527 (0.1%), H0 hylätään: poikkeama on tilastollisesti erittäin merkitsevä

Tehtävä 5.

Suklaakonvehtirasian sisällön painoksi ilmoitetaan 300 g. Tuotannon luotettavuutta testattiin 20 rasian otoksella. Otoksen keskiarvo oli 295 g ja keskihajonta 7,8 g. Testaa kaksisuuntaisella testillä 5%:n riskitasolla voidaanko luottaa siihen, että rasioiden keskipaino on 300 g. H0: rasioiden keskipaino on 300 g

n=20
m=295
sd=7.8
mu=300
t <- (m-mu)/(sd/sqrt(n))
t
## [1] -2.866754
alpha <- 0.05 
t.half.alpha <- qt(1-alpha/2, df=n-1)
-t.half.alpha
## [1] -2.093024

Vastaus: H0 hylätään koska testin t tulos ylittää 5% riskirajan.

Tehtävä 6.

Empaattisuutta käsittelevässä tutkimuksessa tyttöjen ja poikien saamat pistemäärät olivat seuraavat: Tyttö 52 56 56 58 60 62 68 74 Poika 60 58 56 54 52 50 48 46 Selvitä kaksisuuntaisella testillä, onko tyttöjen ja poikien keskiarvoissa eroa

g <- c(60, 58, 56, 54, 52, 50, 48, 46)  
b <- c(52, 56, 56, 58, 60, 62, 68, 74)
boxplot(g,b)

t.test(g, b, var.eq=TRUE)
## 
##  Two Sample t-test
## 
## data:  g and b
## t = -2.5251, df = 14, p-value = 0.02426
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -14.332658  -1.167342
## sample estimates:
## mean of x mean of y 
##     53.00     60.75

Vastaus: Ho hylätään koska keskiarvojen erot eivät ole yhtäläiset

Tehtävä 7.

Testaa 5 % riskillä, noudattavatko linja-autojen kulkuajat tasaista jakaumaa. Tätä varten laskettiin tunnin aikana havaintopisteen ohittavat linja-autot ja saatiin seuraava empiirinen jakauma: Tunnin neljännes 1. 2. 3. 4. Autojen lukumäärä 6 15 9 18 H0: tasainen jakauma H1: epätasainen jakauma

data <- c(6, 15, 9, 18)
chisq.test(data)
## 
##  Chi-squared test for given probabilities
## 
## data:  data
## X-squared = 7.5, df = 3, p-value = 0.05756

Vastaus: H0 säilyy koska p-value 0.05756 > 5% riskiraja

Tehtävä 8.

Väitettiin, että pojat ovat enemmän poissa koulusta kuin tytöt. Asiaa selvitettiin valitsemalla umpimähkään 50 pojan ja 75 tytön otos. Pojista 14 ja tytöistä 13 oli ollut poissa koulusta edellisen kuukauden aikana. Testaa väite 5%:n riskitasolla. H0: ei merkitsevää eroa H1: pojat on enemmän poissa

b.c <- 50
b.out <- 14
g.c <- 75
g.out <- 13
prop.test(matrix(c(b.out, g.out, b.c, g.c), ncol=2))
## 
##  2-sample test for equality of proportions with continuity
##  correction
## 
## data:  matrix(c(b.out, g.out, b.c, g.c), ncol = 2)
## X-squared = 0.83945, df = 1, p-value = 0.3596
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.06798605  0.21003150
## sample estimates:
##    prop 1    prop 2 
## 0.2187500 0.1477273

Vastaus: p-arvolla = 0.3596 ero ei ole tilastollisesti merkitsevä