Für die meisten Aufgaben werden Sie die Statistiksoftware R brauchen. Die benötigten R-Befehle und kurze Programmiercodesequenzen (Skripte) stellen zur Verfügung (siehe Kursunteralgen). Dabei sind drei Aspekte hervorzuheben:
Ob wir den “wahren” Mittelwert und die “wahre” Standardabweichung des IQ’s in der Population wirklich kennen, ist diskutabel. Für diese Übung sind wir einfach mal ganz naiv und glauben dieser Website. Demnach ist der IQ normalverteilt:
\[ IQ \sim \mathcal{N(\mu = 100, \sigma = 15)}. \]
\(z_i = \frac{(x_i-\mu)}{\sigma}\)
Anhand des z-Wertes kann die Fläche unter der Normalverteilungskurve
berechnet werden. Die Funktion pnorm()
gibt dir immer die
Fläche links, bzw. unter dem angegebenen z-Wert an.
Möchtest du berechnen, wie gross die Fläche ist welche rechts, bzw. über
dem z-Wert liegt, muss du die Gegenwahrscheinlichkeit berechnen. Also
1 - pnorm()
.
Die prozentuale Fläche oberhalb des IQ-Wertes von 108 entspricht gerade der Wahrscheinlichkeit für einen Wert von 108 oder mehr:
## [1] 0.2969014
Hier das Ganze noch visuell (nicht als Übung gedacht, du kannst also den Code ignorieren…). Die grüne Fläche beträgt 29.69% der Gesamtfläche.
Merke: Fläche unter der Kurve = Wahrscheinlichkeit
## [1] 0.06017176
x1 <- 80
z1 <- (x1-mu)/sigma
p1 <- pnorm(z1) # Fläche unterhalb von 80
x2 <- 110
z2 <- (x2-mu)/sigma
p2 <- 1-pnorm(z2) # Fläche oberhalb von 110
p_tot <- 1-(p1+p2) # Die Randwahrscheinlichkeiten ziehen wir von den 100% ab
p_tot
## [1] 0.6562962
p <- 0.3
z <- qnorm(1-p) # qnorm um das Quantil der Standardnormalverteilung, also den z-Wert herauszufinden
x <- z*sigma+mu # einfache nach x auflösen
x
## [1] 107.866
## [1] 0.3
## [1] -1.644854
Anmerkung: Weil der z-Wert negativ ist, bezieht er sich auf die untere Randfläche. Für die obere Randfläche von 5% wäre der z-Wert genau gleich, einfach mit positiven Vorzeichen (weil die Kurve symmetrisch ist).
## [1] -1.959964
## [1] 1.959964
z1 <- qnorm(0.025) #Die 5% werden auf beide Seiten aufgeteilt, also die tiefsten 2.5%...
z2 <- qnorm(0.975) #... und die höchsten 2.5%
x1 <- z1 * sigma + mu
x2 <- z2 * sigma + mu
x1
## [1] 70.60054
## [1] 129.3995