Statystyka matematyczna
Statystyki z próby
Wprowadzenie
Jak “duża” jest duża próba?
Zadanie 1.
W ostatnim semestrze wyniki uzyskane przez studentów na egzaminie ze statystyki matematycznej kształtowały się na poziomie ~ N(18,5 pkt ; 9 pkt).
Oblicz prawdopodobieństwo, że w grupie 25 losowo wybranych studentów:
średni wynik będzie przekraczał 20 punktów
Prawdopodobieństwo, że X^ przekracza 20
E(\(X-bar\))= 18,5
D^2(\(X-bar\))= 81/25
D(\(X-bar\))=9/5
P(\(X-bar\)>20)=???
P($X-bar$>20)=1-P($X-bar$<20)=
Standaryzacja: (20-18,5)/(9/5)=1-P(t<0,8333)=0.2064
Wśród 20,64% próbek 25-studentów średni wynik przekroczy 20 punktów
wynik będzie oscylował pomiędzy 15 a 20 punktów
EX=18.5
D^2X=81 pkt
DX=9
P(15<X<20)=???
21.75% wszystkich studentów otrzymuje zwykle od 15 do 20 punktów
łączny wynik 25 osób przekroczy 600 punktów
ES=25*18.5=462.5
D^25=81*25=2025
DS=45
P(S>600)=1-P(S<600)=1-P(t<3.0555(600-462.5/45))=
Nie ma szans, że łączny wynik 25 losowo wybranych studentów przekroczy 600 punktów.
par(mfrow=c(1,3)) #dzielenie ekranu
shadeDist(0.8333,ddist = 'dt', 24, lower.tail = FALSE)
#shadeDist(20,ddist = 'dnorm', 18.5, 9/5, lower.tail = FALSE)
#nie korzystać ! ! ! ze względu na wielkość próby( za mała )
shadeDist(c(15,20), ddist = "dnorm", 18.5,9, lower.tail = FALSE)
shadeDist(3.0555, "dt",24, lower.tail = FALSE)Zadanie 2.
Egzamin ze statystyki w pierwszym terminie zdaje co piąta osoba.
Jakie jest prawdopodobieństwo tego, że w losowo wybranej grupie 200 wylosowanych studentów zdawalność przekroczy 25%?
Prawdopodobieństwo wylosowania 200 studentów, w której zdawalność
przekroczy 25% wynosi
niecałe 5% (0.04935)
shadeDist(ddist = "dbinom",c(49,200),parm1 = 200,parm2 = 0.20,lower.tail = FALSE)Zadanie 3. \[DYI\]
Rozkład ocen ze statystyki nie jest normalny ;-) Studenci z wydziału ETI zwykle mają oceny średnie zbliżone do 130 z odchyleniem około 6 punktów. Na wydziale ZiE jednak ich średnia wynosi około 120 punktów z odchyleniem 9.
Jeśli zbadamy losowe próbki tych studentów (25 losowo wybranych z każdego z wydziałów), jakie byłoby prawdopodobieństwo, że średnia różnica ich wyników końcowych wyniosła więcej niż 5 punktów?
H0: roznica wynosi 5 pkt
HA: roznica wynosi wiecej niz 5 pkt
Z = (130-120-5) / sqrt(6/25 + 9/25)
Z > qnorm(0.95)## [1] TRUE
# prawdopodobienstwo hipotezy zerowej
shadeDist(ddist = 'dnorm', xshade = c(-Z, Z))# prawdopodobienstwo hipotezy alternatywnej
shadeDist(ddist = 'dnorm', xshade = c(-Z, Z), lower.tail = FALSE)Zadanie 4. \[DYI\]
Kobiety i mężczyźni byli przepytani w ankiecie, co zrobiliby gdyby otrzymali 100 złotowy banknot pocztą, zaadresowany do ich sąsiadów. Czy zwróciliby go do sąsiadów? Z 69 wylosowanych mężczyzn, 52 odpowiedziało że tak, a z 131 kobiet, 120 odpowiedziało twierdząco.
Czy otrzymane w ankietach dane sugerują, że istnieje róznica w tych proporcjach i jest ona znacząco większa od 10 punktów procentowych?
pA=52/69=0,75362319
pB=120/131=0,91603053
H0: nie istnieje róznica miedzy grupami
HA: istnieje roznica
p1 = 120/131
p2 = 52/69
p = (120 + 52) / (131 + 69)
Z = (p1 - p2 - 0) / sqrt(p * (1-p) * (1/131 + 1/69))
Z > qnorm(0.975) ## [1] TRUE
# istnieje różnica między grupami
prop.test(x = c(52, 120), n = c(69, 131), correct = FALSE)##
## 2-sample test for equality of proportions without continuity correction
##
## data: c(52, 120) out of c(69, 131)
## X-squared = 9.901, df = 1, p-value = 0.00165
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.274625 -0.050190
## sample estimates:
## prop 1 prop 2
## 0.753623 0.916031
shadeDist(ddist = 'dnorm', xshade = c(-Z, Z))# obszar krytyczny na poziomie istotności 95%
shadeDist(ddist = 'dnorm', xshade = c(-qnorm(0.025), qnorm(0.025)))H0: roznica w proporcji wynosi 10 punktów procentowych
HA: roznica w proporcji jest wieksza niz 10 punktów procentowych
Z = (p1 - p2 - 0.10) / sqrt(p * (1-p) * (1/131 + 1/69))
Z > qnorm(0.95)## [1] FALSE
# nie przekroczono wartosci krytycznej, wiec nie odrzucamy H0
# roznica nie jest wieksza niz 10pkt %
shadeDist(ddist = 'dnorm', xshade = c(Z))