Statystyka matematyczna

Statystyki z próby

Wprowadzenie

  1. Prawo wielkich liczb

  2. CTG- centralne twierdzenie graniczne i pokrewne

  3. Jak “duża” jest duża próba?

Zadanie 1.

W ostatnim semestrze wyniki uzyskane przez studentów na egzaminie ze statystyki matematycznej kształtowały się na poziomie ~ N(18,5 pkt ; 9 pkt).

Oblicz prawdopodobieństwo, że w grupie 25 losowo wybranych studentów:

  • średni wynik będzie przekraczał 20 punktów

    Prawdopodobieństwo, że X^ przekracza 20

    E(\(X-bar\))= 18,5

    D^2(\(X-bar\))= 81/25

    D(\(X-bar\))=9/5

    P(\(X-bar\)>20)=???

    P($X-bar$>20)=1-P($X-bar$<20)=

    Standaryzacja: (20-18,5)/(9/5)=1-P(t<0,8333)=0.2064

    Wśród 20,64% próbek 25-studentów średni wynik przekroczy 20 punktów

  • wynik będzie oscylował pomiędzy 15 a 20 punktów

    EX=18.5

    D^2X=81 pkt

    DX=9

    P(15<X<20)=???

    21.75% wszystkich studentów otrzymuje zwykle od 15 do 20 punktów

  • łączny wynik 25 osób przekroczy 600 punktów

    ES=25*18.5=462.5

    D^25=81*25=2025

    DS=45

    P(S>600)=1-P(S<600)=1-P(t<3.0555(600-462.5/45))=

    Nie ma szans, że łączny wynik 25 losowo wybranych studentów przekroczy 600 punktów.

par(mfrow=c(1,3)) #dzielenie ekranu
shadeDist(0.8333,ddist = 'dt', 24, lower.tail = FALSE)
#shadeDist(20,ddist = 'dnorm', 18.5, 9/5, lower.tail = FALSE)
#nie korzystać ! ! ! ze względu na wielkość próby( za mała )

shadeDist(c(15,20), ddist = "dnorm", 18.5,9, lower.tail = FALSE)

shadeDist(3.0555, "dt",24, lower.tail = FALSE)

Zadanie 2.

Egzamin ze statystyki w pierwszym terminie zdaje co piąta osoba.

Jakie jest prawdopodobieństwo tego, że w losowo wybranej grupie 200 wylosowanych studentów zdawalność przekroczy 25%?

Prawdopodobieństwo wylosowania 200 studentów, w której zdawalność przekroczy 25% wynosi
niecałe 5% (0.04935)

shadeDist(ddist = "dbinom",c(49,200),parm1 = 200,parm2 = 0.20,lower.tail = FALSE)

Zadanie 3. \[DYI\]

Rozkład ocen ze statystyki nie jest normalny ;-) Studenci z wydziału ETI zwykle mają oceny średnie zbliżone do 130 z odchyleniem około 6 punktów. Na wydziale ZiE jednak ich średnia wynosi około 120 punktów z odchyleniem 9.

Jeśli zbadamy losowe próbki tych studentów (25 losowo wybranych z każdego z wydziałów), jakie byłoby prawdopodobieństwo, że średnia różnica ich wyników końcowych wyniosła więcej niż 5 punktów?

H0: roznica wynosi 5 pkt

HA: roznica wynosi wiecej niz 5 pkt

Z = (130-120-5) / sqrt(6/25 + 9/25)
Z > qnorm(0.95)
## [1] TRUE
# prawdopodobienstwo hipotezy zerowej
shadeDist(ddist = 'dnorm', xshade = c(-Z, Z))

# prawdopodobienstwo hipotezy alternatywnej
shadeDist(ddist = 'dnorm', xshade = c(-Z, Z), lower.tail = FALSE)

Zadanie 4. \[DYI\]

Kobiety i mężczyźni byli przepytani w ankiecie, co zrobiliby gdyby otrzymali 100 złotowy banknot pocztą, zaadresowany do ich sąsiadów. Czy zwróciliby go do sąsiadów? Z 69 wylosowanych mężczyzn, 52 odpowiedziało że tak, a z 131 kobiet, 120 odpowiedziało twierdząco.

Czy otrzymane w ankietach dane sugerują, że istnieje róznica w tych proporcjach i jest ona znacząco większa od 10 punktów procentowych?

pA=52/69=0,75362319

pB=120/131=0,91603053

H0: nie istnieje róznica miedzy grupami

HA: istnieje roznica

p1 = 120/131
p2 = 52/69
p = (120 + 52) / (131 + 69)

Z = (p1 - p2 - 0) / sqrt(p * (1-p) * (1/131 + 1/69))
Z > qnorm(0.975) 
## [1] TRUE
# istnieje różnica między grupami

prop.test(x = c(52, 120), n = c(69, 131), correct = FALSE)
## 
##  2-sample test for equality of proportions without continuity correction
## 
## data:  c(52, 120) out of c(69, 131)
## X-squared = 9.901, df = 1, p-value = 0.00165
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.274625 -0.050190
## sample estimates:
##   prop 1   prop 2 
## 0.753623 0.916031
shadeDist(ddist = 'dnorm', xshade = c(-Z, Z))

# obszar krytyczny na poziomie istotności 95%
shadeDist(ddist = 'dnorm', xshade = c(-qnorm(0.025), qnorm(0.025)))

H0: roznica w proporcji wynosi 10 punktów procentowych

HA: roznica w proporcji jest wieksza niz 10 punktów procentowych

Z = (p1 - p2 - 0.10) / sqrt(p * (1-p) * (1/131 + 1/69))
Z > qnorm(0.95)
## [1] FALSE
# nie przekroczono wartosci krytycznej, wiec nie odrzucamy H0
# roznica nie jest wieksza niz 10pkt %
shadeDist(ddist = 'dnorm', xshade = c(Z))