STATISTIČKA TEORIJA: TESTIRANJE HIPOTEZA

Hrvatski studiji

dr.sc. Luka Šikić

10 studeni, 2019

CILJEVI PREDAVANJA

KLJUČNI KONCEPTI KOD TESTIRANJA HIPOTEZA

VRSTE POGREŠAKA KOD TESTIRANJA HIPOTEZA

TESTNA STATISTIKA I SAMPLING DISTRIBUCIJA

\[ X \sim \mbox{Binomial}(\theta,N) \]

Sampling distribucija testne statistike $X$ kad je nulta hipoteza istinita. U našem prmjeru je riječ o binomnoj distribuciji. Pod nultom hipotezom je vjerojatnost $\theta = .5$, pa sampling distribucija implicira vrijednost 50 (od 100) točnih odgovora. Većina mase vjerojatnosti se nalazi izmedju vrijednopsti 40 i 60.

Sampling distribucija testne statistike \(X\) kad je nulta hipoteza istinita. U našem prmjeru je riječ o binomnoj distribuciji. Pod nultom hipotezom je vjerojatnost \(\theta = .5\), pa sampling distribucija implicira vrijednost 50 (od 100) točnih odgovora. Većina mase vjerojatnosti se nalazi izmedju vrijednopsti 40 i 60.

KRITIČKE VRIJEDNOSTI I GRANICE

\[ \begin{array}{cc} H_0 : & \theta = .5 \\ H_1 : & \theta \neq .5 \end{array} \]

Kritičke vrijednosti vezane uz hipotezu testa ESP istraživanja, za test sa razinama signifikantnosti $\alpha = .05$. Grafikon prikazuje sampling distribuciju $X$ pod nultom hipotezom: prostor u sredini odgovara vrijednostima sampling distribucije za $X$ za koje bismo zadržali nultu hipotezu. Stupci se odnose na kritičke vrijednosti: vrijednosti $X$ za koje bismo odbacili nultu hipotezu. Obzirom da je test dvostrani (i.e., omogućuje $\theta <.5$ i $\theta >.5$), kritičke granice pokrivaju oba repa distribucije. Razine $\alpha$ od $.05$impliciraju da kritička regija uključuje 2.5% sampling distribucije

Kritičke vrijednosti vezane uz hipotezu testa ESP istraživanja, za test sa razinama signifikantnosti \(\alpha = .05\). Grafikon prikazuje sampling distribuciju \(X\) pod nultom hipotezom: prostor u sredini odgovara vrijednostima sampling distribucije za \(X\) za koje bismo zadržali nultu hipotezu. Stupci se odnose na kritičke vrijednosti: vrijednosti \(X\) za koje bismo odbacili nultu hipotezu. Obzirom da je test dvostrani (i.e., omogućuje \(\theta <.5\) i \(\theta >.5\)), kritičke granice pokrivaju oba repa distribucije. Razine \(\alpha\) od \(.05\)impliciraju da kritička regija uključuje 2.5% sampling distribucije

\[ \begin{array}{cc} H_0 : & \theta \leq .5 \\ H_1 : & \theta > .5 \end{array} \]

Kritička regija za jednostrani test. U ovom slučaju je alternativna hipoteza $\theta > .05$, tako da nultu hipotezu odbacujemo samo za velike vrijednosti $X$. Zbog toga kritička regija pokriva samo gornji dio distribucije; točnije 5% distribucije.

Kritička regija za jednostrani test. U ovom slučaju je alternativna hipoteza \(\theta > .05\), tako da nultu hipotezu odbacujemo samo za velike vrijednosti \(X\). Zbog toga kritička regija pokriva samo gornji dio distribucije; točnije 5% distribucije.

p-VRIJEDNOSTI

Vrijednost \(\alpha\) Odbaci nultu hipotezu?
0.05 Da
0.04 Da
0.03 Da
0.02 Ne
0.01 Ne
Standardne konvencije za prihvaćanje \(p\) vrijednosti: konvencija je prikazati rezultate na jedan od navedenih načina (e.g., \(p<.05\)). Prikazane “zvjezdice značajnosti” (i.e., * označava \(p<.05\)) su često output u statističkim programima. Nekada se sreće notacija n.s. (not significant) umjesto \(p>.05\).
Notacija Zvjezdice Značajnost Nulta hipoteza
\(p>.05\) NA Test nije značajan Zadrži
\(p<.05\) * Test značajan na razini $= .05 ali ne \(\alpha =.01\) niti \(\alpha = .001\).$ Odbaci
\(p<.01\) ** Test značajan na razini \(\alpha = .05\) i \(\alpha = .01\) ali ne $= .001 Odbaci
\(p<.001\) *** Test značajan na svim razinama Odbaci

TESTIRANJE HIPOTEZA U R

# provedi testiranje hipoteza ESP istraživanja za 62 točna odgovora
binom.test( x=62, n=100, p=.5 )
## 
##  Exact binomial test
## 
## data:  62 and 100
## number of successes = 62, number of trials = 100, p-value =
## 0.02098
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
##  0.5174607 0.7152325
## sample estimates:
## probability of success 
##                   0.62

EFEKT VELIČINE I SNAGA TESTA

Sampling distribucija pod *alternativnom* hipotezom, za populacijski parametar $\theta = 0.55$. Značajan dio populacije leži u gornjoj kritičkoj regiji.

Sampling distribucija pod alternativnom hipotezom, za populacijski parametar \(\theta = 0.55\). Značajan dio populacije leži u gornjoj kritičkoj regiji.

Sampling distribucija pod *alternativnom* hipotezom, za populacijski parametar $\theta = 0.70$. Skoro cijela populacija leži u gornjoj kritičkoj regiji.

Sampling distribucija pod alternativnom hipotezom, za populacijski parametar \(\theta = 0.70\). Skoro cijela populacija leži u gornjoj kritičkoj regiji.

Vjerojatnost odbacivanja nulte hipoteze, prikazana kao funkcija od $\theta$. Test ima veću snagu (veća vjerojatnost ispravnog odbacivanja nulte hipoteze) što je  $\theta$ različitija od vrijednosti koju implicira nulta hipoteza (i.e., $\theta=.5$). Kada je $\theta$ jednaka .5 (točka na grafikonu), nulta hipoteza je točna.

Vjerojatnost odbacivanja nulte hipoteze, prikazana kao funkcija od \(\theta\). Test ima veću snagu (veća vjerojatnost ispravnog odbacivanja nulte hipoteze) što je \(\theta\) različitija od vrijednosti koju implicira nulta hipoteza (i.e., \(\theta=.5\)). Kada je \(\theta\) jednaka .5 (točka na grafikonu), nulta hipoteza je točna.

Dodatni koncepti

\[ P(A | B) = \frac{P(B|A) P(A)}{P(B)} \]

\[ P(H_0:točna | podatci:X) = \frac{P(podatci:X | H_0:točna) P(H_0:točna)}{P(podatci:X)} \]

\[ \frac{P( H_1:točna | podatci:X)}{P(H_0:točna | podatci:X)} \]