Inferenza

Test di ipotesi sulla media di una signola popolazione

H0: mu = mu_0
H1: mu != mu_0

Guardo la media campionaria e vedo se questa media che hanno generato i dati è mu_0 o no. Noi conosciamo la media campionaria mu e varianza sigma^2/n.

Se assumo che sia vero H0, quanto è improabbile che mu_0 sia la mia media ? Devo scegliere entro quali valori per me è vera H0 o no.

La distribuzione non la conosco quindi mi riconduco a una distribuzione che conosco: STATISTICA TEST.

Si aprono così tre alternative:

sigma^2 è nota: statistica test è z_0 = (mu - mu_0)/sigma ~ N(0,1)

Se p-value è troppo piccolo (<0.05) allora mu != mu_0 ==> rifiuto H0.

sigma^2 non nota e n è grande: Stimo sigma con la viarianza campionaria, prechè se n è molto grande allora la posso stimare con la varianza campionaria. La statistica test è sempre la normale N(0,1).
sigma^2 non nota e n è piccolo: Stimo sempre sigma^2 con la varianza campionaria, ma non è la statistica test non è una normale ma una t-student.

Confronto tra due distribuzioni

Se ho due distribuzioni X1~N(mu_1,sigma^2_1) e X2~N(mu_2,sigma^2_2) guardo alla differenza:

H0: mu_1 = mu_2
H1: mu_1 != mu_2

Guardo alla distribuzione che è la differenza delle due distribuzioni: X1-X2 ~ N(mu_1-mu_2, Sigma/sigma).

sigma^2_i è nota: statistica test è z_0 = (X1-X2-0)/sigma ~ N(0,1) Se p-value è troppo piccolo (<0.05) ==> rifiuto H0.
sigma^2_i non nota e n è grande: Stimo sigma con la viarianza campionaria, prechè se n è molto grande allora la posso stimare con la varianza campionaria. La statistica test è sempre la normale N(0,1).
sigma^2 non nota e n è piccolo: L’unico caso che posso gestire è assumere che siano uguali sigma_1 = sigma_2. Quindi stimo sigma con la media pesata delle varianze campionarie delle due distribuzioni.

Supponiamo che X ~ F(params), ovvero che X abbia una distribuzione F nota dipendetne da uno o più parametri. La distribuzione è identificata da una quallsiasi tra le tre funzioni seguenti:

ANOVA (più di due distribuzioni)

é un estensione della t-test a piu di due gruppi (distribuzioni).

Vede se ci sono delle significative differenze tra piu di due gruppi.

H0: all the means are the same

H1: there is a difference between at least two groups.
Quindi si calcola:

Devianza esterna (tra gruppi)

Chi-quadro con s-1 gradi di libertà
Devianza interna (interna ai gruppi)

Chi-quadro con n-s gradi di libertà

Quindi calcolo la distribuzione F come rapporto tra la devianza esterna e quella interna.

Se devianza esterna > deivanza interna : F > 1 ==> rifiuto H0 (medie diverse)