Test di ipotesi sulla media di una signola popolazione
H0: mu = mu_0
H1: mu != mu_0
Guardo la media campionaria e vedo se questa media che hanno generato i dati è mu_0 o no. Noi conosciamo la media campionaria mu e varianza sigma^2/n.
Se assumo che sia vero H0, quanto è improabbile che mu_0 sia la mia media ? Devo scegliere entro quali valori per me è vera H0 o no.
La distribuzione non la conosco quindi mi riconduco a una distribuzione che conosco: STATISTICA TEST.
Si aprono così tre alternative:
Se p-value è troppo piccolo (<0.05) allora mu != mu_0 ==> rifiuto H0.
sigma^2 non nota e n è grande: Stimo sigma con la viarianza campionaria, prechè se n è molto grande allora la posso stimare con la varianza campionaria. La statistica test è sempre la normale N(0,1).
sigma^2 non nota e n è piccolo: Stimo sempre sigma^2 con la varianza campionaria, ma non è la statistica test non è una normale ma una t-student.
Confronto tra due distribuzioni
Se ho due distribuzioni X1~N(mu_1,sigma^2_1) e X2~N(mu_2,sigma^2_2) guardo alla differenza:
H0: mu_1 = mu_2
H1: mu_1 != mu_2
Guardo alla distribuzione che è la differenza delle due distribuzioni: X1-X2 ~ N(mu_1-mu_2, Sigma/sigma).
sigma^2_i è nota: statistica test è z_0 = (X1-X2-0)/sigma ~ N(0,1) Se p-value è troppo piccolo (<0.05) ==> rifiuto H0.
sigma^2_i non nota e n è grande: Stimo sigma con la viarianza campionaria, prechè se n è molto grande allora la posso stimare con la varianza campionaria. La statistica test è sempre la normale N(0,1).
sigma^2 non nota e n è piccolo: L’unico caso che posso gestire è assumere che siano uguali sigma_1 = sigma_2. Quindi stimo sigma con la media pesata delle varianze campionarie delle due distribuzioni.
Supponiamo che X ~ F(params), ovvero che X abbia una distribuzione F nota dipendetne da uno o più parametri. La distribuzione è identificata da una quallsiasi tra le tre funzioni seguenti:
ANOVA (più di due distribuzioni)
é un estensione della t-test a piu di due gruppi (distribuzioni).
Vede se ci sono delle significative differenze tra piu di due gruppi.
H0: all the means are the same
H1: there is a difference between at least two groups.
Quindi si calcola:
Devianza esterna (tra gruppi)
Chi-quadro con s-1 gradi di libertà
Devianza interna (interna ai gruppi)
Chi-quadro con n-s gradi di libertà
Quindi calcolo la distribuzione F come rapporto tra la devianza esterna e quella interna.