In questo capitolo è illustrato come tradurre i risultati di un esperimento casuale in una variabile casuale. In che modo è possibile calcolare alcuni dei valori caratteristici di tali variabili e in particolare il valore medio, la varianza e la deviazione standard. Non sono trattati alcuni valori caratteristici quali la mediana, la moda, gli indici di asimmetria e di curtosi, così come non sono trattate la funzione di ripartizione, tranne per la sua definizione, e quella generatrici dei momenti.
Nel capitolo precedente si è visto come i risultati di un esperimento casuale sono gli eventi, sui quali si possono usare solo gli operatori logici, cosa che ne limita notevolmente l’applicabilità . Inoltre, essendo gli eventi non necessariamente ordinati, non è possibile rappresentarli su un asse cartesiano. Per superare tale inconveniente è possibile utilizzare una funzione che associata ad ogni evento dello spazio campionario genera un numero unico.
Una variabile aleatoria (variabile casuale o stocastica) \(X\) è una funzione che fa corrispondere un numero agli eventi dello spazio campionario. Se lo spazio campionario è formato da un insieme di eventi finito o numerabile, la variabile aleatoria si chiama discreta, altrimenti si chiama continua.
Si consideri l’esperimento casuale descritto nell’esempio [6_9]: I voti che si possono avere ad un esame universitario vanno da 17 a 30 e Lode, quindi formalmente l’insieme degli eventi elementari costituiscono lo spazio campionario \(\Omega={\omega_0=17,\omega_1=18, \omega_2=19, \dots, \omega_{13}=30,\omega_{14}=30Lode }\). L’applicazione della v.c. \(X\) porta gli eventi ad essere posizionati su una retta.
Indicando con \(x\) i valori di una v.c. \(X\), essi sono generamente rappresentati sull’asse dell’ascisse di un piano cartesiano, mentre le probabilità a loro associate sono rappresentate sull’asse delle ordinate. Il collegamento tra i valori della v.c. con la probabilità che tali valori possano essere osservati si chiama distribuzione di probabilità .
La distribuzione di probabilità è un modello che associato ad ogni valore di una v.c. una probabilità . La distribuzione di probabilità si chiama funzione di probabilità nel caso di una v.c. discreta e densità di probabilità per la v.c. continua.
Per le v.c. continue è bene evidenziare come una prova può generare
un numero infinito di eventi elementari, quindi, la probabilitÃ
associata a ogni singolo evento è sempre pari a 0. Se consideriamo i
dati dell’esempio [6.4] è chiaro che la probabilità associata al fatto
che la lezione inizierà con 1.32,47 (1 minuto, 32 secondi e 47
centesimi) oppure con 5.26,11 (5 minuti, 26 secondi e 11 centesimi) è
bassissima prossima allo zero. Per chi non è avvezzo alla matematica sa
bene che tra due valori, ad esempio tra 1.32,47 e 1.32,48, vi è sempre
un altro valore, quindi anche in un periodo di tempo limitato, la v.c.
‘ritardo inizio lezione’ può assumere un numero infinito di valori
(dipende dalla precisione con cui si vuole misurare il tempo).
Conseguentemente, la prova ‘ritardo inizio lezione’ presenta infiniti
eventi elementari, che possiamo anche chiamare puntuali (a ogni
evento corrisponde un punto sull’asse dell’ascissa). Volendo conoscere
la probabilità che la lezione inizi esattamente in un dato istante
bisogna calcolare il rapporto tra quel istante e gli infiniti diversi
istanti in cui può essere suddiviso il tempo di ritardo con cui inizia
la lezione. Rapportare la probabilità , che per definizione è pari a 1,
con gli infiniti istanti che possono rappresentare l’effettivo ritardo
dell’inzio lezione è sempre pari a 0 (\(1/\infty=0\)).
Da quanto detto, non ha senso calcolare per i valori puntuali \(x\) le probabilità , ma si può riportare
quanto è densa la probabilità intorno a quel \(x\), diciamo in un intervallo piccolissimo
tra \(x\) e \(x+dx\).
Dati i valori \(x\) di una variabile casuale \(X\), se \(x\) appartiene ai numeri naturali si ha la seguente funzione di probabilità : \[\begin{aligned} \mathrm{P} \left ( X=x_k \right )=p_k \end{aligned}\] dove \(i=1,2,\dots, K\) con \(K \leq \infty\), \(p_i \geq 0\) e \(\sum_{k=1}^{K}{p_k}=1\).
Se \(x\) appartiene ai numeri reali si ha la seguente funzione di densità di probabilità : \[\begin{aligned} P \left ( x \leq X \leq x+dx \right )=f \left ( x \right )dx \end{aligned}\] dove \(f(x)=0\) e \(\int_{-\infty }^{+\infty }f(x)dx=1\).
Dato le precedenti definizioni è possibile rappresentare le v.c. su un piano cartesiano come qui di seguito.
Funzione di probabilità per una v.c. discreta a), funzione di densità per una v.c. continua b).
Oltre alla funzione di probabilità (densità di probabilità per le v.c. continue) è possibile definire per le v.c. la funzione di ripartizione.
La funzione di ripartizione, indicata con \(F(.)\), esprime la probabilità con la quale la v.c. \(X\) assume valori inferiori o uguali ad un valore prefissato \(x_{k^*}\) con \(1 \leq {k^*}\leq K\): Nel caso di una v.c. discreta, \[F ( x_{k^*} )=\mathrm{P}\left (X\leq x_{k^*} \right )=\sum_{k=1}^{k^*}p_k\] Nel caso di una v.c. continua, \[F \left ( x_{k^*} \right )=P\left ( X\leq x_{k^*} \right )=\int_{-\infty }^{x_{k^*} }f(x)dx.\] La funzione di ripartizione è non decrescente ed è sempre compresa tra zero e uno:Funzione di ripartizione per una v.c. discreta a) e continua b).
L’uso della v.c. rende possibile modellizzare l’esperimento casuale e
misurare la probabilità con cui possono presentare i diversi risultati
del fenomeno senza dover utilizzare i concetti definiti nel Capitolo 6.
Si osservi, a tal proposito, come le caratteristiche
aritmetiche della funzione di probabilità e della funzione di
ripartizione sono identiche a quelle già studiate per la frequenza
relativa e cumulata, conseguentemente una v.c. può essere vista come una
variabile statistica con distribuzione di modalità e frequenze.
Tuttavia, la somiglianza è solo dal punto di vista aritmetico e non
logico. Infatti, se frequenze e probabilità presentano le medesime
caratteristiche aritmetiche (\(p_i\) e
\(f_1\) hanno valori \(\geq 0\) e la loro somma è 1), sono
concettualmente una all’opposto dell’altra. Infatti, la prima è
calcolata a posteriori, cioè dopo che si è realizzato il fenomeno, conto
quante volte la variabile si è presentata con una data modalità e la
rapporto con il suo totale; la probabilità , invece, è calcolata a
priori, cioè prima che il fenomeno si realizzi (misura l’aspettativa che
la variabile si presenti con una data modalità ).
Data tale differenza concettuale, quando si calcola la media di una v.c.
si procede aritmeticamente come per la variabile statistica (presenta
tutte le proprietà studiate nel Capitolo 3), ma essendo concettualmente
diversa la chiamiamo valore atteso o speranza
matematica o valore medio ed è indicata con la lettera E
(dall’inglese ’Expected’) oppure con la lettera greca \(\mu\).
La varianza di una v.c., invece, indica quanto sono dispersi i valori
della v.c. rispetto al suo valore atteso. Anche in questo caso le
caratteristiche aritmetiche sono le stesse viste per le variabili
statistiche nel Capitolo 4. Per indicarla useremo Var oppure la lettera
greca \(\sigma^2\).
Data una v.c. discreta \(X\) con valori \(x_1,...,x_k\) e probabilità \(p_1,...,p_k\), il valore atteso E\((X)\) e la varianza Var\((X)\) sono: \[\mathrm{E}\left ( X \right )=\sum_{k=1}^{K}x_kp_k \]
\[\mathrm{Var}\left ( X \right )=\mathrm{E}\left [ X-\mathrm{E}\left ( X \right ) \right ]^2=\sum_{k=1}^{K}\left (x_k-\mathrm{E}\left ( X \right ) \right )^2p_k \] Data una v.c. continua \(X\) con valori reali \(x\) \([-\infty \leq x \leq +\infty]\) e funzione di densità \(f(x)\) \[\mathrm{E}\left ( X \right )=\int_{-\infty }^{+\infty }xf(x)dx\] \[\mathrm{Var}\left ( X \right )=\int_{-\infty }^{+\infty }\left [x -\mathrm{E}(X) \right ]^2f(x)dx\]
Naturalmente, tutti gli indici di posizione, variabilità e forma
visti per le variabili statistiche sono dei valori caratteristici per le
variabili casuali, tuttavia, oltre al valore atteso e la varianza, qui
sarà considerata solo la deviazione standard: \(\sigma=\mathrm{SD}=\sqrt{\mathrm{Var}}\).
Riprendendo i dati dell’esempio {7_1}, escludendo dai calcoli il 17, in
quanto è la non sufficienza, e valutando il 30 e lode pari a 31, si ha
il seguente valore atteso e varianza:
- \(\mathrm{E}\left ( X \right
)=\sum_{k=18}^{31}x_kp_k=18*0.093+19*0.129+\dots+31*0.009=22\)
- \(\mathrm{Var}\left ( X \right
)=\sum_{k=18}^{31}\left (x_k-\mathrm{E}\left ( X \right ) \right )^2p_k=
\sum_{k=18}^{31}x_k^2p_k-\mathrm{E}(X)^2=(18^2*0.093+19^2*0.129+\dots+31^2*0.009)-22^2=10.63\).
Da quanto visto, tradurre gli esperimenti casuali in v.c. presenta
una serie di vantaggi, quali la possibilità di rappresentare
graficamente i possibili risultati della prova e le rispettive
probabilità ; di utilizzare operatori aritmetici in sostituzione di
quelli logici; di calcolare i valori caratteristici; di utilizzare
distribuzione tipo (teoriche) per ricavare informazioni sul
fenomeno oggetto dell’esperimento.
In particolare, molti fenomeni di diversa natura (sociali, economici,
fisici…) rispettano determinate leggi e sono riconducibili a specifiche
tipologie di distribuzioni. Conseguentemente se si sta studiando un
fenomeno, che può essere ricondotto a una di queste distribuzioni tipo,
è possibile ricostruire l’intera distribuzione di probabilità sulla base
di pochi valori caratteristici.
Nel paragrafo seguente sono riportate le caratteristiche delle v.c.
discrete e continue che si presentano con maggiore frequenza nelle
Scienze umane e sociali.
Tale distribuzione si usa per gli esperimenti casuali che presentano solo un numero limitato di risultati discreti, e tutti con la medesima probabilità di verificarsi.
Una v.c. \(X\) segue una distribuzione Uniforme discreta con parametro \(K\) se può assumere solo i valori interi \(x=1,\dots,K\) in un determinato intervallo di valori \([a,b]\) con la seguente distribuzione di probabilità : \[P\left ( x \right )=\left\{\begin{matrix} 0 & x < a\\ \frac{1}{K} & a \leq x \leq b\\ 0 & x > b \end{matrix}\right.\]
Una v.c. uniforme discreta \(X\sim U\left (
K \right )\) dipende da un unico parametro e i suoi valori
caratteristici sono:
- \(E\left ( X \right
)=\frac{a+b}{2}\);
- \(Var\left ( X \right
)=\frac{(a-b)^2}{12}*\frac{K+1}{K-1}=\frac{(b-a+1)^2}{12}\).
Funzione di probabilità per la v.c. Uniforme (K=3,5,10).
Nel laboratorio informatico sono presenti 35 postazioni con 5 pc per
ognuna delle 6 file. Il professore sceglie in modo casuale uno studente
che a fine lezione deve controllare il corretto spegnimento dei pc.
Sapendo che le 35 postazioni sono numerate da 1 a 35 e che il professore
non sceglie mai uno studente della prima e dell’ultima fila, calcolare
il valore atteso, la varianza e rappresentare graficamente la funzione
di probabilità .
Soluzione
Si osservi che gli studenti ‘fortunati’ sono quelli che siedono dalla
postazione 6 alla 30 e che la probabiltà di essere scelti, per quanti
siedono in tali postazioni, è la stessa. Conseguentemente, la v.c.
‘studente scelto per controllare il corretto spegnimento dei pc’ può
assumere solo valori tra \(a \geq 6\) e
\(b \leq 30\) (\(K=25\)).
La v.c. quindi può essere scritta \(X\sim U
\left ( K=25 \right )\).
Dato che il valore più piccolo che può assumere è \(a=6\) e quello più grande è \(b=30\), si ha che il valore atteso è \(E(X)=\frac{30+6}{2}=18\), mentre la
varianza \(Var\left ( X \right
)=\frac{(a-b)^2}{12}\frac{K+1}{K-1}=\frac{(6-30)^2}{12}\frac{25+1}{25-1}=52\).
## Distribuzione di Bernoulli La v.c. di Bernoulli (o bernoulliana) può
assumere solo due valori, in genere con zero si indica il non
realizzarsi del evento desiderato e con uno il suo verificarsi. A tali
valori sono associati le probabilità \(p\) di successo (esito favorevole) e il suo
complemento \(1-p\) (esito
sfavorevole), che indica la probabilità di insuccesso.
Una v.c. \(X\) segue una distribuzione
di Bernoulli con parametro \(p\) \(\left ( 0\leq p\leq 1 \right )\) se e solo
se la sua distribuzione di probabilità è \[P\left ( X=x \right )=p^x\left ( 1-p \right
)^{1-x}\].
Una v.c. di Bernulli \(X \sim B ( p
)\) dipende da un unico parametro e i suoi valori caratteristici
sono
- \(E\left ( X \right )=p\);
- \(Var\left ( X \right )=p \left ( 1-p \right
)\).
Funzione di probabilità per una v.c. di Bernulli (p=0,3;0,5;0,8).
In laboratorio sono presenti 36 pc di cui solo 20 funzionanti.
Calcolare il valore atteso e la varianza. Rappresentare graficamente la
funzione di probabilità e di ripartizione.
Soluzione
La v.c. \(X\) può generare solo due
risultati: \(X=0\) il pc non funziona
oppure \(X=1\) il pc funziona.
Considerato che ci sono 20 pc funzionanti su 36, la probabilità che il
pc scelto sia funzionante è \(P(X=1)=p=20/36=0,56\). Ne consegue che
\(X \sim B(0,56)\). Il valore atteso è
\(E\left ( X \right )=0,56\) e la
varianza \(Var \left ( X \right
)=0,56*0,43=0,25\).
Si supponga di ripetere una prova che presenta solo due possibili
risultati un numero di volte pari a \(n\) e ogni prova è ripetuta sempre nelle
medesime condizioni. Ogni prova può essere descritta da una v.c. di
Bernoulli con una probabilità che si realizza l’evento desiderato \(p\), mentre \(1-p\) è la probabilità che non si realizzi
l’evento desiderato. Se la probabilità che si realizzi l’evento
desiderato è \(p\) allora la
probabilità che nelle \(n\) prove si
realizzi sempre l’evento desiderato èe pari a \(p^n\) (si è ipotizzato che le prove sono
ripetute sempre nelle medesime condizioni e quindi sono indipendenti).
Invece, la probabilità che nelle \(n\)
prove non si presenti mai l’evento desiderato è \((1-p)^n\). Naturalmente, tra questi due
estremi vi sono la probabilità che si presenti una sola volta l’evento
desiderato e \(n-1\) quello non
desiderato (\(\frac{n!}{1!(n-1)!}p(1-p)^{n-1}\)), quella
che si presenti due volte l’evento desiderato e \(n-2\) quello non desiderato (\(\frac{n!}{2!(n-2)!}p^2(1-p)^{n-2}\))\(\dots\) E’ bene ricordare che la quantitÃ
\(\frac{n!}{x!(n-x)!}=\binom{n}{x}\) si
legge combinazione di \(n\) eventi
presi \(x\) alla volta.
Pertanto, quando il fenomeno che si vuole studiare si presenta con \(n\) prove indipendenti, ognuna delle quali
presenta solo due possibili risultati (presenza/assenza, sì/no,
successo/insuccesso \(\dots\)), allora
tale fenomeno può essere descritto con una v.c. binomiale. Il numero di
successi e le rispettive probabilità che una v.c. binomiale può
presentare, possono essere sintetizzate nella seguente tabella
\[\begin{Bmatrix}
x= &0 &1 &2 &... &n \\
p= &\left ( 1-p \right
)^n &\frac{n!}{1!(n-1)!}p^1(1-p)^{n-1} &\frac{n!}{2!(n-2)!}p^2(1-p)^{n-2} &... &p^n
\end{Bmatrix}\]
Una v.c. \(X\) segue una
distribuzione binomiale con parametri \(n\) e \(p\), con \(n\) intero positivo e \(\left ( 0\leq p\leq 1 \right )\), se e solo
se la sua distribuzione di probabilità è
\[P(X=x)=\binom{n}{x}p^x\left ( 1-p \right
)^{n-x}=\frac{n!}{(n-x)!}p^x(1-p)^{n-x}\]
con \(x=0,1,2,...,n\).
Una v.c. binomiale \(X\sim Bin\left (n, p
\right )\) dipende da due parametri e i suoi valori
caratteristici sono
- \(E\left ( X \right )=np\)
- \(Var\left ( X \right )=np\left ( 1-p \right
)\).
Funzione di probabilità per la v.c. Binomiale (n=10;15,30; p=0,3;0,55).
Dalle esperienze passate gli studenti sanno che solo il 20% dei
candidati superano l’esame scritto di Statistica. Considerato che alla
prova si sono presentati 26 candidati, calcolare quanti studenti ci si
attende che superino la prova scritta. Calcolare inoltre la varianza,
rappresentare la funzione di probabilità e mediante la funzione di
ripartizione rappresentare la probabilità che almeno 12 studenti
superino la prova.
Soluzione
Non è arduo ipotizzare che nel valutare una prova scritta, la
commissione non si lasci condizionare dalla valutazione attribuita alle
prove precedenti e, quindi, il risultato attribuito ad ogni singola
prova è indipendente dalle altre. Ne conseguente che tale fenomeno segue
una distribuzione binomiale dove il numero di prove indipendenti che
generano solo due possibili risultati (supera o meno l’esame) sono \(n=26\) e la probabilità di successo per
ogni singolo studente è \(p=0,20\):
\(X\sim Bin\left (26, 0,2 \right )\).
Si può calcolare, quindi, il numero atteso di studenti che ci si attende
superino l’esame \(E\left ( X \right
)=26*0,2=5,2\), la varianza è \(Var\left ( X \right )=26*0,2*0,8=4,16\), la
\(P(X\geq 12)=1-P(X\leq 11)=1-F(X=11)=
1-\sum_{i=0}^{11}\frac{26!}{i!(26-i)!}0,2^0,8^{26-i}=1-0,989=0,011\),
quindi la probabilità che superino l’esame 12 o più studenti è del 1,1%.
Si è visto che una prova con solo due possibili risultati e ripetuta
più volte nelle medesime condizioni può essere descritta con una
distribuzione binomiale. Tuttavia, se i risultati delle ripetizioni
condizionano, modificando, la probabilità di successo nelle prove
seguenti allora il fenomeno può essere descritto con la distribuzione
ipergeometrica.
Si consideri a tal proposito il seguente esempio.
La commissione d’esame per decidere su quale argomento interrogare un
candidato prepara 50 biglietti, uno per ogni argomento, e li inserisce
in una scatola. Per ogni candidato estrae 5 biglietti e decide di non
reinserirli nella scatola, per evitare di chiedere due o più volte uno
stesso argomento al candidato. Quando si estrae il primo biglietto la
probabilità di estrarre un dato argomento è 1/50 ma, se l’argomento non
viene estratto, la probabilità che sia esca alla seconda estrazione
diventa 1/49 e così via.
Dall’esempio precedente si può calcolare la probabilità che dei cinque
argomenti sorteggiati vi siano due dei seguenti argomenti: ‘media’,
‘concentrazione’, ‘correlazione’ e ‘regola di Bayes’?
Naturalmente la risposta è sì, ma per formalizzare tale fenomeno bisogna
individuare i parametri. Nel caso particolare, è possibile indicare con
\(h=50\) il numero di biglietti nella
scatola, con \(n=5\) i biglietti
estratti, con \(b=4\) il numero di
biglietti che contengono uno tra gli argomenti preferiti, con \(h-b=50-4=46\) il numero di biglietti che
non contengono uno degli argomenti preferiti (tutti con l’esclusione di
‘media’, ‘concentrazione’, ‘correlazione’,‘regola di Bayes’). Infine con
\(x=2\) si indica il numero di
argomenti appartenenti a \(b\) che se
sono estratti il candidato è soddisfatto, allora si può definire una
variabile casuale ipergeometrica.
Una v.c. \(X\) segue una distribuzione ipergeometrica con parametri \(n\), \(b\) e \(h\), con \(n\),\(b\) e \(h\) interi positivi, se e solo se la sua distribuzione di probabilità è
\[P(X=x)=\frac{\binom{b}{x}\binom{h-b}{n-x}}{\binom{h}{n}}\]
con \(x \in\left\{\max {(0,n+b-h)},\dots ,\min
{(n,b)}\right\}\) Una v.c. Ipergeometrica \(X\sim IpG\left (n, b,h \right )\) dipende
da tre parametri e i suoi valori caratteristici sono
- \(E\left ( X \right )=bn/h\);
- \(Var\left ( X \right )=\frac{nb\left ( h-b
\right )\left ( h-n \right )}{h^2(h-1)}\).
La funzione di probabilità è di seguito rappresentata.
Funzione di probabilità per la v.c. Ipergeometrica (n=40;60; b=10;25 h=7;14).
Per decidere su quale argomento interrogare un candidato, la
commissione d’esame prepara 30 biglietti, uno per ogni argomento, e li
inserisce in una scatola. Per ogni candidato sono estratti 4 biglietti.
Considerato che il candidato sa rispondere correttamente solo su 18
argomenti. Calcolare il valore atteso e la varianza degli argomenti a
cui il candidato saprà rispondere. Sapendo che la commissione valuta
positivamente la preparazione del candidato solo se risponde
correttamente ad almeno 3 domande, calcolare la probabilità che il
candidato superi l’esame.
Soluzione
Il numero di biglietti estratti sono \(n=4\), i quali sono scelti tra 30 biglietti
\(h=30\), essendo 18 gli argomenti
conosciuti dal candidato si ha \(b=18\)
e quindi sono \(h-b=30-18=12\) i
biglietti che contengono un argomento non conosciuto. Per calcolare il
valore atteso si ha \(E\left ( X \right
)=18*4/30=2,4\), quindi ci si aspetta che il candidato risponda a
2 domande (1,6), la varianza invece è data \(Var\left ( X \right
)=4*18*(12)*(30-4)/(30^2*(30-1))=0,86\). Per calcolare la
probabilità che il candidato superi l’esame bisogna determinare la
probabilità che sui 4 biglietti estratti almeno tre di questi contengano
uno degli argomenti conosciuti dal candidato, quindi \(P(X\geq3)=P(X=3)+P(X=4)\), dove \(P(X=3)=\binom{18}{3}\binom{12}{1} \setminus
\binom{30}{4}=0,357\) e \(P(X=4)=\binom{18}{4}\binom{12}{0} \setminus
\binom{30}{4}=0.112\), ne segue che la probabilità di superare
l’esame è 46,9%.
La distribuzione di Poisson, dal nome del matematico francese Siméon Denis Poisson, assume rilievo quando si vuole determinare il numero di volte che si presenta un evento in un dato intervallo temporale o spaziale. Ad esempio è adatta a descrivere i fenomeni con una probabilità di successo molto piccola. In particolare, la distribuzione di Poisson deriva direttamente da quella binomiale quando la probabilità di successo \(p\) è piccola e il numero di prove \(n\) è molto grande.
Una v.c. \(X\) segue una
distribuzione di Poisson con parametro \(\lambda\) se e solo se la sua distribuzione
di probabilità è
\[P(X=x)=\frac{\lambda ^x e^{-\lambda
}}{x!}\]
dove \(x=0,1,2,\dots\).
Una v.c. di Poisson \(X\sim P\left (\lambda
\right )\) dipende da un solo parametro e i suoi valori
caratteristici sono
- \(E\left ( X \right
)=\lambda\);
- \(Var \left ( X \right
)=\lambda\).
Funzione di probabilità per la v.c. di poisson (Lambda= 0,5; 1,5; 3).
A figure caption.
Nel presente paragrafo è trattata in modo completo la variabile casuale normale, mentre per la \(\chi\)-quadrato, la t di Student e la F di Snedecor-Fisher sono considerate le sole definizioni e come leggere i valori sulle tavole.
La distribuzione normale (nota anche come gaussiana, di Gauss, di LaPlace–Gauss) assume un ruolo fondamentale nella Statistica e si incontra spesso nelle applicazioni.
Una v.c. \(X\) segue una
distribuzione normale con parametri \(\mu\) e \(\sigma^2\) se e solo se la funzione di
densità di probabilità è \[f\left ( x \right
)=\frac{1}{\sqrt{2 \pi \sigma^2 }}e^{-\frac{\left ( x- \mu \right
)^2}{2\sigma^2}}\]
con \(-\infty < x <
+\infty\).
Una v.c. normale \(X\sim N\left (\mu,
\sigma^2 \right )\) dipende da due parametri e i suoi valori
caratteristici sono
- \(E\left ( X \right )=\mu=\int_{-\infty
}^{+\infty }x\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-\frac{\left ( x-\mu
\right )^2}{2\sigma^2}}dx\)
- \(Var\left ( X \right
)=\sigma^2=\int_{-\infty }^{+\infty }\left (x-\mu \right
)^2\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-\frac{\left ( x-\mu \right
)^2}{2\sigma^2}}dx\).
In modo schematico la funzione di densità di probabilità una v.c.
gaussiana si caratterizza per le seguenti proprietà :
- Il punto di massima densità è in corrispondenza del percentile \(x=\mu\) ed è pari a \(1/ \sqrt{2 \pi \sigma^2}\);
- La distribuzione è simmetrica rispetto al valore atteso \(\mu\), quindi la \(P(x-\mu<X)=P(X>x+\mu)\) per ogni
percentile della v.c.;
- E’ asintotica rispetto all’asse delle ascisse;
- La densità è crescente per i valori di \(x<\mu\) ed è decrescente per i valori di
\(x>\mu\);
- La distribuzione presenta due punti di flesso in corrispondenza dei
percentili \(x=\mu-\sigma\) e \(x=\mu+\sigma\);
- Per i valori della v.c. \(X\)
compresi tra \(-\infty\) e \(+\infty\) l’area sotto la curva è pari a 1,
l’area sotto la curva compresa tra i percentili \(\mu-\sigma\) e \(\mu+\sigma\) è pari a 0,6826, mentre l’area
sotto la curva compresa tra i percentili \(\mu-2\sigma\) e \(\mu+2\sigma\) è pari a \(0,9544\).
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Funzione di densità della v.c. Normale.
Data la difficoltà di calcolo degli integrali, è possibile procedere alla standardizzazione della v.c. gaussiana e utilizzare i valori che sono tabulati in appendice. In particolare, è possibile ottenere una v.c. normale standardizzata \(Z\) da una v.c. normale \(X\) mediante la seguente trasformazione:
\[Z=\frac{X-\mu}{\sigma}\]
La v.c. \(Z\) presenta sempre un valore medio pari a zero e una varianza pari a 1: \(Z\sim N(0,1)\), la cui funzione di densità è \[f\left ( z \right )=\frac{1}{\sqrt{2\pi}}e^{-\frac{ z ^2}{2}}\]. La sua grande utilità deriva dal fatto che qualsiasi sia il valore medio e la varianza della v.c. \(X\) oggetto di studio, la sua funzione di densità è riconducibile a \(f\left ( z \right )\) e, quindi volendo calcolare la probabilità per un dato percentile di \(X\) basta calcolare quello corrispondente di \(Z\). In altri termini, \[\mathrm{P}(x_1<X<x_2)=\mathrm{P} \left (z_1=\frac{x_1-\mu}{\sigma}<Z<z_2=\frac{x_2-\mu}{\sigma}\right )\].
Funzione di densità della v.c. X e Z.
Nella tavola 1 sono tabulati le probabilità per i percentili della distribuzione standardizzata, dove per riga sono riportati i percentili (valori rappresentati sull’asse delle ascisse) e per colonne il secondo decimale di ogni percentile, i valori nella tabelle si riferiscono alle probabilità associate all’intervallo che va da zero al percentile considerato, ad esempio in corrispondenza della sesta riga e terza colonna l’area sottesa alla curva normale è 0,1985, ossia la v.c. assumerà un valore compreso tra 0 e 0,52 con una probabilità pari al 19,85%: \(P(0 \leq Z \leq 0,52)=0,1985\).
Data una v.c. \(X \sim N(4,9)\),
determinare la probabilità che tale v.c. assuma un valore minore di
cinque. Calcolare, inoltre, la probabilità che assume un valore maggiore
di 6,1. Infine, calcolare la probabilità che assuma un valore tra 2 e
5,2.
Soluzione
Le probabilità da colcolare sono: a) \(P(X<5) = P(-\infty <X<5)\); b)
\(P(X>6,1)=1-P(-\infty
<X<6,1)\); c) \(P(2
<X<5,2)\). Per evitare di calcolare l’integrale si
trasforma la v.c. \(X\) in \(Z=\frac{X-\mu}{\sigma}\) e successivamente
si cercano le probabilità corrispondenti ai percentili sulle
tavole.
a) \(P(-\infty<X<5) = P(-\infty
<Z<z=(5-4)/3=0,33)=P(-\infty <Z<0)+P(0
<Z<0,33)=0,5+0,129=0,629\);
b) \(1-P(-\infty <X<6,1)=1-P(-\infty
<Z<z=(6,1-4)/3=0,7)=1-P(-\infty <Z<0)-P(0
<Z<0,7)=1-0,5-0,258=0,242\);
c) \(P(2 <X<5,2)=P(z_1=(2-4)/3
<Z<z_1=(5,2-4)/3)= P(z_1=-0,667<Z<0,4)\), tale
calcolo si può dividere in due parti \(P(-0,667<Z<0)+P(0<Z<0,4)\), con
\(P(-0,667<Z<0)=0,5 -P(-\infty
<Z<-0,667)=0,248\) e \(P(0<Z<0,4)=0,344\) quindi \(P(2 <X<5,2)=0,248+0,344=0,592\).
Nell’esempio descritto prima si voleva determinare la probabilità conoscendo il valore assunto dalla v.c. normale, in altri casi invece è nota la probabilità e si vuole determinare il valore della v.c.
Data una v.c. \(X \sim N(7;12,25)\),
determinare i seguenti percentili per la v.c. \(P(-\infty <X<x)=0,3192\), \(P(X>x)=0,04\) e \(P(\mu <X<x)=0,2422\).
Soluzione
Si trasforma la v.c. \(X\) in \(Z=\frac{X-\mu}{\sigma}\) in modo da
determinare prima i percentili per la \(Z\), i quali sono tabulati per i suoi
diversi valori e successivamente si passa da \(Z\) a \(X\) con la seguente formula inversa: \(\mu+Z \sigma =X\).
a) \(P(-\infty<X<x)
=P(-\infty<Z<z)=0,3192\), dalle tavole si hanno le
probabilità da \(P(0<Z<z)=P(-z<Z<0)\), quindi da
\(P(-\infty<Z<z)=0,5-P(-z<Z<0)=0,3192\)
si ha \(P(-z<Z<0)=0,1808\) con
\(z=0,47\): \(P(-\infty<Z<-0,47)=0,32\), applicando
la formula inversa \(x=7-0,47*3,5
=5,36\) (attenzione al segno - nella funzione inversa in quanto
si ha -z e non z);
b) \(P(X>x)=P(Z>z)=0,04\), \(P(Z>z)=0,5-P(Z<z)=0,04\) si ha \(P(Z<z)=0,46\) con \(z=1,75\), \(x=7+1,75*3,5 =13,12\)
c) \(P(\mu <X<x)=P(0
<Z<z)=0,2422\), dalle tavole si ha \(z=0,65\), \(x=7+0,65*3,5 =9,275\).
E’ noto che il ritardo con cui il professore inizia la lezione segue
una legge normale, è altresì noto che la probabilità inizi con meno di
22 minuti è del 11,9%, mentre la probabilità inizi con un ritardo
superiore ai 28 minuti è del 2,07%. Qual è il ritardo che bisogna
attendersi per la prossima lezione? E la varianza?
Soluzione Le informazioni disponibili sono \(P(-\infty<X<x_1=22)=0,12\) e \(P(x_2=28<X<\infty)=0,0207\). Passando
alla distribuzione normale standardizzata si ha \(P(-\infty<X<22)=P(-\infty<Z<z_1=(\mu-22)/
\sigma)=0,12\) e \(P(-\infty<X<22)=P(z_2=(\mu-28)/
\sigma<Z<\infty)=0,0207\). Utilizzando i valori tabulati è
possibile calcolare \(z_1=-1.18\) e
\(z_2=2.04\). Infatti, \(P(-\infty<Z<z_1)=0,5-P(z_1<Z<0)=0,119\)
e \(P(z_2<Z<\infty)=0,5-P(0<Z<z_2)=0,0207\),
da cui \(P(z_1<Z<0)=0,381\) e ,
da cui \(P(0<Z<z_2)=0,4793\).
\[ \begin{matrix} -1,18=(22-\mu) / \sigma \\ 2,04=(28-\mu)/ \sigma \end{matrix} = \begin{matrix} -1,18\sigma=22-\mu \\ 2,04\sigma=28-\mu \end{matrix} = \begin{matrix} \mu=22+1,18\sigma \\ 2,04\sigma=28-\mu \end{matrix} = \begin{matrix} \mu=22+1,18\sigma \\ 2,04\sigma=28-22-1,18\sigma \end{matrix} = \begin{matrix} \mu=22+1,18\sigma \\ (2,04+1,18)\sigma=6 \end{matrix}\] \[\begin{matrix} \mu=22+1,18\sigma \\ \sigma=6/3,22=1,86 \end{matrix}= \begin{matrix} \mu=22+1,18*1,86 \\ \sigma=1,86 \end{matrix}= \begin{matrix} \mu=24,19 \\ \sigma=1,86 \end{matrix} \] Quindi la v.c. ha un valore atteso pari a 24,19 minuti e una varianza pari a 3,46 (\(1,86^2\)).
Siano \(X_1,X_2,\dots,X_n\) \(n\) v.c. indipendenti che seguono una distribuzione normale con parametri \(\mu_i\) e \(\sigma^2_i\) \((i=1,\dots,n)\), sia \(Z_i=(X_i-\mu_i)/\sigma_i\) allora la v.c. \(Y=\sum_{i=1}^{n}Z_i^2\) segue una distribuzione \(\chi\)-quadrato con \(n\) gradi di libertà (\(gdl\)).
Nella tavola 2 sono riportati i percentili della v.c. \(\chi^2\) dove per riga sono indicati i gradi di libertà e per colonna la probabilità associata dal percentile fino al valore massimo.
Calcolare i seguenti percentili
a) \(P(\chi^2>\chi_{(0,95;12)}^2
)=0,05\);
b) \(P(0<\chi^2<\chi_{(0,05;12)}^2
)=0,95\);
c) \(P\left (0<\chi^2 < \chi_{(0,9;6)}^2
\right )=0,1\); d) \(P\left(\chi_{0,99;8}^2 <\chi^2 <
\chi_{0,01;8} \right )=0,98\).
Soluzione
a) Per individuarlo bisogna cercare nella riga corrispondente a 12 \(gdl\) e nella colonna corrispondente ad
\(\alpha=0,95\): \(\chi_{(0,95;12)}^2=5,2260\);
b) \(\chi_{(0,05;12)}^2=21,0261\);
c) \(\chi_{(0,9;6)}^2=2,2041\);
d) \(\chi_{0,99;8}^2=1,6465\) e \(\chi_{0,01;8}^2=20,0902\).
A figure caption.
In alcuni casi è noto il percentile e i gradi di libertà ma non \(\alpha\). Il valore di \(\alpha\) può essere ricavato sempre dalle tabelle cercando il percentile in corrispondenza della riga dei gdl, ad esempio per \(\chi_{(\alpha;4)}^2=18,4662\) \(\alpha=0,001\) e per \(\chi_{(\alpha;7)}^2=2,8331\) \(\alpha=0,90\).
La v.c. \(T\) segue una distribuzione \(t\) di Student se e solo se è data dal rapporto tra due v.c. indipendenti, dove la prima segue una distribuzione normale standardizzata e la seconda è la radice quadrata del rapporto tra una v.c. \(\chi\)-quadrato e i suoi gradi di libertà : \(T=Z/\sqrt{Y/n}\) con \(Z \sim N(0,1)\) e \(Y \sim \chi_n^2\).
La funzione di densità della distribuzione t di Student è
simmetrica, unimodale e di forma campanulare. Inoltre, quando i gradi di
libertà aumentano, in genere per \(n >
30\), si ha che quest’ultima è una buona approssimazione della
distribuzione normale.
Nella tavola 3 sono riportati i percentili della v.c. \(t\) di Student dove per riga sono indicati
i \(gdl\) e per colonna la probabilitÃ
associata dal percentile fino al valore massimo.
Calcolare i sequenti percentili:
a) \(P(T> t_{0,01;12})=0,01\);
b) \(P(-\infty<T<t_{0,1;14})=0,90\).
Calcolare inoltre le probabilità associate ai seguenti percentili:
c) \(t_{\alpha;14}=2,1448\);
d) \(t_{\alpha;8}=3,3554\).
Soluzione
a) in corrispondenza della dodicesima riga e quinta colonna si ha il
percentile \(t_{0,01;12}=2,6810\);
b) in corrispondenza della quattordicesima riga e seconda colonna si ha
il percentile \(t_{0,1;14}=1,345\);
c) bisogna cercare il percentile nella riga corrispondente ai
quattordici gradi di libertà , trovato il quale si legge l’alfa associato
nella colonna considerata: \(P(T>t_{\alpha;14}=2,1448)=0,025\) o
equivalentemente \(P(-
\infty<T<t_{\alpha;14}=2,1448)=1-0,025=0,975\);
d) bisogna cercare nella riga corrispondente agli 8 \(gdl\) il percentile 3,3554 che corrisponde
alla colonna con una probabilità pari a 0,005, quindi \(P(T>t_{\alpha;8}=3,3554)=0,005\) o
equivalentemente \(P(-\infty
<T<t_{\alpha;8}=3,3554)=1-0,005=0,995\).
A figure caption.
La v.c. \(F\) segue una
distribuzione \(F\) di Fisher-Snedecor
se e solo se è data dal rapporto tra due v.c. \(\chi^2\) indipendenti tra loro e rapportate
ai rispettivi gradi di libertà . Siano \(Y_1
\sim \chi^2_n1\) e \(Y_2 \sim
\chi^2_n2\) due v.c. \(\chi\)-quadrato, la v.c. \(F\) di Fisher- Snedecor è
\[F_{n1,n2}=\frac{Y_1 / n_{1}}{Y_2 /
n_{2}}\] Nelle tavole 4 sono riportati i percentili della v.c.
\(F\) di Fischer-Snedecor dove per riga
sono indicati i gradi di libertà della v.c. al numeratore e per colonna
i gradi di libertà a della v.c. al denominatore e ogni tavola si
riferisce ad un diverso valore \(\alpha\).
Calcolare i sequenti percentili:
a) \(P(F>F_{0,05;3,4}
)=0,05\);
b) \(P(0 \leq F \leq
F_{0,025;6,5})=0,975\);
c) \(P(F>F_{0,99;3,5}
)=0,99\);
d) \(P(0<F<F_{0,95;4,6}=1/F_{0,05;6,4}
)=0,05\).
Soluzione a) selezionata la tavola con \(\alpha=0,05\) e in corrispondenza della
terza riga e quarta colonna si ha \(F_{0,05;3,4}=6,59\);
b) si seleziona la tavola con \(\alpha=0,025\) e in corrispondenza della
sesta riga e quinta colonna si ha il percentile \(F_{0,025;6,5}=6,98\);
c) per tale valore di \(\alpha\) non è
disponibile la tavola, per trovare il percentile si considera il
reciproco del percentile associato al complemento a \(1-\alpha\) con i gradi di libertÃ
invertiti: \(P(F>F_{0,99;3,5}=1/F_{0,01;5,3})=0,99\)
cioè \(P(F>F_{0,99;3,5}=1/28,24)=0,99\), \(F_{0,99;3,5}=0,0354\);
d) si procede similmente a c) \(F_{0,95;4,6}=1/4,53=0,22\).
A figure caption.
#ESEMPI esempio Poisson Gli aiuti umanitari in una regione africana arrivano in modo casuale in ragione di quattro convogli al mese. Assumendo che il numero di arrivi dei convogli segua una distribuzione di Poisson, determinare la probabilit`a che arrivano due convogli. Determinare inoltre la probabilit`a che almeno un convoglio arrivi in un mese.
E’ noto che il peso segue una distribuzione normale, in Cambogia la probabilità di incontrare un bambino che ha un peso minore o uguale a 12 kg è pari al 2,5% mentre la probabilità di incontrare un bambino di peso superiore a 25 kg è pari a 5%. Qual è il valore medio e la varianza del peso della popolazione dei bambini cambogiani? Soluzione La probabilità di incontrare un bambino che pesi tra 12 e 25 kg è pari al 92,5%: \(P((12-\mu)/\sigma=z_1<Z<z_2=(25-\mu)/\sigma)=1-0,025-0,05=0,925\). Per risalire ai percentili \(z_1\) e \(z_2\) si ha \(P(Z<(12-\mu)/\sigma)=P(z_1=(12-\mu)/ \sigma<Z<0)=0,5-0,025=0,475\) che corrisponde al percentile \(z_1=-1,96\), mentre \(P(Z>z_2=(25-\mu)/ \sigma)=P(0<Z<z_2=(25-\mu)/ \sigma)=0,5-0,05=0,45\) che corrisponde al percentile \(z_2=1,645\), mettendo a sistema le due equazioni si ha:
\[ \begin{matrix} -1,96=(12-\mu) / \sigma \\ 1,64=(25-\mu)/ \sigma \end{matrix} = \begin{matrix} -1,96\sigma=12-\mu \\ 1,64\sigma=25-\mu \end{matrix} = \begin{matrix} \mu=12+1,96\sigma \\ 1,64\sigma=25-\mu \end{matrix} = \begin{matrix} \mu=12+1,96\sigma \\ 1,64\sigma=25-12-1,96\sigma \end{matrix} = \begin{matrix} \mu=12+1,96\sigma \\ (1,64+1,96)\sigma=13 \end{matrix} \begin{matrix} \mu=12+1,96\sigma \\ \sigma=13/3,6=3,61 \end{matrix}= \begin{matrix} \mu=12+1,96*3,61=19,08 \\ \sigma=3,61 \end{matrix} \] La funzione di ripartizione per una v.c. discreta e continua è così rappresentabile. Uno studente ha raccolto i voti attribuiti dalla commissione per tutti gli esami sostenuti negli anni precedenti: voto 17 (440), 18 (210), 19 (290), 20 (265), 21 (190), 22 (165), 23 (140), 24 (130), 25 (95), 26 (80), 27 (70), 28 (60), 29 (50),30 (45), 31=30Lode (20).
## Warning: `qplot()` was deprecated in ggplot2 3.4.0.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
A figure caption.
E’ noto che il professore inizierà la lezione con meno di cinque minuti di ritardo con una probabilità pari a un quarto di iniziarla con un ritardo tra 5 e 7 minuti, mentre inizierà la lezione con un ritardo tra 7 e 14 minuti con una probabilità pari al doppio di iniziarla con meno di cinque minuti. Sapendo, inoltre, che inizierà la lezione con un ritardo superiore a 14 minuti con una probabilità pari a zero, Rappresentare la funzione di densità e quella di ripartizione della v.c.
Soluzione Non sono note le probabilità associate ai diversi minuti di ritardo con cui il professore inizierà la lezione, quindi prima di rappresentare le funzioni bisogna calcolarle. E’ noto che la \(\mathrm{P}(0\leq X \leq5)=0.25*\mathrm{P}(5\leq X \leq7)\), è anche noto che \(\mathrm{P}(7\leq X\leq14)=2*\mathrm{P}(0\leq X\leq5)\). Inoltre, considerando che si è certi che il ritardo sia contenuto tra 0 e 14 minuti, si ha \(\mathrm{P}(0\leq X\leq5)+\mathrm{P}(5\leq X\leq7)+\mathrm{P}(7\leq X\leq14)=1\). Il problema può essere risolto considerando considerando che \(\mathrm{P}(5\leq X \leq7)=4*\mathrm{P}(0\leq X \leq5)\) e \(\mathrm{P}(0\leq X\leq5)+\mathrm{P}(5\leq X\leq7)+\mathrm{P}(7\leq X\leq14)= \mathrm{P}(0\leq X\leq5)+4*P(0\leq X\leq5)+2*P(0\leq X\leq5)\), risolvendo si ha \(\mathrm{P}(0\leq X\leq5)=1/7\), da cui \(\mathrm{P}(5\leq X\leq7)=4/7\) e \(\mathrm{P}(7\leq X\leq14)=2/7\). A questo punto è possibile rappresentare la funzione di densità e quella di ripartizione.
A figure caption.
## [1] 24545726