Variabili casuali

In questo capitolo è illustrato come tradurre i risultati di un esperimento casuale in una variabile casuale. In che modo è possibile calcolare alcuni dei valori caratteristici di tali variabili e in particolare il valore medio, la varianza e la deviazione standard. Non sono trattati alcuni valori caratteristici quali la mediana, la moda, gli indici di asimmetria e di curtosi, così come non sono trattate la funzione di ripartizione, tranne per la sua definizione, e quella generatrici dei momenti.

Introduzione

Nel capitolo precedente si è visto come i risultati di un esperimento casuale sono gli eventi, sui quali si possono usare solo gli operatori logici, cosa che ne limita notevolmente l’applicabilità. Inoltre, essendo gli eventi non necessariamente ordinati, non è possibile rappresentarli su un asse cartesiano. Per superare tale inconveniente è possibile utilizzare una funzione che associata ad ogni evento dello spazio campionario genera un numero unico.

Una variabile aleatoria (variabile casuale o stocastica) \(X\) è una funzione che fa corrispondere un numero agli eventi dello spazio campionario. Se lo spazio campionario è formato da un insieme di eventi finito o numerabile, la variabile aleatoria si chiama discreta, altrimenti si chiama continua.

Si consideri l’esperimento casuale descritto nell’esempio [6_9]: I voti che si possono avere ad un esame universitario vanno da 17 a 30 e Lode, quindi formalmente l’insieme degli eventi elementari costituiscono lo spazio campionario \(\Omega={\omega_0=17,\omega_1=18, \omega_2=19, \dots, \omega_{13}=30,\omega_{14}=30Lode }\). L’applicazione della v.c. \(X\) porta gli eventi ad essere posizionati su una retta.

Indicando con \(x\) i valori di una v.c. \(X\), essi sono generamente rappresentati sull’asse dell’ascisse di un piano cartesiano, mentre le probabilità a loro associate sono rappresentate sull’asse delle ordinate. Il collegamento tra i valori della v.c. con la probabilità che tali valori possano essere osservati si chiama distribuzione di probabilità.

La distribuzione di probabilità è un modello che associato ad ogni valore di una v.c. una probabilità. La distribuzione di probabilità si chiama funzione di probabilità nel caso di una v.c. discreta e densità di probabilità per la v.c. continua.

Per le v.c. continue è bene evidenziare come una prova può generare un numero infinito di eventi elementari, quindi, la probabilità associata a ogni singolo evento è sempre pari a 0. Se consideriamo i dati dell’esempio [6.4] è chiaro che la probabilità associata al fatto che la lezione inizierà con 1.32,47 (1 minuto, 32 secondi e 47 centesimi) oppure con 5.26,11 (5 minuti, 26 secondi e 11 centesimi) è bassissima prossima allo zero. Per chi non è avvezzo alla matematica sa bene che tra due valori, ad esempio tra 1.32,47 e 1.32,48, vi è sempre un altro valore, quindi anche in un periodo di tempo limitato, la v.c. ‘ritardo inizio lezione’ può assumere un numero infinito di valori (dipende dalla precisione con cui si vuole misurare il tempo). Conseguentemente, la prova ‘ritardo inizio lezione’ presenta infiniti eventi elementari, che possiamo anche chiamare puntuali (a ogni evento corrisponde un punto sull’asse dell’ascissa). Volendo conoscere la probabilità che la lezione inizi esattamente in un dato istante bisogna calcolare il rapporto tra quel istante e gli infiniti diversi istanti in cui può essere suddiviso il tempo di ritardo con cui inizia la lezione. Rapportare la probabilità, che per definizione è pari a 1, con gli infiniti istanti che possono rappresentare l’effettivo ritardo dell’inzio lezione è sempre pari a 0 (\(1/\infty=0\)).
Da quanto detto, non ha senso calcolare per i valori puntuali \(x\) le probabilità, ma si può riportare quanto è densa la probabilità intorno a quel \(x\), diciamo in un intervallo piccolissimo tra \(x\) e \(x+dx\).

Dati i valori \(x\) di una variabile casuale \(X\), se \(x\) appartiene ai numeri naturali si ha la seguente funzione di probabilità: \[\begin{aligned} \mathrm{P} \left ( X=x_k \right )=p_k \end{aligned}\] dove \(i=1,2,\dots, K\) con \(K \leq \infty\), \(p_i \geq 0\) e \(\sum_{k=1}^{K}{p_k}=1\).

Se \(x\) appartiene ai numeri reali si ha la seguente funzione di densità di probabilità: \[\begin{aligned} P \left ( x \leq X \leq x+dx \right )=f \left ( x \right )dx \end{aligned}\] dove \(f(x)=0\) e \(\int_{-\infty }^{+\infty }f(x)dx=1\).

Dato le precedenti definizioni è possibile rappresentare le v.c. su un piano cartesiano come qui di seguito.

Funzione di probabilità per una v.c. discreta a), funzione di densità per una v.c. continua b).

Funzione di probabilità per una v.c. discreta a), funzione di densità per una v.c. continua b).

Oltre alla funzione di probabilità (densità di probabilità per le v.c. continue) è possibile definire per le v.c. la funzione di ripartizione.

La funzione di ripartizione, indicata con \(F(.)\), esprime la probabilità con la quale la v.c. \(X\) assume valori inferiori o uguali ad un valore prefissato \(x_{k^*}\) con \(1 \leq {k^*}\leq K\): Nel caso di una v.c. discreta, \[F ( x_{k^*} )=\mathrm{P}\left (X\leq x_{k^*} \right )=\sum_{k=1}^{k^*}p_k\] Nel caso di una v.c. continua, \[F \left ( x_{k^*} \right )=P\left ( X\leq x_{k^*} \right )=\int_{-\infty }^{x_{k^*} }f(x)dx.\] La funzione di ripartizione è non decrescente ed è sempre compresa tra zero e uno:
\[\underset{x\rightarrow -\infty }{lim}F\left ( X \right )=0 \ \ \ \ \underset{x \rightarrow \infty }{lim}F \left ( X \right )=1\].
Funzione di ripartizione per una v.c. discreta a) e continua b).

Funzione di ripartizione per una v.c. discreta a) e continua b).

Valori caratteristici

L’uso della v.c. rende possibile modellizzare l’esperimento casuale e misurare la probabilità con cui possono presentare i diversi risultati del fenomeno senza dover utilizzare i concetti definiti nel Capitolo 6. Si osservi, a tal proposito, come le caratteristiche aritmetiche della funzione di probabilità e della funzione di ripartizione sono identiche a quelle già studiate per la frequenza relativa e cumulata, conseguentemente una v.c. può essere vista come una variabile statistica con distribuzione di modalità e frequenze. Tuttavia, la somiglianza è solo dal punto di vista aritmetico e non logico. Infatti, se frequenze e probabilità presentano le medesime caratteristiche aritmetiche (\(p_i\) e \(f_1\) hanno valori \(\geq 0\) e la loro somma è 1), sono concettualmente una all’opposto dell’altra. Infatti, la prima è calcolata a posteriori, cioè dopo che si è realizzato il fenomeno, conto quante volte la variabile si è presentata con una data modalità e la rapporto con il suo totale; la probabilità, invece, è calcolata a priori, cioè prima che il fenomeno si realizzi (misura l’aspettativa che la variabile si presenti con una data modalità).
Data tale differenza concettuale, quando si calcola la media di una v.c. si procede aritmeticamente come per la variabile statistica (presenta tutte le proprietà studiate nel Capitolo 3), ma essendo concettualmente diversa la chiamiamo valore atteso o speranza matematica o valore medio ed è indicata con la lettera E (dall’inglese ’Expected’) oppure con la lettera greca \(\mu\).
La varianza di una v.c., invece, indica quanto sono dispersi i valori della v.c. rispetto al suo valore atteso. Anche in questo caso le caratteristiche aritmetiche sono le stesse viste per le variabili statistiche nel Capitolo 4. Per indicarla useremo Var oppure la lettera greca \(\sigma^2\).

Data una v.c. discreta \(X\) con valori \(x_1,...,x_k\) e probabilità \(p_1,...,p_k\), il valore atteso E\((X)\) e la varianza Var\((X)\) sono: \[\mathrm{E}\left ( X \right )=\sum_{k=1}^{K}x_kp_k \]

\[\mathrm{Var}\left ( X \right )=\mathrm{E}\left [ X-\mathrm{E}\left ( X \right ) \right ]^2=\sum_{k=1}^{K}\left (x_k-\mathrm{E}\left ( X \right ) \right )^2p_k \] Data una v.c. continua \(X\) con valori reali \(x\) \([-\infty \leq x \leq +\infty]\) e funzione di densità \(f(x)\) \[\mathrm{E}\left ( X \right )=\int_{-\infty }^{+\infty }xf(x)dx\] \[\mathrm{Var}\left ( X \right )=\int_{-\infty }^{+\infty }\left [x -\mathrm{E}(X) \right ]^2f(x)dx\]

Naturalmente, tutti gli indici di posizione, variabilità e forma visti per le variabili statistiche sono dei valori caratteristici per le variabili casuali, tuttavia, oltre al valore atteso e la varianza, qui sarà considerata solo la deviazione standard: \(\sigma=\mathrm{SD}=\sqrt{\mathrm{Var}}\).
Riprendendo i dati dell’esempio {7_1}, escludendo dai calcoli il 17, in quanto è la non sufficienza, e valutando il 30 e lode pari a 31, si ha il seguente valore atteso e varianza:
- \(\mathrm{E}\left ( X \right )=\sum_{k=18}^{31}x_kp_k=18*0.093+19*0.129+\dots+31*0.009=22\)
- \(\mathrm{Var}\left ( X \right )=\sum_{k=18}^{31}\left (x_k-\mathrm{E}\left ( X \right ) \right )^2p_k= \sum_{k=18}^{31}x_k^2p_k-\mathrm{E}(X)^2=(18^2*0.093+19^2*0.129+\dots+31^2*0.009)-22^2=10.63\).

Distribuzioni di variabili casuali discrete {Distribuzioni di variabili casuali discrete}

Da quanto visto, tradurre gli esperimenti casuali in v.c. presenta una serie di vantaggi, quali la possibilità di rappresentare graficamente i possibili risultati della prova e le rispettive probabilità; di utilizzare operatori aritmetici in sostituzione di quelli logici; di calcolare i valori caratteristici; di utilizzare distribuzione tipo (teoriche) per ricavare informazioni sul fenomeno oggetto dell’esperimento.
In particolare, molti fenomeni di diversa natura (sociali, economici, fisici…) rispettano determinate leggi e sono riconducibili a specifiche tipologie di distribuzioni. Conseguentemente se si sta studiando un fenomeno, che può essere ricondotto a una di queste distribuzioni tipo, è possibile ricostruire l’intera distribuzione di probabilità sulla base di pochi valori caratteristici.
Nel paragrafo seguente sono riportate le caratteristiche delle v.c. discrete e continue che si presentano con maggiore frequenza nelle Scienze umane e sociali.

Distribuzioni di v.c. discrete {Distribuzioni di v.c. discrete}

Distribuzione Uniforme discreta {Distribuzione Uniforme discreta}

Tale distribuzione si usa per gli esperimenti casuali che presentano solo un numero limitato di risultati discreti, e tutti con la medesima probabilità di verificarsi.

Una v.c. \(X\) segue una distribuzione Uniforme discreta con parametro \(K\) se può assumere solo i valori interi \(x=1,\dots,K\) in un determinato intervallo di valori \([a,b]\) con la seguente distribuzione di probabilità: \[P\left ( x \right )=\left\{\begin{matrix} 0 & x < a\\ \frac{1}{K} & a \leq x \leq b\\ 0 & x > b \end{matrix}\right.\]

Una v.c. uniforme discreta \(X\sim U\left ( K \right )\) dipende da un unico parametro e i suoi valori caratteristici sono:
- \(E\left ( X \right )=\frac{a+b}{2}\);
- \(Var\left ( X \right )=\frac{(a-b)^2}{12}*\frac{K+1}{K-1}=\frac{(b-a+1)^2}{12}\).

La funzione di probabilità è di seguito rappresentata.
Funzione di probabilità per la v.c. Uniforme (K=3,5,10).

Funzione di probabilità per la v.c. Uniforme (K=3,5,10).

Nel laboratorio informatico sono presenti 35 postazioni con 5 pc per ognuna delle 6 file. Il professore sceglie in modo casuale uno studente che a fine lezione deve controllare il corretto spegnimento dei pc. Sapendo che le 35 postazioni sono numerate da 1 a 35 e che il professore non sceglie mai uno studente della prima e dell’ultima fila, calcolare il valore atteso, la varianza e rappresentare graficamente la funzione di probabilità.
Soluzione
Si osservi che gli studenti ‘fortunati’ sono quelli che siedono dalla postazione 6 alla 30 e che la probabiltà di essere scelti, per quanti siedono in tali postazioni, è la stessa. Conseguentemente, la v.c. ‘studente scelto per controllare il corretto spegnimento dei pc’ può assumere solo valori tra \(a \geq 6\) e \(b \leq 30\) (\(K=25\)).
La v.c. quindi può essere scritta \(X\sim U \left ( K=25 \right )\).
Dato che il valore più piccolo che può assumere è \(a=6\) e quello più grande è \(b=30\), si ha che il valore atteso è \(E(X)=\frac{30+6}{2}=18\), mentre la varianza \(Var\left ( X \right )=\frac{(a-b)^2}{12}\frac{K+1}{K-1}=\frac{(6-30)^2}{12}\frac{25+1}{25-1}=52\). ## Distribuzione di Bernoulli La v.c. di Bernoulli (o bernoulliana) può assumere solo due valori, in genere con zero si indica il non realizzarsi del evento desiderato e con uno il suo verificarsi. A tali valori sono associati le probabilità \(p\) di successo (esito favorevole) e il suo complemento \(1-p\) (esito sfavorevole), che indica la probabilità di insuccesso.
Una v.c. \(X\) segue una distribuzione di Bernoulli con parametro \(p\) \(\left ( 0\leq p\leq 1 \right )\) se e solo se la sua distribuzione di probabilità è \[P\left ( X=x \right )=p^x\left ( 1-p \right )^{1-x}\].

Una v.c. di Bernulli \(X \sim B ( p )\) dipende da un unico parametro e i suoi valori caratteristici sono
- \(E\left ( X \right )=p\);
- \(Var\left ( X \right )=p \left ( 1-p \right )\).

La funzione di probabilità può essere rappresentata come qui di seguito:
Funzione di probabilità per una v.c. di Bernulli (p=0,3;0,5;0,8).

Funzione di probabilità per una v.c. di Bernulli (p=0,3;0,5;0,8).

In laboratorio sono presenti 36 pc di cui solo 20 funzionanti. Calcolare il valore atteso e la varianza. Rappresentare graficamente la funzione di probabilità e di ripartizione.
Soluzione
La v.c. \(X\) può generare solo due risultati: \(X=0\) il pc non funziona oppure \(X=1\) il pc funziona. Considerato che ci sono 20 pc funzionanti su 36, la probabilità che il pc scelto sia funzionante è \(P(X=1)=p=20/36=0,56\). Ne consegue che \(X \sim B(0,56)\). Il valore atteso è \(E\left ( X \right )=0,56\) e la varianza \(Var \left ( X \right )=0,56*0,43=0,25\).

Distribuzione Binomiale {Distribuzione Binomiale}

Si supponga di ripetere una prova che presenta solo due possibili risultati un numero di volte pari a \(n\) e ogni prova è ripetuta sempre nelle medesime condizioni. Ogni prova può essere descritta da una v.c. di Bernoulli con una probabilità che si realizza l’evento desiderato \(p\), mentre \(1-p\) è la probabilità che non si realizzi l’evento desiderato. Se la probabilità che si realizzi l’evento desiderato è \(p\) allora la probabilità che nelle \(n\) prove si realizzi sempre l’evento desiderato èe pari a \(p^n\) (si è ipotizzato che le prove sono ripetute sempre nelle medesime condizioni e quindi sono indipendenti). Invece, la probabilità che nelle \(n\) prove non si presenti mai l’evento desiderato è \((1-p)^n\). Naturalmente, tra questi due estremi vi sono la probabilità che si presenti una sola volta l’evento desiderato e \(n-1\) quello non desiderato (\(\frac{n!}{1!(n-1)!}p(1-p)^{n-1}\)), quella che si presenti due volte l’evento desiderato e \(n-2\) quello non desiderato (\(\frac{n!}{2!(n-2)!}p^2(1-p)^{n-2}\))\(\dots\) E’ bene ricordare che la quantità \(\frac{n!}{x!(n-x)!}=\binom{n}{x}\) si legge combinazione di \(n\) eventi presi \(x\) alla volta.
Pertanto, quando il fenomeno che si vuole studiare si presenta con \(n\) prove indipendenti, ognuna delle quali presenta solo due possibili risultati (presenza/assenza, sì/no, successo/insuccesso \(\dots\)), allora tale fenomeno può essere descritto con una v.c. binomiale. Il numero di successi e le rispettive probabilità che una v.c. binomiale può presentare, possono essere sintetizzate nella seguente tabella
\[\begin{Bmatrix} x= &0 &1 &2 &... &n \\ p= &\left ( 1-p \right )^n &\frac{n!}{1!(n-1)!}p^1(1-p)^{n-1} &\frac{n!}{2!(n-2)!}p^2(1-p)^{n-2} &... &p^n \end{Bmatrix}\]

Una v.c. \(X\) segue una distribuzione binomiale con parametri \(n\) e \(p\), con \(n\) intero positivo e \(\left ( 0\leq p\leq 1 \right )\), se e solo se la sua distribuzione di probabilità è
\[P(X=x)=\binom{n}{x}p^x\left ( 1-p \right )^{n-x}=\frac{n!}{(n-x)!}p^x(1-p)^{n-x}\]
con \(x=0,1,2,...,n\).

Una v.c. binomiale \(X\sim Bin\left (n, p \right )\) dipende da due parametri e i suoi valori caratteristici sono
- \(E\left ( X \right )=np\)
- \(Var\left ( X \right )=np\left ( 1-p \right )\).

La funzione di probabilità è di seguito rappresentata.
Funzione di probabilità per la v.c. Binomiale (n=10;15,30; p=0,3;0,55).

Funzione di probabilità per la v.c. Binomiale (n=10;15,30; p=0,3;0,55).

Dalle esperienze passate gli studenti sanno che solo il 20% dei candidati superano l’esame scritto di Statistica. Considerato che alla prova si sono presentati 26 candidati, calcolare quanti studenti ci si attende che superino la prova scritta. Calcolare inoltre la varianza, rappresentare la funzione di probabilità e mediante la funzione di ripartizione rappresentare la probabilità che almeno 12 studenti superino la prova.
Soluzione
Non è arduo ipotizzare che nel valutare una prova scritta, la commissione non si lasci condizionare dalla valutazione attribuita alle prove precedenti e, quindi, il risultato attribuito ad ogni singola prova è indipendente dalle altre. Ne conseguente che tale fenomeno segue una distribuzione binomiale dove il numero di prove indipendenti che generano solo due possibili risultati (supera o meno l’esame) sono \(n=26\) e la probabilità di successo per ogni singolo studente è \(p=0,20\): \(X\sim Bin\left (26, 0,2 \right )\). Si può calcolare, quindi, il numero atteso di studenti che ci si attende superino l’esame \(E\left ( X \right )=26*0,2=5,2\), la varianza è \(Var\left ( X \right )=26*0,2*0,8=4,16\), la \(P(X\geq 12)=1-P(X\leq 11)=1-F(X=11)= 1-\sum_{i=0}^{11}\frac{26!}{i!(26-i)!}0,2^0,8^{26-i}=1-0,989=0,011\), quindi la probabilità che superino l’esame 12 o più studenti è del 1,1%.

Distribuzione Ipergeometrica {Distribuzione Ipergeometrica}

Si è visto che una prova con solo due possibili risultati e ripetuta più volte nelle medesime condizioni può essere descritta con una distribuzione binomiale. Tuttavia, se i risultati delle ripetizioni condizionano, modificando, la probabilità di successo nelle prove seguenti allora il fenomeno può essere descritto con la distribuzione ipergeometrica.
Si consideri a tal proposito il seguente esempio.

La commissione d’esame per decidere su quale argomento interrogare un candidato prepara 50 biglietti, uno per ogni argomento, e li inserisce in una scatola. Per ogni candidato estrae 5 biglietti e decide di non reinserirli nella scatola, per evitare di chiedere due o più volte uno stesso argomento al candidato. Quando si estrae il primo biglietto la probabilità di estrarre un dato argomento è 1/50 ma, se l’argomento non viene estratto, la probabilità che sia esca alla seconda estrazione diventa 1/49 e così via.
Dall’esempio precedente si può calcolare la probabilità che dei cinque argomenti sorteggiati vi siano due dei seguenti argomenti: ‘media’, ‘concentrazione’, ‘correlazione’ e ‘regola di Bayes’?
Naturalmente la risposta è sì, ma per formalizzare tale fenomeno bisogna individuare i parametri. Nel caso particolare, è possibile indicare con \(h=50\) il numero di biglietti nella scatola, con \(n=5\) i biglietti estratti, con \(b=4\) il numero di biglietti che contengono uno tra gli argomenti preferiti, con \(h-b=50-4=46\) il numero di biglietti che non contengono uno degli argomenti preferiti (tutti con l’esclusione di ‘media’, ‘concentrazione’, ‘correlazione’,‘regola di Bayes’). Infine con \(x=2\) si indica il numero di argomenti appartenenti a \(b\) che se sono estratti il candidato è soddisfatto, allora si può definire una variabile casuale ipergeometrica.

Una v.c. \(X\) segue una distribuzione ipergeometrica con parametri \(n\), \(b\) e \(h\), con \(n\),\(b\) e \(h\) interi positivi, se e solo se la sua distribuzione di probabilità è

\[P(X=x)=\frac{\binom{b}{x}\binom{h-b}{n-x}}{\binom{h}{n}}\]
con \(x \in\left\{\max {(0,n+b-h)},\dots ,\min {(n,b)}\right\}\) Una v.c. Ipergeometrica \(X\sim IpG\left (n, b,h \right )\) dipende da tre parametri e i suoi valori caratteristici sono
- \(E\left ( X \right )=bn/h\);
- \(Var\left ( X \right )=\frac{nb\left ( h-b \right )\left ( h-n \right )}{h^2(h-1)}\).

La funzione di probabilità è di seguito rappresentata.

Funzione di probabilità per la v.c. Ipergeometrica (n=40;60; b=10;25 h=7;14).

Funzione di probabilità per la v.c. Ipergeometrica (n=40;60; b=10;25 h=7;14).

Per decidere su quale argomento interrogare un candidato, la commissione d’esame prepara 30 biglietti, uno per ogni argomento, e li inserisce in una scatola. Per ogni candidato sono estratti 4 biglietti. Considerato che il candidato sa rispondere correttamente solo su 18 argomenti. Calcolare il valore atteso e la varianza degli argomenti a cui il candidato saprà rispondere. Sapendo che la commissione valuta positivamente la preparazione del candidato solo se risponde correttamente ad almeno 3 domande, calcolare la probabilità che il candidato superi l’esame.
Soluzione
Il numero di biglietti estratti sono \(n=4\), i quali sono scelti tra 30 biglietti \(h=30\), essendo 18 gli argomenti conosciuti dal candidato si ha \(b=18\) e quindi sono \(h-b=30-18=12\) i biglietti che contengono un argomento non conosciuto. Per calcolare il valore atteso si ha \(E\left ( X \right )=18*4/30=2,4\), quindi ci si aspetta che il candidato risponda a 2 domande (1,6), la varianza invece è data \(Var\left ( X \right )=4*18*(12)*(30-4)/(30^2*(30-1))=0,86\). Per calcolare la probabilità che il candidato superi l’esame bisogna determinare la probabilità che sui 4 biglietti estratti almeno tre di questi contengano uno degli argomenti conosciuti dal candidato, quindi \(P(X\geq3)=P(X=3)+P(X=4)\), dove \(P(X=3)=\binom{18}{3}\binom{12}{1} \setminus \binom{30}{4}=0,357\) e \(P(X=4)=\binom{18}{4}\binom{12}{0} \setminus \binom{30}{4}=0.112\), ne segue che la probabilità di superare l’esame è 46,9%.

Distribuzione di Poisson {Distribuzione di Poisson}

La distribuzione di Poisson, dal nome del matematico francese Siméon Denis Poisson, assume rilievo quando si vuole determinare il numero di volte che si presenta un evento in un dato intervallo temporale o spaziale. Ad esempio è adatta a descrivere i fenomeni con una probabilità di successo molto piccola. In particolare, la distribuzione di Poisson deriva direttamente da quella binomiale quando la probabilità di successo \(p\) è piccola e il numero di prove \(n\) è molto grande.

Una v.c. \(X\) segue una distribuzione di Poisson con parametro \(\lambda\) se e solo se la sua distribuzione di probabilità è
\[P(X=x)=\frac{\lambda ^x e^{-\lambda }}{x!}\]
dove \(x=0,1,2,\dots\).
Una v.c. di Poisson \(X\sim P\left (\lambda \right )\) dipende da un solo parametro e i suoi valori caratteristici sono
- \(E\left ( X \right )=\lambda\);
- \(Var \left ( X \right )=\lambda\).

La funzione di probabilità è di seguito rappresentata
Funzione di probabilità per la v.c. di poisson (Lambda= 0,5; 1,5; 3).

Funzione di probabilità per la v.c. di poisson (Lambda= 0,5; 1,5; 3).

E’ noto che durante la prova scritta di Statistica i candidati che riescono ad avere un aiuto dai colleghi che gli permette di superare la prova è in ragione di 0,2. Un gruppo di tre studenti, che non ha studiato, conta sull’aiuto degli altri studenti. Calcolare la probabilità che tutti superino l’esame, e la probabilità che la superi almeno uno. Rappresentare la funzione di probabilità.
Soluzione In questo caso, il numero atteso di studenti che riceve un aiuto che gli permette di superare l’esame è 2, il quale corrisponde anche al parametro \(\lambda\) (\(E(X)=\lambda=0,2\)), quindi volendo calcolare la probabilità che i tre studenti superino l’esame si ha \(P(X=3)=\frac{0,2 ^3 e^{-0,2 }}{3!}=0,008*0,98/6=0,0013\). Mentre la probabilità che la superi almeno uno è \(P(X\geq1)=1-P(X=0)=1-\frac{0,2 ^0 e^{-0,2 }}{0!}=1-(1*0,980/1)=0,02\).
A figure caption.

A figure caption.

Variabili continue

Nel presente paragrafo è trattata in modo completo la variabile casuale normale, mentre per la \(\chi\)-quadrato, la t di Student e la F di Snedecor-Fisher sono considerate le sole definizioni e come leggere i valori sulle tavole.

Distribuzione Normale {Distribuzione Normale}

La distribuzione normale (nota anche come gaussiana, di Gauss, di LaPlace–Gauss) assume un ruolo fondamentale nella Statistica e si incontra spesso nelle applicazioni.

Una v.c. \(X\) segue una distribuzione normale con parametri \(\mu\) e \(\sigma^2\) se e solo se la funzione di densità di probabilità è \[f\left ( x \right )=\frac{1}{\sqrt{2 \pi \sigma^2 }}e^{-\frac{\left ( x- \mu \right )^2}{2\sigma^2}}\]
con \(-\infty < x < +\infty\).

Una v.c. normale \(X\sim N\left (\mu, \sigma^2 \right )\) dipende da due parametri e i suoi valori caratteristici sono
- \(E\left ( X \right )=\mu=\int_{-\infty }^{+\infty }x\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-\frac{\left ( x-\mu \right )^2}{2\sigma^2}}dx\)
- \(Var\left ( X \right )=\sigma^2=\int_{-\infty }^{+\infty }\left (x-\mu \right )^2\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-\frac{\left ( x-\mu \right )^2}{2\sigma^2}}dx\).

In modo schematico la funzione di densità di probabilità una v.c. gaussiana si caratterizza per le seguenti proprietà:
- Il punto di massima densità è in corrispondenza del percentile \(x=\mu\) ed è pari a \(1/ \sqrt{2 \pi \sigma^2}\);
- La distribuzione è simmetrica rispetto al valore atteso \(\mu\), quindi la \(P(x-\mu<X)=P(X>x+\mu)\) per ogni percentile della v.c.;
- E’ asintotica rispetto all’asse delle ascisse;
- La densità è crescente per i valori di \(x<\mu\) ed è decrescente per i valori di \(x>\mu\);
- La distribuzione presenta due punti di flesso in corrispondenza dei percentili \(x=\mu-\sigma\) e \(x=\mu+\sigma\);
- Per i valori della v.c. \(X\) compresi tra \(-\infty\) e \(+\infty\) l’area sotto la curva è pari a 1, l’area sotto la curva compresa tra i percentili \(\mu-\sigma\) e \(\mu+\sigma\) è pari a 0,6826, mentre l’area sotto la curva compresa tra i percentili \(\mu-2\sigma\) e \(\mu+2\sigma\) è pari a \(0,9544\).

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Funzione di densità della v.c. Normale.

Funzione di densità della v.c. Normale.

Data la difficoltà di calcolo degli integrali, è possibile procedere alla standardizzazione della v.c. gaussiana e utilizzare i valori che sono tabulati in appendice. In particolare, è possibile ottenere una v.c. normale standardizzata \(Z\) da una v.c. normale \(X\) mediante la seguente trasformazione:

\[Z=\frac{X-\mu}{\sigma}\]

La v.c. \(Z\) presenta sempre un valore medio pari a zero e una varianza pari a 1: \(Z\sim N(0,1)\), la cui funzione di densità è \[f\left ( z \right )=\frac{1}{\sqrt{2\pi}}e^{-\frac{ z ^2}{2}}\]. La sua grande utilità deriva dal fatto che qualsiasi sia il valore medio e la varianza della v.c. \(X\) oggetto di studio, la sua funzione di densità è riconducibile a \(f\left ( z \right )\) e, quindi volendo calcolare la probabilità per un dato percentile di \(X\) basta calcolare quello corrispondente di \(Z\). In altri termini, \[\mathrm{P}(x_1<X<x_2)=\mathrm{P} \left (z_1=\frac{x_1-\mu}{\sigma}<Z<z_2=\frac{x_2-\mu}{\sigma}\right )\].

Funzione di densità della v.c. X e Z.

Funzione di densità della v.c. X e Z.

Nella tavola 1 sono tabulati le probabilità per i percentili della distribuzione standardizzata, dove per riga sono riportati i percentili (valori rappresentati sull’asse delle ascisse) e per colonne il secondo decimale di ogni percentile, i valori nella tabelle si riferiscono alle probabilità associate all’intervallo che va da zero al percentile considerato, ad esempio in corrispondenza della sesta riga e terza colonna l’area sottesa alla curva normale è 0,1985, ossia la v.c. assumerà un valore compreso tra 0 e 0,52 con una probabilità pari al 19,85%: \(P(0 \leq Z \leq 0,52)=0,1985\).

Data una v.c. \(X \sim N(4,9)\), determinare la probabilità che tale v.c. assuma un valore minore di cinque. Calcolare, inoltre, la probabilità che assume un valore maggiore di 6,1. Infine, calcolare la probabilità che assuma un valore tra 2 e 5,2.
Soluzione
Le probabilità da colcolare sono: a) \(P(X<5) = P(-\infty <X<5)\); b) \(P(X>6,1)=1-P(-\infty <X<6,1)\); c) \(P(2 <X<5,2)\). Per evitare di calcolare l’integrale si trasforma la v.c. \(X\) in \(Z=\frac{X-\mu}{\sigma}\) e successivamente si cercano le probabilità corrispondenti ai percentili sulle tavole.
a) \(P(-\infty<X<5) = P(-\infty <Z<z=(5-4)/3=0,33)=P(-\infty <Z<0)+P(0 <Z<0,33)=0,5+0,129=0,629\);
b) \(1-P(-\infty <X<6,1)=1-P(-\infty <Z<z=(6,1-4)/3=0,7)=1-P(-\infty <Z<0)-P(0 <Z<0,7)=1-0,5-0,258=0,242\);
c) \(P(2 <X<5,2)=P(z_1=(2-4)/3 <Z<z_1=(5,2-4)/3)= P(z_1=-0,667<Z<0,4)\), tale calcolo si può dividere in due parti \(P(-0,667<Z<0)+P(0<Z<0,4)\), con \(P(-0,667<Z<0)=0,5 -P(-\infty <Z<-0,667)=0,248\) e \(P(0<Z<0,4)=0,344\) quindi \(P(2 <X<5,2)=0,248+0,344=0,592\).

Nell’esempio descritto prima si voleva determinare la probabilità conoscendo il valore assunto dalla v.c. normale, in altri casi invece è nota la probabilità e si vuole determinare il valore della v.c.

Data una v.c. \(X \sim N(7;12,25)\), determinare i seguenti percentili per la v.c. \(P(-\infty <X<x)=0,3192\), \(P(X>x)=0,04\) e \(P(\mu <X<x)=0,2422\).
Soluzione
Si trasforma la v.c. \(X\) in \(Z=\frac{X-\mu}{\sigma}\) in modo da determinare prima i percentili per la \(Z\), i quali sono tabulati per i suoi diversi valori e successivamente si passa da \(Z\) a \(X\) con la seguente formula inversa: \(\mu+Z \sigma =X\).
a) \(P(-\infty<X<x) =P(-\infty<Z<z)=0,3192\), dalle tavole si hanno le probabilità da \(P(0<Z<z)=P(-z<Z<0)\), quindi da \(P(-\infty<Z<z)=0,5-P(-z<Z<0)=0,3192\) si ha \(P(-z<Z<0)=0,1808\) con \(z=0,47\): \(P(-\infty<Z<-0,47)=0,32\), applicando la formula inversa \(x=7-0,47*3,5 =5,36\) (attenzione al segno - nella funzione inversa in quanto si ha -z e non z);
b) \(P(X>x)=P(Z>z)=0,04\), \(P(Z>z)=0,5-P(Z<z)=0,04\) si ha \(P(Z<z)=0,46\) con \(z=1,75\), \(x=7+1,75*3,5 =13,12\)
c) \(P(\mu <X<x)=P(0 <Z<z)=0,2422\), dalle tavole si ha \(z=0,65\), \(x=7+0,65*3,5 =9,275\).

E’ noto che il ritardo con cui il professore inizia la lezione segue una legge normale, è altresì noto che la probabilità inizi con meno di 22 minuti è del 11,9%, mentre la probabilità inizi con un ritardo superiore ai 28 minuti è del 2,07%. Qual è il ritardo che bisogna attendersi per la prossima lezione? E la varianza?
Soluzione Le informazioni disponibili sono \(P(-\infty<X<x_1=22)=0,12\) e \(P(x_2=28<X<\infty)=0,0207\). Passando alla distribuzione normale standardizzata si ha \(P(-\infty<X<22)=P(-\infty<Z<z_1=(\mu-22)/ \sigma)=0,12\) e \(P(-\infty<X<22)=P(z_2=(\mu-28)/ \sigma<Z<\infty)=0,0207\). Utilizzando i valori tabulati è possibile calcolare \(z_1=-1.18\) e \(z_2=2.04\). Infatti, \(P(-\infty<Z<z_1)=0,5-P(z_1<Z<0)=0,119\) e \(P(z_2<Z<\infty)=0,5-P(0<Z<z_2)=0,0207\), da cui \(P(z_1<Z<0)=0,381\) e , da cui \(P(0<Z<z_2)=0,4793\).

\[ \begin{matrix} -1,18=(22-\mu) / \sigma \\ 2,04=(28-\mu)/ \sigma \end{matrix} = \begin{matrix} -1,18\sigma=22-\mu \\ 2,04\sigma=28-\mu \end{matrix} = \begin{matrix} \mu=22+1,18\sigma \\ 2,04\sigma=28-\mu \end{matrix} = \begin{matrix} \mu=22+1,18\sigma \\ 2,04\sigma=28-22-1,18\sigma \end{matrix} = \begin{matrix} \mu=22+1,18\sigma \\ (2,04+1,18)\sigma=6 \end{matrix}\] \[\begin{matrix} \mu=22+1,18\sigma \\ \sigma=6/3,22=1,86 \end{matrix}= \begin{matrix} \mu=22+1,18*1,86 \\ \sigma=1,86 \end{matrix}= \begin{matrix} \mu=24,19 \\ \sigma=1,86 \end{matrix} \] Quindi la v.c. ha un valore atteso pari a 24,19 minuti e una varianza pari a 3,46 (\(1,86^2\)).

Distribuzione \(\chi^2\) {Distribuzione \(\chi^2\)}

Siano \(X_1,X_2,\dots,X_n\) \(n\) v.c. indipendenti che seguono una distribuzione normale con parametri \(\mu_i\) e \(\sigma^2_i\) \((i=1,\dots,n)\), sia \(Z_i=(X_i-\mu_i)/\sigma_i\) allora la v.c. \(Y=\sum_{i=1}^{n}Z_i^2\) segue una distribuzione \(\chi\)-quadrato con \(n\) gradi di libertà (\(gdl\)).

Nella tavola 2 sono riportati i percentili della v.c. \(\chi^2\) dove per riga sono indicati i gradi di libertà e per colonna la probabilità associata dal percentile fino al valore massimo.

Calcolare i seguenti percentili
a) \(P(\chi^2>\chi_{(0,95;12)}^2 )=0,05\);
b) \(P(0<\chi^2<\chi_{(0,05;12)}^2 )=0,95\);
c) \(P\left (0<\chi^2 < \chi_{(0,9;6)}^2 \right )=0,1\); d) \(P\left(\chi_{0,99;8}^2 <\chi^2 < \chi_{0,01;8} \right )=0,98\).
Soluzione
a) Per individuarlo bisogna cercare nella riga corrispondente a 12 \(gdl\) e nella colonna corrispondente ad \(\alpha=0,95\): \(\chi_{(0,95;12)}^2=5,2260\);
b) \(\chi_{(0,05;12)}^2=21,0261\);
c) \(\chi_{(0,9;6)}^2=2,2041\);
d) \(\chi_{0,99;8}^2=1,6465\) e \(\chi_{0,01;8}^2=20,0902\).

A figure caption.

A figure caption.

In alcuni casi è noto il percentile e i gradi di libertà ma non \(\alpha\). Il valore di \(\alpha\) può essere ricavato sempre dalle tabelle cercando il percentile in corrispondenza della riga dei gdl, ad esempio per \(\chi_{(\alpha;4)}^2=18,4662\) \(\alpha=0,001\) e per \(\chi_{(\alpha;7)}^2=2,8331\) \(\alpha=0,90\).

Distribuzione t di Student {Distribuzione \(t\) di Student}

La v.c. \(T\) segue una distribuzione \(t\) di Student se e solo se è data dal rapporto tra due v.c. indipendenti, dove la prima segue una distribuzione normale standardizzata e la seconda è la radice quadrata del rapporto tra una v.c. \(\chi\)-quadrato e i suoi gradi di libertà: \(T=Z/\sqrt{Y/n}\) con \(Z \sim N(0,1)\) e \(Y \sim \chi_n^2\).

La funzione di densità della distribuzione t di Student è simmetrica, unimodale e di forma campanulare. Inoltre, quando i gradi di libertà aumentano, in genere per \(n > 30\), si ha che quest’ultima è una buona approssimazione della distribuzione normale.
Nella tavola 3 sono riportati i percentili della v.c. \(t\) di Student dove per riga sono indicati i \(gdl\) e per colonna la probabilità associata dal percentile fino al valore massimo.

Calcolare i sequenti percentili:
a) \(P(T> t_{0,01;12})=0,01\);
b) \(P(-\infty<T<t_{0,1;14})=0,90\).
Calcolare inoltre le probabilità associate ai seguenti percentili:
c) \(t_{\alpha;14}=2,1448\);
d) \(t_{\alpha;8}=3,3554\).
Soluzione
a) in corrispondenza della dodicesima riga e quinta colonna si ha il percentile \(t_{0,01;12}=2,6810\);
b) in corrispondenza della quattordicesima riga e seconda colonna si ha il percentile \(t_{0,1;14}=1,345\);
c) bisogna cercare il percentile nella riga corrispondente ai quattordici gradi di libertà, trovato il quale si legge l’alfa associato nella colonna considerata: \(P(T>t_{\alpha;14}=2,1448)=0,025\) o equivalentemente \(P(- \infty<T<t_{\alpha;14}=2,1448)=1-0,025=0,975\);
d) bisogna cercare nella riga corrispondente agli 8 \(gdl\) il percentile 3,3554 che corrisponde alla colonna con una probabilità pari a 0,005, quindi \(P(T>t_{\alpha;8}=3,3554)=0,005\) o equivalentemente \(P(-\infty <T<t_{\alpha;8}=3,3554)=1-0,005=0,995\).

A figure caption.

A figure caption.

Distribuzione \(F\) di Fisher-Snedecor

La v.c. \(F\) segue una distribuzione \(F\) di Fisher-Snedecor se e solo se è data dal rapporto tra due v.c. \(\chi^2\) indipendenti tra loro e rapportate ai rispettivi gradi di libertà. Siano \(Y_1 \sim \chi^2_n1\) e \(Y_2 \sim \chi^2_n2\) due v.c. \(\chi\)-quadrato, la v.c. \(F\) di Fisher- Snedecor è
\[F_{n1,n2}=\frac{Y_1 / n_{1}}{Y_2 / n_{2}}\] Nelle tavole 4 sono riportati i percentili della v.c. \(F\) di Fischer-Snedecor dove per riga sono indicati i gradi di libertà della v.c. al numeratore e per colonna i gradi di libertàa della v.c. al denominatore e ogni tavola si riferisce ad un diverso valore \(\alpha\).

Calcolare i sequenti percentili:
a) \(P(F>F_{0,05;3,4} )=0,05\);
b) \(P(0 \leq F \leq F_{0,025;6,5})=0,975\);
c) \(P(F>F_{0,99;3,5} )=0,99\);
d) \(P(0<F<F_{0,95;4,6}=1/F_{0,05;6,4} )=0,05\).
Soluzione a) selezionata la tavola con \(\alpha=0,05\) e in corrispondenza della terza riga e quarta colonna si ha \(F_{0,05;3,4}=6,59\);
b) si seleziona la tavola con \(\alpha=0,025\) e in corrispondenza della sesta riga e quinta colonna si ha il percentile \(F_{0,025;6,5}=6,98\);
c) per tale valore di \(\alpha\) non è disponibile la tavola, per trovare il percentile si considera il reciproco del percentile associato al complemento a \(1-\alpha\) con i gradi di libertà invertiti: \(P(F>F_{0,99;3,5}=1/F_{0,01;5,3})=0,99\) cioè \(P(F>F_{0,99;3,5}=1/28,24)=0,99\), \(F_{0,99;3,5}=0,0354\);
d) si procede similmente a c) \(F_{0,95;4,6}=1/4,53=0,22\).

A figure caption.

A figure caption.

#ESEMPI esempio Poisson Gli aiuti umanitari in una regione africana arrivano in modo casuale in ragione di quattro convogli al mese. Assumendo che il numero di arrivi dei convogli segua una distribuzione di Poisson, determinare la probabilit`a che arrivano due convogli. Determinare inoltre la probabilit`a che almeno un convoglio arrivi in un mese.

  • La probabilità che arrivino due convogli `e \(P(X=2)=\frac{\lambda^x e^{-\lambda}}{x!}=(4^2 2,718^{-4})/2!\cong0,293/2\cong0,01465=14,65\%\);
  • Per calcolare la probabilit`a che arrivi almeno un convoglio `e possibile procedere sottraendo la probabilit`a associata all’intero spazio campione quella che non arrivi nessun convoglio: in tal modo si evita di calcolare la probabilit`a associata ad un convoglio, a due convogli, a tre convogli … per poi sommarle; quindi \(\sum_{i=1}^{\infty }P\left ( X=x_i \right )=1-P\left ( X=0 \right )=1-\frac{\lambda ^xe^{-\lambda}}{x!}=1-\frac{4^0 2,718^{-4}}{0!}\cong 1-0,018=98,2\%\).

E’ noto che il peso segue una distribuzione normale, in Cambogia la probabilità di incontrare un bambino che ha un peso minore o uguale a 12 kg è pari al 2,5% mentre la probabilità di incontrare un bambino di peso superiore a 25 kg è pari a 5%. Qual è il valore medio e la varianza del peso della popolazione dei bambini cambogiani? Soluzione La probabilità di incontrare un bambino che pesi tra 12 e 25 kg è pari al 92,5%: \(P((12-\mu)/\sigma=z_1<Z<z_2=(25-\mu)/\sigma)=1-0,025-0,05=0,925\). Per risalire ai percentili \(z_1\) e \(z_2\) si ha \(P(Z<(12-\mu)/\sigma)=P(z_1=(12-\mu)/ \sigma<Z<0)=0,5-0,025=0,475\) che corrisponde al percentile \(z_1=-1,96\), mentre \(P(Z>z_2=(25-\mu)/ \sigma)=P(0<Z<z_2=(25-\mu)/ \sigma)=0,5-0,05=0,45\) che corrisponde al percentile \(z_2=1,645\), mettendo a sistema le due equazioni si ha:

\[ \begin{matrix} -1,96=(12-\mu) / \sigma \\ 1,64=(25-\mu)/ \sigma \end{matrix} = \begin{matrix} -1,96\sigma=12-\mu \\ 1,64\sigma=25-\mu \end{matrix} = \begin{matrix} \mu=12+1,96\sigma \\ 1,64\sigma=25-\mu \end{matrix} = \begin{matrix} \mu=12+1,96\sigma \\ 1,64\sigma=25-12-1,96\sigma \end{matrix} = \begin{matrix} \mu=12+1,96\sigma \\ (1,64+1,96)\sigma=13 \end{matrix} \begin{matrix} \mu=12+1,96\sigma \\ \sigma=13/3,6=3,61 \end{matrix}= \begin{matrix} \mu=12+1,96*3,61=19,08 \\ \sigma=3,61 \end{matrix} \] La funzione di ripartizione per una v.c. discreta e continua è così rappresentabile. Uno studente ha raccolto i voti attribuiti dalla commissione per tutti gli esami sostenuti negli anni precedenti: voto 17 (440), 18 (210), 19 (290), 20 (265), 21 (190), 22 (165), 23 (140), 24 (130), 25 (95), 26 (80), 27 (70), 28 (60), 29 (50),30 (45), 31=30Lode (20).

## Warning: `qplot()` was deprecated in ggplot2 3.4.0.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
A figure caption.

A figure caption.

E’ noto che il professore inizierà la lezione con meno di cinque minuti di ritardo con una probabilità pari a un quarto di iniziarla con un ritardo tra 5 e 7 minuti, mentre inizierà la lezione con un ritardo tra 7 e 14 minuti con una probabilità pari al doppio di iniziarla con meno di cinque minuti. Sapendo, inoltre, che inizierà la lezione con un ritardo superiore a 14 minuti con una probabilità pari a zero, Rappresentare la funzione di densità e quella di ripartizione della v.c.
Soluzione Non sono note le probabilità associate ai diversi minuti di ritardo con cui il professore inizierà la lezione, quindi prima di rappresentare le funzioni bisogna calcolarle. E’ noto che la \(\mathrm{P}(0\leq X \leq5)=0.25*\mathrm{P}(5\leq X \leq7)\), è anche noto che \(\mathrm{P}(7\leq X\leq14)=2*\mathrm{P}(0\leq X\leq5)\). Inoltre, considerando che si è certi che il ritardo sia contenuto tra 0 e 14 minuti, si ha \(\mathrm{P}(0\leq X\leq5)+\mathrm{P}(5\leq X\leq7)+\mathrm{P}(7\leq X\leq14)=1\). Il problema può essere risolto considerando considerando che \(\mathrm{P}(5\leq X \leq7)=4*\mathrm{P}(0\leq X \leq5)\) e \(\mathrm{P}(0\leq X\leq5)+\mathrm{P}(5\leq X\leq7)+\mathrm{P}(7\leq X\leq14)= \mathrm{P}(0\leq X\leq5)+4*P(0\leq X\leq5)+2*P(0\leq X\leq5)\), risolvendo si ha \(\mathrm{P}(0\leq X\leq5)=1/7\), da cui \(\mathrm{P}(5\leq X\leq7)=4/7\) e \(\mathrm{P}(7\leq X\leq14)=2/7\). A questo punto è possibile rappresentare la funzione di densità e quella di ripartizione.

A figure caption.

A figure caption.

## [1] 24545726