Exemplo: Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de 21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93.
Quem tem maior probabilidade de ser sorteado?
\[P(X=x_i) = p(x_i) = \frac{1}{k}, \quad \forall \; 1\leq i \leq k\]
Exemplo: lançamento de um dado honesto de 6 faces
| \(X\) | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| \(p(x)\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) |
A média e a variância são dadas por:
\(\mathbb E(X)=\displaystyle \sum_{i=1}^k x_iP(X=x_i)= \frac{1}{k}\sum_{i=1}^k x_i\)
\(Var(X) = \displaystyle \sum_{i=1}^k (x_i - \mathbb E(X))^2 P(X=x_i) = \frac{1}{k} \sum_{i=1}^k (x_i - \mathbb E(X))^2\)
ou
\(Var(X) = \mathbb E(X^2) - [\mathbb E(X)]^2 = \displaystyle \frac{1}{k} \left[\sum_{j=1}^{k}x_{j}^{2} - \frac{1}{k} \left ( \displaystyle\sum_{j=1}^{k}x_{j} \right)^{2} \right]\)
Exemplo: lançamento de um dado honesto de 6 faces
| \(X\) | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| \(p(x)\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) |
Calculando a esperança e a variância de \(X\):
\(\mathbb E(X) = \frac{1}{6} (1+2+3+4+5+6)= \frac{21}{6} = 3.5\)
\(Var(X) = \displaystyle \frac{1}{6} \left[(1 + 4 + 9 + 16 + 25 + 36) - \frac{1}{6} (21)^{2} \right] = \frac{1}{6} \times \frac{35}{2} = 2.92\)
Cálculo da função de distribuição acumulada (f.d.a.) de uma variável uniforme discreta:
\[F(x)= P(X\leq x)= \sum_{x_i \leq x} \frac{1}{k} = \frac{\#(x_i \leq x)}{k}\]
Exemplo: voltando ao exemplo do lançamento de um dado honesto de 6 faces
\(F(2)= P(X\leq2)=P(X=1)+P(X=2)=\frac{2}{6}\)
\(F(2.5)= P(X\leq2.5)= P(X=1)+P(X=2)=\frac{2}{6}\)
| \(X\) | \(p(x)\) | \(F(x)\) |
|---|---|---|
| 1 | \(\frac{1}{6}\) | \(\frac{1}{6}\) |
| 2 | \(\frac{1}{6}\) | \(\frac{2}{6}\) |
| 3 | \(\frac{1}{6}\) | \(\frac{3}{6}\) |
| 4 | \(\frac{1}{6}\) | \(\frac{4}{6}\) |
| 5 | \(\frac{1}{6}\) | \(\frac{5}{6}\) |
| 6 | \(\frac{1}{6}\) | \(\frac{6}{6}\) |
Em muitas aplicações, cada observação de um experimento aleatório é binária: tem apenas dois resultados possÃveis.
Por exemplo, uma pessoa pode:
\[ X = \begin{cases} 1, & \mbox{se a pessoa respondeu sim } (sucesso) \\ 0, & \mbox{caso contrário } (fracasso) \\ \end{cases} \]
\[P(X=1)=P(sucesso)=p \;\; \rightarrow \;\; P(X=0)=P(fracasso)=1-p\]
Seja \(X\) uma v.a. discreta assumindo apenas valores 0 e 1, onde \(X=1\) corresponde a sucesso e seja \(p\) a probabilidade de sucesso.
A distribuição de probabilidade de \(X\) é dada por:
\[ P(X=x) = \begin{cases} p & \mbox{se } x=1 \\ 1-p & \mbox{se } x=0 \\ \end{cases} \]
Ou de forma equivalente, podemos escrever como: \[P(X=x) = p^{x}(1-p)^{1-x}, \quad \mbox{para } x=0,1\]
Notação: \(X \sim b(p)\)
Se \(X\) é um v.a. Bernoulli, \(X \sim b(p)\), então:
\[\mathbb E(X) = p \quad \mbox{e} \quad Var(X)=p(1-p)\]
Demonstração:
A função de distribuição acumulada de uma v.a. Bernoulli é: \[ F(x) = \begin{cases} 0, & x < 0 \\ 1-p, & 0 \leq x < 1 \\ 1, & x \geq 1 \end{cases} \]
Exemplo: lançamos um dado e consideramos sucesso a obtenção da face 5
Supondo que o dado seja honesto, a probabilidade de sucesso é \(p = 1/6\). Então:
\[ \begin{aligned} P(X=x) &= \left(\frac{1}{6} \right)^x \left(\frac{5}{6} \right)^{1-x} \qquad \mbox{para } x=0,1 \\ &= \begin{cases} 5/6 & \mbox{se } x=0 \\ 1/6 & \mbox{se } x=1 \\ \end{cases} \end{aligned} \]
\(\qquad \mathbb E(X)=\frac{1}{6} \qquad \qquad \mathbb E(X^2)=\frac{1}{6}\)
\(\qquad Var(X)=\frac{1}{6}-\frac{1}{36}=\frac{6-1}{36}=\frac{5}{36}\)
Ao obtermos uma amostra do experimento/fenômeno aleatório com observações binárias, podemos resumir os resultados usando o número ou a proporção de observações com o resultado de interesse.
Sob certas condições, a v.a. \(X\) que conta o número de vezes que um resultado especÃfico ocorreu, dentre dois possÃveis, tem uma distribuição de probabilidade chamada Binomial.
Sabe-se que a eficiência de uma vacina é de \(80\%\).
Um grupo de 3 indivÃduos é sorteado, dentre a população vacinada, e cada um é submetido a testes para averiguar se está imunizado.
Nesse caso, consideramos como sucesso a imunização.
\[ X_i = \begin{cases} 1, & \mbox{indivÃduo i está imunizado} \\ 0, & \mbox{caso contrário} \end{cases} \]
Pelo enunciado, sabe-se que \(P(X_{i}=1)=p=0.8\).
| evento | P(evento) | X |
|---|---|---|
| \(X_{1}=0\), \(X_{2}=0\), \(X_{3}=0\) | \((0.2)^{3}\) | 0 |
| \(X_{1}=1\), \(X_{2}=0\), \(X_{3}=0\) | \(0.8\times(0.2)^{2}\) | 1 |
| \(X_{1}=0\), \(X_{2}=1\), \(X_{3}=0\) | \(0.8\times(0.2)^{2}\) | 1 |
| \(X_{1}=0\), \(X_{2}=0\), \(X_{3}=1\) | \(0.8\times(0.2)^{2}\) | 1 |
| \(X_{1}=1\), \(X_{2}=1\), \(X_{3}=0\) | \((0.8)^{2}\times0.2\) | 2 |
| \(X_{1}=1\), \(X_{2}=0\), \(X_{3}=1\) | \((0.8)^{2}\times0.2\) | 2 |
| \(X_{1}=0\), \(X_{2}=1\), \(X_{3}=1\) | \((0.8)^{2}\times0.2\) | 2 |
| \(X_{1}=1\), \(X_{2}=1\), \(X_{3}=1\) | \((0.8)^{3}\) | 3 |
\(X\) 0 1 2 3 \(P(X=x)\) \((0.2)^{3}\) \(3\times0.8\times(0.2)^{2}\) \(3\times(0.8)^{2}\times0.2\) \((0.8)^{3}\)
\[P(X=x)={3\choose x}(0.8)^{x}(0.2)^{3-x}, \qquad x=0,1,2,3\]
Modelo Geral: Considere a repetição de \(n\) ensaios \(X_i\) Bernoulli independentes e todos com a mesma probabilidade de sucesso \(p\).
A variável aleatória \(X=X_{1}+...+X_{n}\) representa o total de sucessos e corresponde ao modelo Binomial com parâmetros \(n\) e \(p\), ou seja, \(X\sim Bin(n,p)\).
A probabilidade de se observar \(x\) é dada pela expressão geral: \[P(X=x)={n\choose x}p^{x}(1-p)^{n-x}, \qquad x=0,1,...,n\]
A esperança e variância de uma v.a. Binomial são dadas por: \[\mathbb E(X)=np \qquad \mbox{e} \qquad Var(X)=np(1-p)\]
Distribuição de probabilidade de uma \(Bin(3, p)\), com \(p=0.2, 0.5\) e \(0.8\).
\[X\sim Bin(3,0.8)\]
\[\mathbb E(X)=3\times 0.8 = 2.4 \qquad \mbox{e} \qquad Var(X)=3\times0.8\times0.2 = 0.48\]
Um inspetor de qualidade extrai uma amostra aleatória de 10 tubos armazenados num depósito onde, de acordo com os padrões de produção, se espera um total de \(20\%\) de tubos defeituosos.
Qual é a probabilidade de que não mais do que \(2\) tubos extraÃdos sejam defeituosos?
Se \(X\) denotar a variável "número de tubos defeituosos em 10 extrações independentes e aleatórias", qual o seu valor esperado? Qual a variância?
Note que a variável aleatória \(X\) = número de tubos defeituosos em 10 extrações tem distribuição binomial, com parâmetros \(n=10\) e \(p=0.2\).
Então, "não mais do que dois tubos defeituosos" é o evento \(\{X\leq2\}\).
Sabemos que, para \(X \sim Bin(10, 0.2)\) \[P(X=x) = { 10\choose x } (0.2)^x (0.8)^{10-x}, \qquad x=0,1, \ldots, 10\]
e que \[\begin{aligned} P(X\leq2) &= P(X=0) + P(X=1) + P(X=2) \\ &=(0.8)^{10} + 10 (0.2)(0.8)^{9} + 45 (0.2)^2 (0.8)^8 = 0.678 \end{aligned} \]
Se \(X \sim Bin(n,p)\), então \(\mathbb E(X) = np\) e \(Var(X) = np(1-p)\)
Então:
\(\mathbb E(X) = 10 (0.2) = 2\)
\(Var(X) = 10 (0.2)(0.8) = 1.6\)
Quando se encontram quatro ou mais tubos defeituosos, o processo de produção é interrompido para revisão. Qual é a probabilidade que isto aconteça?
\[ \begin{aligned} P(X\geq 4) &= 1 - P(X < 4) \\ &= 1 - P(X \leq 3) \\ &= 1-0.879 = 0.121 \end{aligned} \]
Exemplo: Um industrial fabrica peças, das quais 1/5 são defeituosas. Dois compradores A e B classificaram um grande lote de peças adquiridas em categorias \(I\) e \(II\), pagando \(\$ 1.20\) e \(\$ 0.80\) por peça, respectivamente, do seguinte modo:
Em média, qual comprador oferece mais lucro?
Fonte: Morettin & Bussab, EstatÃstica Básica \(5^a\) edição, pág 159.
Sabemos que 1/5 das peças são defeituosas.
Podemos nos concentrar na probabilidade dos vendedores julgarem um lote como tipo \(I\) ou \(II\).
Seja \(X\) o número de peças defeituosas em \(n\) testes.
O experimento do comprador A tem distribuição \(X_A \sim Bin(5, 1/5)\) enquanto o experimento do comprador B tem distribuição \(X_B \sim Bin(10, 1/5)\).
Para o comprador A, temos que: \[ \begin{aligned} P(X_A > 1 ) &= 1 - P(X_A = 0 ) - P(X_A = 1 ) \\ &= 1 - {5 \choose 0} \left (1-\frac{1}{5} \right)^5- {5 \choose 1} \left( \frac{1}{5} \right) \left (1-\frac{1}{5} \right)^4 = 0.263 \end{aligned}\]
De modo similar, para o comprador B temos: \[\begin{aligned} P(X_B > 2 ) &= 1 - {10 \choose 0} \left (1-\frac{1}{5} \right )^{10} - {10 \choose 1} \frac{1}{5} \left (1-\frac{1}{5} \right )^9 \\ &- {10 \choose 2} \left( \frac{1}{5} \right)^2 \left (1-\frac{1}{5} \right )^8 = 0.322 \end{aligned}\]
Como o segundo comprador irá classificar o lote como \(II\) com maior probabilidade que o primeiro, ele é o que oferece menor lucro para o fornecedor.
Mas podemos verificar o lucro esperado do vendedor.
Preço por peça na categoria \(I\): $1.20. Preço por peça na categoria \(II\): $0.80.
Se o industrial decidir vender o lote para o comprador A, temos que
\[\mathbb E(\mbox{lucro A}) = 1.20 \times 0.737 + 0.80 \times 0.263 \approx 1.09\]
Ou seja, ele irá lucrar em média \(\$ 1.09\) por peça.
Já se ele vender para o comprador B, temos que
\[\mathbb E(\mbox{lucro B}) = 1.20 \times 0.678 + 0.80 \times 0.322 \approx 1.07\]
que é um lucro dois centavos inferior.
Portanto, é mais interessante ao industrial que o comprador A examine mais peças.
Um inimigo de Sherlock propõe um jogo, que consiste no lançamento de uma moeda honesta várias vezes, em quatro versões:
O inimigo escolhe primeiro qual a versão do jogo e depois Sherlock terá que escolher se quer jogar com \(10\) ou \(100\) lançamentos da moeda.
Se o inimigo escolhe a versão 1, Sherlock deve escolher 10 ou 100 lançamentos?
Seja \(X_i\) a v.a. que indica o resultado do \(i\)-ésimo lançamento da moeda, ou seja,
\[X_i = \begin{cases} 1, & \mbox{se sair cara} \\ 0, & \mbox{se sair coroa} \end{cases} \quad \mbox{e} \quad P(X_i=0)=P(X_i=1)=0.5 \]
Seja \(X=\sum_{i=1}^nX_i\) a v.a. que indica o número de caras em \(n\) lançamentos da moeda. Então, \(X \sim \mbox{Bin}(n, 0.5).\)
Na versão 1, Sherlock vence se a proporção de caras é maior do que \(0.60\), ou seja, se \(X\geq n \times 0.6\).
Basta então Sherlock comparar \(P(X\geq n\times 0.6)\) para \(n=10\) ou \(n=100\) e escolher o que resultar em maior probabilidade.
Se a proporção de caras for maior ou igual do que \(0.60\), Sherlock vence.
Se a proporção de caras for maior ou igual do que \(0.40\), Sherlock vence.
Se a proporção de caras estiver entre \(0.40\) e \(0.60\) (inclusive), Sherlock vence.
Se a proporção de caras for menor ou igual do que \(0.30\), Sherlock vence.
Na prática, para tomar uma decisão rápida, Sherlock deve considerar que a proporção esperada de caras é sempre 0.5, mas que quando \(n\) é menor, existe maior variabilidade em torno desse valor esperado.
Aqui Sherlock deve escolher \(n=10\), pois a variância de \(X/n\) (proporção de caras) é maior com \(n=10\).
Aqui Sherlock deve escolher \(n=100\), pois a variância de \(X/n\) é menor com \(n=100\), portanto chances maiores da proporção observada estar próxima da proporção esperada.
Mesmo raciocÃnio do item anterior.
Mesmo raciocÃnio do item 1.
Slides produzidos pelos professores:
Samara Kiihl
Tatiana Benaglia
Benilton Carvalho