Utilizamos distribuições padrão pela dificuldade de cálculo e falta de meios computacionais para calcular a distribuição específica de um conjunto de dados.
Uma aproximação de distribuição permite identificar u bom ajusteo com pequeno erro percentual em relacão à distribuição original.

Distribuição Exponencial

Trata-se de um modelo de distribuição para variáveis aleatórias (v.a.) contínuas que seguem um modelo dade pela função densidade de probabilidade:

\[f(x) = \begin{cases} \alpha e^{-ax}, x \geq 0 \\ 0, x < 0 \end{cases} \to -\infty < 0 < \infty\]

\[f(x) = \int_{-\infty}^{x} f(x) \; dx) = \int_{0}^{x} \alpha e^{-dxt} dx \] Onde o parâmetro \(\alpha\) é o intercepto em \(x=0\), ou seja, \(\alpha\) informa o falor onde inicia o decaimento da distribuição e o valor de \(x\) fornece a velocidade do decaimento. Assim,, sew o valor de \(\alpha\) for muito alto ela decai de forma brusca, e o aumento do valor de \(x\) atua acelerando esse decaimento

x <- seq(0, 8, 0.1)
# lambda = 2
plot(x, dexp(x, 2), type = "l",
     ylab = "", lwd = 2, col = "red")
# lambda = 1
lines(x, dexp(x, rate = 1), col = "blue", lty = 1, lwd = 2)
# lambda = 0.5
lines(x, dexp(x, rate = 0.5), col = "orange", lty = 1, lwd = 2)
legend("topright", c(expression(paste(, lambda)), "2", "1", ".5"),
       lty = c(0, 1, 1, 1), col = c("orange", "red", "blue"), box.lty = 0, lwd = 2)

Para a funcão de distribuicão acumulada: \[f(x) = \begin{cases} \alpha -e^{-ax}, x \geq 0 \\ 0, x < 0 \end{cases} \to -\infty < 0 < \infty\]

\[f(x) = p(X \leq x) = \int_{- \infty}^{x} f(x) \; dx) = \int_{0}^{x} \alpha e^{-dx} dx = \alpha \frac{e^{-\alpha x}}{(-\alpha)} \int_{0}^{x} = -[e^{-\alpha x}-1] = 1-e^{-\alpha x}\]

x <- seq(0, 8, 0.1)
# lambda = 2
plot(x, pexp(x, 2), type = "l",
     ylab = "F(x)", lwd = 2, col = "red")
# lambda = 1
lines(x, pexp(x, rate = 1), col = "blue", lty = 1, lwd = 2)
legend("topright", c(expression(paste(, lambda)), "1", "2"),
       lty = c(0, 1, 1), col = c("red", "blue"), box.lty = 0, lwd = 2)
#lambda = 0.5
lines(x, pexp(x, rate = 0.5), col = "orange", lty = 1, lwd = 2)
legend("topright", c(expression(paste(, lambda)), "2", "1", ".5"),
       lty = c(0, 1, 1, 1), col = c("orange", "red", "blue"), box.lty = 0, lwd = 2)

Exemplos

Determinado material radioativo apresenta um intervalo de tempo, em minutos, entre emissões consecutivas dado por uma distribuição exponencial com \(\alpha = 0.2\). Qual a probabilidade de ocorrência de uma emissão em um intervalo menor que dois minutos? \[ T = tempo entre emissões\] \[P(T \leqslant 2) = \int_{-\infty}^{2} f(t) \; dt) = \int_{0}^{2} \alpha e^{-dt} dt = \alpha\int_{0}^{2}e^{-dt} dt = \alpha\frac{e^{-dt}}{(-\alpha)}\int_{0}^{2} = - [e^{-2\alpha}+1] = 1-e^{2*0.2}= 1-e^{0.4} = 0.33 \] \[\therefore 33 \% \] #### Distribuicão Expenencial é uma distribuição sem memória: \[P{x \geq t+s | X \geq s} = P(x \geq t) \] \[ P{x \geq t+s | X \geq s} = \frac{P{x \geq t+s , X \geq s} }{P(x \geq s)} = \frac{p(X \geq t+s)}{P(x \geq s)} = \frac{e^{-\alpha(t+s)}}{e^{-\alpha s}} = \frac{e^{-\alpha t} e^{-\alpha s}}{e^{-\alpha s}} = e^{-\alpha t} \\ \therefore = P(X \geq t)\]

Exemplo

O intervalo de tempo, em minutos, entre emissões consecutivas permanece \(t=0.2\). Agora, qual a probabilidade do intervalo entre emissões ser superior a 7, sabendo que ele é maior do que 5 minutos?

\[ p(T \geq 7 | T \geq 5) = P(T \geq 2) = e^{-2*0.2} = e^{-0.4} = 0.67\] \(\therefore 67 \%\)

Experanca e Variância

\[E[X] = \frac{1}{\alpha}\] \[Var[X] = \frac{1}{\alpha^2}\] \[\therefore E[x] = \int_{-\infty}^{\infty} xf(x) \; dx) = \int_{-\infty}^{\infty} x\alpha e^{-\alpha x}\; dx) = \alpha \int_{-\infty}^{\infty} x e^{-\alpha x}dx\] \[ x = u \\ e^{-\alpha x}dx = vdv\] \[ = \alpha \left[ \frac{x e^{-\alpha x}}{(-\alpha)} - \frac{e^{-\alpha x}}{(-\alpha)} dx \right]_0^\infty = \alpha \left[ 0 + \frac{1}{\alpha}\frac{e^{-\alpha x}}{(-\alpha)} \right]_0^\infty = \alpha\left[-\frac{1}{\alpha^2} [0-1] \right] = \frac{\alpha}{\alpha^2} = \frac{1}{\alpha}\] \[ Var(X) = E[x^2]-E[x]^2 \to \therefore \frac{1}{\alpha^2} \]

Distribuição Binomial

Trata-se de uma distribuição de probabilidade para valores discretos onde o número de sucessos é dado pelo número de eventos esperados dentre um conjunto de n tentativas. nesse modelo cada tentativa possuis apenas dos resultados possíveis, sucesso ou fracasso (binomial) chamada de tentativa de Bernoulli. Além, disso cada tentativa é independente das demais, possuindo portanto probabilidade constante e independente das demais tentativas. Desde já que a variável de interesse ou pretendida nessa distribuição é o número de k sucessos entre as n tentativas descritas como:

\[P(k;n,p) = \binom{n}{k} p^k (1-p)^{n-k}\]

Para k = 0,1,2,….,n onde \(\binom{n}{k}\) é uma combinacão, que fornece a função completa:

\[P(k;n,p) = \frac{n!}{k!(n-k)!} p^k (1-p)^{n-k}\]

Apresentando valor esperado e variância dados por:

\[E[x] = np\] \[var{X} = np(1-p)\]

Exemplos

Quando três dados não viciados são lançados, a probabilidade de que o número 3 seja apresentado mais de uma vez é dada pela soma das probabilidades de k=2 e k = 3, que pode ser dado pela binomial da seguinte maneira: \[f(2;3,\frac{1}{6}) = \binom{3}{2}*\binom{1}{6}^2*(1-\binom{1}{6})^{3-2}\] \[=\frac{3!}{2!*(3-2)!}*\frac{1}{36}*(\frac{5}{6})^1\] \[= \frac{3}{1}*\frac{1}{36}*\frac{5}{6} = \frac{15}{216} = \frac{5}{72}\] e,

\[ \therefore f(3;3,\frac{1}{6}) = \binom{3}{3}*\binom{1}{6}^3*(1-\binom{1}{6})^{3-3}\]

\[=\frac{3!}{3!*(3-3)!}*\frac{1}{216}*(\frac{5}{6})^0\]

\[= \frac{3!}{3!}*\frac{1}{216}*1 = = \frac{6}{6} *\frac{1}{216}*1 = 1 *\frac{1}{216}*1 = \frac{1}{216} \]

e, \[ \therefore \frac{15}{216} + \frac{1}{216} = \frac{16}{216} \] Sendo por fim igual a 7.4074074 %.

Distribuição de Poisson

Tratase de um modelo de distribuição discreta, onde é mensurada a probebilidade de um certo evento independente ocorrer um certo número de vezes em um intervalo de tempo, área, etc. Esta distribuição foi descoberta por Siméon Denis Poisson quando realizava estudos sobre a probabilidade de julgamentos sobre matérias criminais e civis. A distribuicão de Poisson possui apenas um parâmetro chamado lambda (\(\lambda\)) representando o número esperados de ocorrências no intervalo de mensuracão. A funcão de distribuição é dada por:

\[ f(k;\lambda) = \frac{e^\lambda\lambda^k}{k!},\]

e apresentada pela notação \(X ~ Poisson(\lambda)\)

A Esperança de \(X\) e sua variancia são o próprio \(\lambda\):

\[E[X]= \sum_{n=0}^{\infty} \frac{e^{-\lambda}\lambda^k}{k!} = \sum_{n=0}^{\infty} \lambda \frac{e^{-\lambda}\lambda^{k-1}}{(k!-1)!} = \lambda e^{-\lambda} \sum_{n=0}^{\infty}[\frac{\lambda^{k-1}}{(k-1)!}] = \lambda e^{-\lambda} \sum_{n=0}^{\infty}[\frac{\lambda^k}{k!}] = \lambda e^{-\lambda} e^{\lambda} = \lambda\]

e,

\[Var(X)= E(X^2) - (E(X))^2 = \lambda(\lambda+1)-\lambda^2=\lambda\]

Exemplos:

Considere que em uma seguradora a taxa de sinistros é de 0.2 sinistros por dia. Qual a probabilidade de a seguradora no próximo dia atender dois ou mais sinistros, um sinistro ou nenhum sinistro? Para a presente distribuicão, temos uma distribuição de Poisson com \(X ~Poisson(\lambda)\) com \(\lambda=0.2\), logo:

\[P(X = 2) = \frac{e^{-0,2}(0,2)^2}{2!} = 0,0164\]

\[P(X = 1) = \frac{e^{-0,2}(0,2)^1}{1!} = 0,1637\] \[P(X = 0) = \frac{e^{-0,2}(0,2)^0}{0!} = 0,8187\]

Aproximação de Binomial e Poisson

Em situacões que se apresentam com um elevado número de ensaios (\(x\to \infty\))e uma probabilidade extremamente baixa (\(p\to 0\)), o cálculo da binomial se torna dispendioso ao tornar dificil o cálculo da probabilidade de k sucessos.

\[p(k) = P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}\] a mesma expressão pode ser reescrita como:

\[P(X=k)=\frac{n!}{k!(n-k)!}pk\frac{n^k}{n^k}(1-\frac{np}{n})^{n-k} = \frac{n!}{k!(n-k)!}\frac{(np)^k}{n^k}(1-\frac{np}{n})^{n-k}\] ao substituir \(\lambda\) por \(np\):

\[P(X=k) = \frac{n(n-1)...n(n-k+1)}{k!}\frac{\lambda^k}{n^k}(1-\frac{\lambda}{n})^{n-k} = \frac{\lambda^k}{n^k}(1-\frac{\lambda}{n})...(1-\frac{k-1}{n})(1-\frac{\lambda}{n})^{n-k}\]

Assim, se o limite tende ao infinifo (\(n\to \infty\)) se chega em:

\[\lim_{x \to \infty} 1 \biggl(1-{\frac{1}{n}}\biggr)...\biggl(1-{\frac{k-1}{n}}\biggr) = 1\] \[\lim_{x \to \infty} \biggl(1-{\frac{\lambda}{n}}\biggr)^{n-k} = \lim_{x \to \infty} \biggl(1-{\frac{\lambda}{n}}\biggr)^{n} = e^{-\lambda} \] \[\therefore \lim_{x \to \infty} P(X=k)= \frac{e^{-\lambda}\lambda^k}{k!}\]

Exemplos

Em uma fábrica de televisores o controle de qualidade identifica que 0.001% dos equipamentos apresentam falha ao ligar, qual a probabilidade de que em um lote de 4000 televisores, 2 ou mais apresentem a referida falha?

Poisson

Temos: \(\lambda = n.p = 4000*0.00001 = 0.04\)

\[\therefore P(X=2) = 1-P{X=0}-P(X=1) = 1-\frac{0.04^0e^{-0.04}}{0!}-\frac{0.04^1e^{-0.04}}{1!} \approx 1- 0.999221 \approx 0 .00078\]

Distribuição Gama

curve(expr = dgamma(x = x, shape = 2, rate = 2), xlab = "", ylab = "", main = "Gamma  Beta = 2", lwd = 2, col = 1, xlim = c(0, 2),
      ylim = c(0, 8))
for (i in 1:5) {
  curve(expr = dgamma(x = x, shape = 2, rate = c(3, 5, 10, 15, 20)[i]), lwd = 2, col = (2:6)[i], add = TRUE)
}
legend(x = "topright", legend = c("Escala = 2", "Escala = 3",
                                  "Escala = 5", "Escala = 10",
                                  "Escala = 15", "Escala = 20"), lwd = 2, col = 1:6)

curve(expr = dgamma(x = x, shape = 2, rate = 2), xlab = "", ylab = "", main = "Gamma Lambda = 2", lwd = 2, col = 1, xlim = c(0, 20),
      ylim = c(0, 0.8))
for (i in 1:5) {
  curve(expr = dgamma(x = x, shape = c(3, 5, 10, 15, 20)[i],  rate = 2), lwd = 2, col = (2:6)[i], add = TRUE)
}
legend(x = "topright", legend = c("Forma = 2", "Forma = 3",
                                  "Forma = 5", "Forma = 10",
                                  "Forma = 15", "Forma = 20"), lwd = 2, col = 1:6)

A distribuição gama é uma distribuição de v.a. contínua que descreve o tempo necessário para se obter um número de occorencias de um evento, dado por:

\[f(x) = \begin{cases} \frac{\beta^\alpha (x)^{\alpha-1}e^{-\beta x}}{\Gamma(\alpha)} \end{cases}\]

Onde \(\alpha\) é o parâmetro que fornece a forma da distribuicão e \(\beta\) a escala, sendo ambos positivos e \(\Gamma(\alpha)\) é a função Gamma de Alpha.

Exemplo

A renda domiciliar de uma certa localidade é de R$ 1000,00 com distribuição Gama e desvio padrão de R$ 200,00. A) Quais os parâmetros \(\alpha\) e \(\beta\) desta densidade? B) Qual a probabilidade da renda no local exceder os R$ 2000,00?

Se X tem distribuição Gama com parâmetros \(\alpha\) e \(\beta\) a média de X é dada por \(\frac{\alpha}{\beta}\) e a variância por \(\frac{\alpha}{\beta^2}\) e portanto,

\[\mu = \frac{\alpha}{\beta}\to 1000 = \alpha = 1000 * \beta \\ \alpha^2 = \frac{a}{\beta^2}\to 200^2 = \frac{1000\beta}{\beta^2}\] \[\beta = \frac{1000}{200^2} = \beta = 0.025\] \[\alpha = 1000 * 0.25 = 25\]

  1. \(P(X > 2000) = 1 - P(X \leq 2000)\)

\[p=1-\int_{-\infty}^{2000}\frac{\beta^\alpha (x)^{\alpha-1}e^{-\beta x}}{\Gamma(\alpha)}dx\] \[p=1-\left[ \int_{-\infty}^{0}\frac{\beta^\alpha (x)^{\alpha-1}e^{-\beta x}}{\Gamma(\alpha)}dx+\int_{0}^{2000}\frac{\beta^\alpha (x)^{\alpha-1}e^{-\beta x}}{\Gamma(\alpha)}dx \right]\] \[p=1-\left[ 0+\int_{0}^{2000}\frac{0.025^{25} (x)^{25-1}e^{-0.025 x}}{(\alpha-1)!}dx \right]\] \[p=1-\left[\int_{0}^{2000}\frac{0.025^{25} (x)^{25-1}e^{-0.025 x}}{(25-1)!}dx \right]\] \[p=1-\left[\frac{0.025^{25}}{24!} \int_{0}^{2000} (x)^{24}e^{0.025x} dx \right]\] \[p = 1-0.7456 = 25.44\%\]