PROBABILIDADE PARTE 1

Author

Barreira, R.

PROBABILIDADE PARTE 1: BINOMINAL E POISSON

Por Renato Barreira

renatobarreira@edu.unirio.br

Vamos explorar duas distribuições discretas muito importantes em estatística: a binomial e a Poisson. Ambas são utilizadas para modelar o número de ocorrências de um evento em um determinado conjunto de condições. Todos os códigos e exemplos no R serão providenciados abaixo.

Distribuição Binomial

A distribuição binomial é utilizada quando temos um experimento com um número fixo de tentativas independentes, cada uma com apenas dois resultados possíveis (sucesso ou fracasso), e a probabilidade de sucesso é constante em todas as tentativas.

Função DBINOM

Portanto, A distribuição binomial modela o número de sucessos em um conjunto de 𝑛 ensaios independentes, onde cada ensaio tem uma probabilidade 𝑝 p de sucesso. Calcula a probabilidade de x sucessos em n(size) tentativas, com probabilidade de sucesso da probilidade.

Por exemplo: Qual é a probabilidade de obter exatamente 3 sucessos em 10 lançamentos de uma moeda justa (onde 𝑝 =0.5)?

#dbinom(x, size, prob, log = FALSE)

dbinom(x = 3, size = 10, prob = 0.5)

[1] 0.1171875

Função PBINOM

Outra função é a de probabilidade acumulada binominal: Ou seja, a Calcula a probabilidade acumulada de até x(q) sucessos em n(size) tentativas.

Por exemplo: Qual é a probabilidade de obter 3 ou menos sucessos em 10 lançamentos de uma moeda justa?

#pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE)

pbinom(q = 3, size = 10, prob = 0.5)

[1] 0.171875

Função QBINOM

A função abaixo calcula o quantil associado a uma determinada probabilidade p, ou seja, o número de sucessos que corresponde a essa probabilidade acumulada. Calcula o quantil da distribuição binomial, ou seja, o menor valor de x tal que a probabilidade acumulada seja maior ou igual a p.

Por exemplo: Qual é o menor número de sucessos 𝑥 tal que a probabilidade acumulada é de pelo menos 80% em 10 lançamentos de uma moeda justa?

#qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE)
qbinom(p = 0.8, size = 10, prob = 0.5)

[1] 6

Função RBINOM

A função abaixo Gera números aleatórios de uma distribuição binomial. Este comando é útil para simulações.

Por exemplo: Gere uma amostra de 5 observações de uma binomial com 10 ensaios e probabilidade de sucesso 𝑝 = 0.5.

#rbinom(n, size, prob)
rbinom(n = 5, size = 10, prob = 0.5)

[1] 4 4 4 9 5

Distribuição Poisson

A distribuição de Poisson modela o número de eventos que ocorrem em um intervalo de tempo fixo, dado que os eventos ocorrem com uma taxa média 𝜆. Ou seja, a distribuição de Poisson é utilizada para modelar o número de ocorrências de um evento em um intervalo de tempo ou espaço, quando as ocorrências são independentes e a taxa média de ocorrências é constante.

Função DPOIS

A primeira função calcula a probabilidade para uma variável de Poisson, ou seja, a probabilidade de observar exatamente 𝑥 eventos, dado que a taxa média de eventos é 𝜆.

Por exemplo: Qual é a probabilidade de observar exatamente 4 eventos em um intervalo, dado que a taxa média é de 2 eventos por intervalo?

#dpois(x, lambda, log = FALSE)
dpois(x = 4, lambda = 2)

[1] 0.09022352

Função PPOIS

A próxima função calcula a distribuição acumulada para uma variável de Poisson. Ou seja, a probabilidade de observar até 𝑞 eventos em um intervalo (lambda).

Por exemplo: Qual é a probabilidade de observar 3 ou menos eventos, dado que a taxa média é 2 eventos por intervalo?

#ppois(q, lambda, lower.tail = TRUE, log.p = FALSE)

ppois(q = 3, lambda = 2)

[1] 0.8571235

Função QPOIS

Assim como na binominal, a próxima função Calcula o quantil associado a uma determinada probabilidade 𝑝, ou seja, o número de eventos correspondente a essa probabilidade acumulada.

Por exemplo: Qual é o menor número de eventos tal que a probabilidade acumulada é de pelo menos 80%, dado 𝜆 = 2?

#qpois(p, lambda, lower.tail = TRUE, log.p = FALSE)
qpois(p = 0.8, lambda = 2)

[1] 3

Função RPOIS

Por último, para gerar números aleatórios de uma distribuição de Poisson, use a função abaixo:

Por exemplo: Gere uma amostra de 5 observações de uma variável de Poisson com taxa média 𝜆 =2.

#rpois(n, lambda)

rpois(n = 5, lambda = 2)

[1] 2 1 2 1 2

SERÁ QUE VOCÊ APRENDEU MESMO?

Tente você, clique na pergunta para ver a resposta.

Probabilidade de obter 3 caras em 5 lançamentos de uma moeda honesta:

dbinom(3, 5, 0.5)

[1] 0.3125

Probabilidade de obter no máximo 2 caras em 5 lançamentos:

pbinom(2, 5, 0.5)

[1] 0.5

Qual o número mínimo de caras que precisamos obter em 10 lançamentos para que a probabilidade acumulada seja maior que 0.95?

qbinom(0.95, 10, 0.5)

[1] 8

Simular 1000 lançamentos de uma moeda viciada (probabilidade de cara = 0.7):

rbinom(1000, 1, 0.7)

   [1] 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 1 0 0 1 1 0 0 1 0 1 0 0 1 0 1 1 1 0 1 1 1 1
  [38] 1 1 0 0 1 0 0 1 0 1 1 1 1 1 1 0 0 1 1 0 1 0 1 1 1 0 1 1 1 0 0 1 0 1 1 1 1
  [75] 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0 1 0 1 1 1 1 1 0 1
 [112] 1 0 1 0 0 1 1 1 1 1 1 0 0 0 1 0 1 1 1 0 1 1 1 1 1 0 1 1 0 1 0 1 1 0 0 1 1
 [149] 0 0 1 1 1 1 1 1 0 1 1 0 1 0 1 0 0 1 1 1 0 0 1 0 1 0 1 0 1 1 0 0 1 1 0 0 1
 [186] 1 1 1 1 1 1 1 0 1 0 1 1 1 0 1 1 0 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 0 0 1 0 1
 [223] 1 1 0 0 0 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 0 0 1 1 1 0 1 1 1
 [260] 0 1 1 1 1 1 1 1 0 0 1 0 1 0 1 1 0 0 0 1 1 1 1 1 1 0 1 0 1 0 1 1 1 1 1 1 1
 [297] 1 0 1 1 0 1 1 0 1 0 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 1 1 0 1 1 0 1 1 1 1
 [334] 1 0 0 1 1 1 0 1 0 0 1 0 0 0 1 0 1 1 0 1 1 1 1 1 1 1 0 1 0 0 1 0 1 0 1 1 0
 [371] 1 0 0 1 1 1 0 1 1 1 1 1 0 0 1 1 0 1 1 1 0 1 0 1 1 1 0 0 1 1 1 0 0 1 1 0 1
 [408] 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 1 1 1 0 1 1 0 1 1 1 0 1 1 1 0 1 1 0 1 1 1 1
 [445] 0 0 0 1 1 0 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 0 0 1 1
 [482] 0 1 1 1 1 0 1 0 1 1 0 1 0 0 1 1 0 1 1 1 0 1 1 1 1 1 0 0 1 0 1 0 1 1 1 1 1
 [519] 1 1 0 1 1 1 1 0 1 1 1 1 1 0 1 0 1 1 1 1 0 0 0 1 1 0 1 1 1 0 1 1 1 1 1 1 1
 [556] 1 0 0 1 1 1 1 1 0 1 1 0 1 0 1 0 1 0 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0
 [593] 1 1 1 0 1 1 0 1 1 1 0 1 1 0 1 0 1 1 0 1 0 1 1 1 1 1 0 1 1 0 1 1 1 0 1 1 0
 [630] 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 0 1 1 1 0 1 1 1 0 1 1 0 1 0 1 0 1 1 1 1
 [667] 1 1 0 1 0 1 1 1 0 1 0 1 0 0 1 0 1 0 0 1 0 0 1 0 1 1 1 0 1 0 1 0 0 1 0 0 1
 [704] 1 1 1 1 1 0 0 1 0 0 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 1 1 0 0 1 1 1 0 1 0 1 1
 [741] 1 0 0 1 1 1 1 0 1 1 1 0 1 0 1 0 0 0 1 0 1 0 1 1 1 1 1 1 1 0 0 1 1 1 1 0 1
 [778] 1 1 1 1 1 1 1 1 0 1 1 0 0 1 0 1 0 1 1 0 0 1 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1
 [815] 1 0 1 1 1 1 1 1 1 0 0 1 0 0 1 0 1 0 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 0 0
 [852] 0 1 1 1 1 1 1 0 1 1 0 1 1 0 1 0 1 1 1 1 0 1 0 1 0 1 1 1 1 0 1 1 1 1 1 1 1
 [889] 0 1 0 0 0 0 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 1 0 0
 [926] 1 0 1 1 0 1 1 0 1 1 1 0 1 0 0 0 1 0 0 1 0 1 0 1 0 1 1 1 1 1 0 1 1 1 0 1 0
 [963] 1 1 1 0 0 1 0 1 0 1 1 0 0 1 1 1 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 0 0 1
[1000] 1

Probabilidade de ocorrerem exatamente 2 chamadas em uma central de atendimento em 1 minuto, sabendo que a taxa média é de 3 chamadas por minuto:

dpois(2, 3)

[1] 0.2240418

Qual o número mínimo de chamadas que precisamos observar em 1 hora para que a probabilidade acumulada seja maior que 0.99, sabendo que a taxa média é de 180 chamadas por hora?

qpois(0.99, 180)

[1] 212

Simular o número de clientes que chegam em uma loja em 10 dias, sabendo que a taxa média é de 50 clientes por dia:

rpois(10, 50)

 [1] 45 36 56 52 55 42 44 38 69 50

REPRESENTANDO GRAFICAMENTE:

Assim como todas as variáveis numéricas, é possível representar aas probabilidades de diversas maneiras. Segue abaixo dois exemplos básicos:

#onde x é o número de sucessos e  y é a probabilidade de dado número de sucessos respectivamente.
x <- 0:10
probs <- dbinom(x, 10, 0.5)
plot(x, probs, type = "o", xlab = "Número de sucessos", ylab = "Probabilidade")

#Probabiliade do número de ocorrencias em um determinado espaço-tempo (lambda = 5).
x <- 0:20
probs <- dpois(x, 5)
plot(x, probs, type = "o", xlab = "Número de ocorrências", ylab = "Probabilidade")

QUALQUER DÚVIDA SÓ DEIXAR UM COMENTÁRIO AQUI NO RPUBS MESMO.