Principais Funções de Probabilidade
Distribuição Multinomial
- Número máximo de ocorrências finito
- Probabilidades independentes para cada evento
- Múltiplas categorias
\[
p = \frac{n!}{n_1!n_2!...n_k!}p_1^{n_{1}}p_2^{n_2}...{p_k^{n_k}}
\] Onde k é o número de categorias observadas, n é o tamanho da amostra colhida, cada \(n_i\) é o tamanho da subamostra desejada e \(p_i\) é a sua probabilidade. Observe-se que:
\[
\sum(n_i)=n
\] e que \[
\sum(p_i)=1
\] e de forma geral:
\[
p=\frac{\sum(n_i)!}{\pi(n_i!)}\pi(p_i^{n_i})
\]
Distribuição Binomial
- Número máximo de ocorrências finito
- Probabilidades independentes para cada evento
- Duas categorias
Fórmula da probabilidade binomial \[p=\binom{n}{x}p^x(1-p)^{n-x}
\]
Este é um caso especial da probabilidade multinomial, onde só há duas categorias, onde n é o tamanho da amostra, x é o número de ocorrências favoráveis, p é a probabilidade favorável e 1-p é a probabilidade desfavorável. No R,
\(dbinom(x, size, prob)\) # distribuição pontual
\(pbinom(q, size, prob)\) # distribuição acumulada à esquerda
\(qbinom(p, size, prob)\) # quantil da probabilidade p
\(rbinom(n, size, prob)\) # gerar n números aleatórios
Distribuição de Poisson
- Número máximo de ocorrências infinito
- Taxa uniforme de ocorrência de eventos
Fórmula da Probabilidade de Poisson
\[P(x)= \dfrac{\lambda^x\,e^{-\lambda}}{x!}\]
No R temos:
\(dpois(x, lambda)\) # distribuição pontual
\(ppois(q, lambda)\) # distribuição acumulada à esquerda
\(qpois(p, lambda)\) # quantil da probabilidade p
\(rpois(n, lambda)\) # gerar n números aleatórios
Distribuição Hipergeométrica
- Número máximo de ocorrências finito
- Probabilidades dependentes para cada evento
- Múltiplas categorias
Fórmula da probabilidade hipergeométrica:
\[
p =\dfrac{\binom{n1}{x1}\binom{n2}{x2}...\binom{n_k}{x_k}}{\binom{n_1+n_2+...+n_k}{x_1+x_2+...+x_k}}
\]
Onde cada \(n_i\) é o tamanho da subamostra desejada e cada \(x_i\) é o número de ocorrências desejado para cada subamostra. De forma geral, temos:
\[
p=\dfrac{\pi\binom{n_i}{x_i}}{\binom{\sum n_i}{\sum x_i}}
\] No R, Para as duas categorias temos:
\(dhyper(x1, n1, n2, x1+x2)\) # distribuição pontual
\(phyper(x1, n1, n2, x1+x2)\) # distribuição acumulada à esquerda
\(qhyper(p1, n1, n2, x1+x2)\) # quantil da probabilidade p
\(rhyper(N, n1, n2, x1+x2)\) # gerar N números aleatórios
Distribuição Binomial
As caracterÃsticas para se usar esta distribuição são:
- Eventos enumeráveis
- Enumeráveis
- Os eventos são realmente independentes
\[
P(x)=\binom{n}{x}*p^n*(1-p)^{n-x}
\]
ou então pela fórmula do R:
\(sum(choose(N,n)*p^n*(1-p)^{N-n})\)
ou na forma reduzida
\(dbinom(x=x, size=n, prob=p)\)
Exemplos
Um grupo de 50 manifestantes de um mesmo grupo polÃtico e contrários a uma proposta participa de uma assembleia onde estão presentes, no total, 300 pessoas, das quais 60% são favoráveis à mesma proposta. Se for formada uma comissão de 10 pessoas, qual a probabilidade de, dentre as 10, existirem 5 favoráveis à proposta e apenas um membro do grupo polÃtico destacado anteriormente?
# membros do grupo
n1=50
# total de favoráveis
n2=180
# total de contrários
n3=120
# total de contrários fora do grupo
n4=n3-n1
choose(n1,1)*choose(n2,5)*choose(n4,4)/choose(300,10)
Qual a probabilidade, em um lançamento de 10 moedas honestas, de se obter 4 ou menos caras?
n = 10
x = 0:4
p = 0.5
sum(choose(n, x)*p^x*(1-p)^(n-x))
ou utilizando a fórmula
sum(dbinom(x = x, size = n, prob = p))
Distribuição Hipergeométrica
As caracterÃsticas de seu uso são:
- Eventos enumeráveis
- Probabilidades não são constantes
\[ p(x) = \dfrac{\displaystyle\binom{a}{x}\binom{b}{k-x}}{\displaystyle\binom{a+b}{k}} \]
ou então pela fórmula do R:
\(p(x)=choose(a,x)*choose(b,k-x)/choose(a+b,k)\)
ou na forma reduzida \(p = sum(dhyper(x, m, n, k))\)
Um funcionario da expedição deveria remeter 6 de 15 pacotes por via expressa para a Europa, mas ele acaba misturando todos e aleatoriamente manda 6 dos pacotes por via expressa para a Europa. Qual a probabilidade de que apenas 3 dos pacotes que deveriam ir por via sigam realmente por via expressa?
a=6
x=3
b=9
k=6
choose(a,x)*choose(b,k-x)/choose(a+b,k)
Num grupo de 5 engenheiros e 4 arquitetos, qual a prob de serem escolhidos aleatoriamente 4 individuos que sejam 2 engenheiros e 2 arquitetos?
a=5
b=4
x=2
k=4
choose(5,2)*choose(4,2)/choose(9,4)
Num grupo de 10 engenheiros, 6 arquitetos, 3 advogados, 5 administradores, qual a probabilidade de ter um grupo de 1 de cada?
choose(10,1)*choose(6,1)*choose(3,1)*choose(5,1)/choose(24,4)
Examina-se um lote de 100 frascos de perfume, dos quais 50 sao falsificados e os restantes são originais. Qual a probabilidade de um inspetor escolher uma amostra de 10 frascos e encontrar 2 ou menos falsificados?
\[
p = \dfrac{\displaystyle\binom{50}{0}\binom{50}{10}}{\displaystyle\binom{100}{10}} + \dfrac{\displaystyle\binom{50}{1}\binom{50}{9}}{\displaystyle\binom{100}{10}} + \dfrac{\displaystyle\binom{50}{2}\binom{50}{8}}{\displaystyle\binom{100}{10}}
\] logo
fHyperGeom2 = function(x, i, y, j, dec = 4) {
round(choose(x,i)*choose(y, j)/choose(x+y, i+j),dec)
}
fHyperGeom2ToLaTeX = function(x, i, y, j, z, k, dec = 4) {
res = paste0(
"\\ensuremath{",
"\\dhipergeom{", x, "}{", i, "}{", y, "}{", j, "}{", x+ y, "}{", i + j, "}" ,
"}"
)
val = fHyperGeom2(x, i, y, j, dec)
return(list(code = res, val = val))
}
N = 100
def = 50
ok = N-def
n = 10
x = 2
l = fHyperGeom2ToLaTeX(def, 0:x, N-def, n-0:x) # Ver o pacote que contem a função fHyperGeom2ToLaTeX
p = sum(l$val)
p
Distribuição de Poisson
As caracterÃsticas para se usar esta distribuição ocorre quando o \(\lambda\) é uma taxa de chegada ou de ocorrência - ou quando o n é grande e a probabilidade é pequena, ou seja, n>=100 e p<10.
\[P(x)= \dfrac{\lambda^x\,e^{-\lambda}}{x!}\] ou então pelas fórmulas reduzidas do R:
\(dpois(x,\lambda)\)
\(\lambda^x*e^{-\lambda}/factorial(x)\)
Exemplos
Um posto de correio atende, normalmente, 3 clientes no perÃodo de 11 Ã s 13h. Qual a probabilidade desse posto
a) Não receber cliente algum das 11 às 12h?
taxa = 3/2 #clientes por hora
p = ppois(q=0, lambda=taxa)
p
b) Receber mais que 5 clientes das 11 Ã s 13h?
taxa = 3 #clientes em um perÃodo de duas horas
#probabilidade de 5 ou menos
p = ppois(q=5, lambda=taxa)
1-p
Um posto de observacao registra a passagem de 10 veiculos em media por hora. Qual a prob de em uma hora nao passar veiculo algum?
10^0*exp(-10)/factorial(0)
dpois(0,10/1)
ppois(0, 10/1)
Numa instalação, queimam 2.000 lâmpadas por ano. Qual a probabilidade de queimarem mais de 20 lâmpadas em uma dada semana?
taxa = 2000/365*7 # queimas por semana
1 - ppois(20, taxa)
Numa instalação, queimam 2.000 lâmpadas por ano. Qual a probabilidade de queimarem mais de 50 lâmpadas em uma dada semana?
taxa = 2000/365*7
1 - ppois(50, taxa)
Uma secretária comete 1 erro a cada 50 páginas. Qual a probabilidade de pegar um documento de 200 páginas gerado por essa secretária e ele não conter erros?
q=0
size=200
prob=1/50
pbinom(q, size, prob)
ou pela aproximação de Poissoon
q=0
lambda=1/50*200
ppois(q,lambda)
Uma máquina falha tipicamente três vezes por ano. Qual a probabilidade dela falhar mais que uma vez em um determinado mês?
p = ppois(1, 3/12) # falhar uma vez ou menos no mês
1 - p # falhar mais que uma vez no mês
Em uma oficina mecânica, tipicamente chegam 12 carros em um dia de 8 horas de serviço. Qual a probabilidade de chegarem mais de 2 carros em uma determinada hora?
1 - ppois(2, lambda = 12/8)
Caminhões chegam a um posto de pedágio com uma taxa de chegadas de 18 veÃculos por hora. Qual a probabilidade de chegarem 10 ou mais caminhões em um intervalo de tempo de 30 minutos?
lambda=18 #veiculos por hora
janela=30/60
nchegadas=10
lambda=lambda*janela
p=round(ppois(nchegadas-1,lambda=lambda),4)
p=1-p
p
Distribuição Multinomial
As caracterÃsticas para se usar esta distribuição é quando há mais de dois resultados possÃveis em cada prova, as probabilidades dos vários resultados permanecem as mesmas para cada prova, e as provas são todas independentes.
\[
p = \dfrac{n!}{x_1!x_2!x_3!x_4!}\,p_1^{x_1}\,p_2^{x_2}\,p_3^{x_3}\,p_4^{x_4}
\]
ou pela fórmula do R:
\(p = factorial(n)/(factorial(x1)*factorial(x2)*factorial(x3)*factorial(x4))*p1^x1*p2^x2*p3^x3* p4^x4\)
Exemplos
Uma rede de TV aberta de Curitiba tem 30% da audiência nas noites de sexta-feira, um canal local tem 20%, a TV a cabo tem 40%, e 10% assistem videocassetes. Qual a probabilidade de que entre 7 espectadores de televisão selecionados aleatoriamente naquela cidade numa noite de sexta-feira, 3 estejam assistindo à TV aberta, 1 esteja assistindo ao canal local, 2 estejam vendo TV a cabo e 1 esteja assistindo videocassetes?
n=7
x1=3
x2=1
x3=2
x4=1
p1=0.3
p2=0.2
p3=0.4
p4=0.1
p = factorial(n)/(factorial(x1)*factorial(x2)*factorial(x3)*factorial(x4))*p1^x1*p2^x2*p3^x3* p4^x4
p
Meu historico de passeios é bastante consistente, resume-se a sair para jantar e para ir ao cinema. Analisando esse histórico, constatei que tenho uma probabilidade de 0.9 de jantar, de 0.5 de ir ao cinema e 0.4 de fazer as duas coisas na mesma noite. Considerando um universo de 10 saÃdas, qual a probabilidade de eu ter todas as vezes jantado e em 5 delas eu tambem ter ido ao cinema?
pA = 0.9
pB = 0.5
pab = 0.4
pa = pA - pab
pb = pB - pab
na = 5
nb = 0
nab = 5
p = factorial(na+nb+nab)/(factorial(na)*factorial(nb)*factorial(nab))*pa^na*pb^nb*pab^nab
p = round(p, 4)
p
Um destino turÃstico possui 4 restaurantes — A, B, C, D — cujas possibilidades de escolha por parte dos visitantes são, respectivamente, p1 = 0.3, p2 = 0.2, p3 = 0.4, p4 = 0.1. Qual a probabilidade de, em um conjunto de 5 visitantes, n1 = 1, n2 = 1, n3 = 2, n4 = 1 visitantes escolherem os restaurantes A, B, C, D, respectivamente?
pmultinom = function(n, p) {
if(length(n)!=length(p)) stop("Vetores com comprimentos diferentes")
if(sum(p)!=1) stop("Probabilidades não somam 1")
factorial(sum(n))/prod(sapply(n, factorial))*prod(p^n)
}
pp = c(0.3, 0.2, 0.4, 0.1)
nn = c(1, 1, 2, 1)
p = pmultinom(nn, pp)
p = round(p, 4)
p
Se a probabilidade de um determinado dia em Curitiba ser ensolarado é de 22%, de estar chovendo é de 34% e de estar nublado é de 44%, qual a probabilidade de termos 1 dia de cada em um conjunto de 3 dias?
x = c(1, 1, 1)
p = c(0.22, 0.34, 0.44)
factorial(sum(x))/prod(factorial(x))*prod(p^x)
Uma amostragem apresentou os seguintes resultados.
a = [102 91 112 101 105 85 92 98 80 95]
Apos a padronização dos dados, com a operação $ ap = $
pode-se afirmar que:
a = c(102, 91, 112, 101, 105, 85, 92, 98, 80, 95)
ap = scale(a)
summary(ap)
Distribuição Normal
Uma caracterÃstica importante das distribuições normais, é que elas dependem apenas da média \((\mu)\) e do desvio padrão \((\sigma)\).
Exemplos
Imaginando que o chamado quociente de inteligência (QI) seja uma medida normalmente distribuÃda, possuindo média igual a 100 e desvio padrão igual a 15, determine:
a) A probabilidade de alguém possuir QI acima de 120.
m=100
sd=15
q=120
1-pnorm(q, m, sd)
b)O QI de uma pessoa que está acima de 99% da população.
q=qnorm(0.99,100,15)
plotareas(q,999,100,15)
c) A probabilidade de uma pessoa possuir QI acima de 90 ou abaixo de 70.
plotareas(c(90,-999), c(999,70),100,15)
pnorm(70,100,15) + (1 - pnorm(90,100,15))
d) A probabilidade de uma pessoa possuir QI entre 90 e 120 ou acima de 110.
plotareas(c(90, 110), c(120, 999), 100, 15, col = c(4, 2), density = 50, angle = c(45, -45))
O que, por meio de observação e cálculo direto, fornece
1-pnorm(90, 100, 15)
e) Uma variável x normalmente distribuÃda apresenta média igual a 20 e desvio-padrão igual a 3. Calcule o limite superior do intervalo de probabilidade que inicia em x = 15 e compreende 80% da probabilidade de ocorrência de valores para essa variável.
q = qnorm(0.8+pnorm(15, 20, 3), 20, 3)
q
verificando:
pnorm(q, 20, 3) - pnorm(15, 20, 3)
plotareas(15, q, 20, 3)
