\[ p = \frac{n!}{n_1!n_2!...n_k!}p_1^{n_{1}}p_2^{n_2}...{p_k^{n_k}} \] Onde k é o número de categorias observadas, n é o tamanho da amostra colhida, cada \(n_i\) é o tamanho da subamostra desejada e \(p_i\) é a sua probabilidade. Observe-se que:
\[ \sum(n_i)=n \] e que \[ \sum(p_i)=1 \] e de forma geral:
\[ p=\frac{\sum(n_i)!}{\pi(n_i!)}\pi(p_i^{n_i}) \]
Fórmula da probabilidade binomial \[ p=\binom{n}{x}p^x(1-p)^{n-x} \]
Este é um caso especial da probabilidade multinomial, onde só há duas categorias, onde n é o tamanho da amostra, x é o número de ocorrências favoráveis, p é a probabilidade favorável e 1-p é a probabilidade desfavorável. No R,
\(dbinom(x, size, prob)\) # distribuição pontual
\(pbinom(q, size, prob)\) # distribuição acumulada à esquerda
\(qbinom(p, size, prob)\) # quantil da probabilidade p
\(rbinom(n, size, prob)\) # gerar n números aleatórios
Fórmula da Probabilidade de Poisson
\[P(x)= \dfrac{\lambda^x\,e^{-\lambda}}{x!}\]
No R temos:
\(dpois(x, lambda)\) # distribuição pontual
\(ppois(q, lambda)\) # distribuição acumulada à esquerda
\(qpois(p, lambda)\) # quantil da probabilidade p
\(rpois(n, lambda)\) # gerar n números aleatórios
Fórmula da probabilidade hipergeométrica:
\[ p =\dfrac{\binom{n1}{x1}\binom{n2}{x2}...\binom{n_k}{x_k}}{\binom{n_1+n_2+...+n_k}{x_1+x_2+...+x_k}} \]
Onde cada \(n_i\) é o tamanho da subamostra desejada e cada \(x_i\) é o número de ocorrências desejado para cada subamostra. De forma geral, temos:
\[ p=\dfrac{\pi\binom{n_i}{x_i}}{\binom{\sum n_i}{\sum x_i}} \] No R, Para as duas categorias temos:
\(dhyper(x1, n1, n2, x1+x2)\) # distribuição pontual
\(phyper(x1, n1, n2, x1+x2)\) # distribuição acumulada à esquerda
\(qhyper(p1, n1, n2, x1+x2)\) # quantil da probabilidade p
\(rhyper(N, n1, n2, x1+x2)\) # gerar N números aleatórios
As características para se usar esta distribuição são:
\[ P(x)=\binom{n}{x}*p^n*(1-p)^{n-x} \]
ou então pela fórmula do R:
\(sum(choose(N,n)*p^n*(1-p)^{N-n})\)
ou na forma reduzida
\(dbinom(x=x, size=n, prob=p)\)
N=10
s=7:10
p=0.5
sum(choose(10, s)*0.5^s*0.5^(10-s))
## [1] 0.171875
# membros do grupo
n1=50
# total de favoráveis
n2=180
# total de contrários
n3=120
# total de contrários fora do grupo
n4=n3-n1
choose(n1,1)*choose(n2,5)*choose(n4,4)/choose(300,10)
## [1] 0.04881274
n=10
p=0.5
x=7:10
sum(dbinom(x, n, p))
## [1] 0.171875
n = 10
x = 0:4
p = 0.5
sum(choose(n, x)*p^x*(1-p)^(n-x))
## [1] 0.3769531
ou utilizando a fórmula
sum(dbinom(x = x, size = n, prob = p))
## [1] 0.3769531
p = 1/5
n = 9
x = 7
1 - pbinom(6, 9, 1/5)
## [1] 0.000313856
As características de seu uso são:
\[ p(x) = \dfrac{\displaystyle\binom{a}{x}\binom{b}{k-x}}{\displaystyle\binom{a+b}{k}} \]
ou então pela fórmula do R:
\(p(x)=choose(a,x)*choose(b,k-x)/choose(a+b,k)\)
ou na forma reduzida \(p = sum(dhyper(x, m, n, k))\)
a=6
x=3
b=9
k=6
choose(a,x)*choose(b,k-x)/choose(a+b,k)
## [1] 0.3356643
a=5
b=4
x=2
k=4
choose(5,2)*choose(4,2)/choose(9,4)
## [1] 0.4761905
choose(10,1)*choose(6,1)*choose(3,1)*choose(5,1)/choose(24,4)
## [1] 0.08469791
N = 1000
def = 22
ok = N-def
n = 120
x = 3
p = sum(dhyper(x = n-0:x, m = ok, n = def, k = n))
p
## [1] 0.7340565
n = 120
x = 4
perc = 0.015
p=pbinom(q=x-1, size=n, prob=perc) # explicação: P(4 ou mais) = 1 - p(3 ou menos) = 1 - pbinom(3, 120, 0.015)
p=round(1-p,4)
p
## [1] 0.1072
\[ p = \dfrac{\displaystyle\binom{50}{0}\binom{50}{10}}{\displaystyle\binom{100}{10}} + \dfrac{\displaystyle\binom{50}{1}\binom{50}{9}}{\displaystyle\binom{100}{10}} + \dfrac{\displaystyle\binom{50}{2}\binom{50}{8}}{\displaystyle\binom{100}{10}} \] logo
fHyperGeom2 = function(x, i, y, j, dec = 4) {
round(choose(x,i)*choose(y, j)/choose(x+y, i+j),dec)
}
fHyperGeom2ToLaTeX = function(x, i, y, j, z, k, dec = 4) {
res = paste0(
"\\ensuremath{",
"\\dhipergeom{", x, "}{", i, "}{", y, "}{", j, "}{", x+ y, "}{", i + j, "}" ,
"}"
)
val = fHyperGeom2(x, i, y, j, dec)
return(list(code = res, val = val))
}
N = 100
def = 50
ok = N-def
n = 10
x = 2
l = fHyperGeom2ToLaTeX(def, 0:x, N-def, n-0:x) # Ver o pacote que contem a função fHyperGeom2ToLaTeX
p = sum(l$val)
p
## [1] 0.0458
As características para se usar esta distribuição ocorre quando o \(\lambda\) é uma taxa de chegada ou de ocorrência - ou quando o n é grande e a probabilidade é pequena, ou seja, n>=100 e p<10.
\[P(x)= \dfrac{\lambda^x\,e^{-\lambda}}{x!}\] ou então pelas fórmulas reduzidas do R:
\(dpois(x,\lambda)\)
\(\lambda^x*e^{-\lambda}/factorial(x)\)
taxa = 3/2 #clientes por hora
p = ppois(q=0, lambda=taxa)
p
## [1] 0.2231302
taxa = 3 #clientes em um período de duas horas
#probabilidade de 5 ou menos
p = ppois(q=5, lambda=taxa)
1-p
## [1] 0.08391794
10^0*exp(-10)/factorial(0)
## [1] 4.539993e-05
dpois(0,10/1)
## [1] 4.539993e-05
ppois(0, 10/1)
## [1] 4.539993e-05
taxa = 2000/365*7 # queimas por semana
1 - ppois(20, taxa)
## [1] 0.9991455
taxa = 2000/365*7
1 - ppois(50, taxa)
## [1] 0.02906437
tempo = 27/60 #em minutos
janela = 3
nchegadas = 4
lambda = 1/tempo * janela
p = round(ppois(nchegadas-1,lambda),4)
p
## [1] 0.1009
tempo = 2000/24 #em dias
janela = 180 #em dias
nfalhas = 3
lambda = 1/tempo*janela
p = round(ppois(nfalhas-1,lambda),4)
p=1-p
p
## [1] 0.3665
1-pbinom(50, 250, 0.2)
## [1] 0.4622493
ou então
1-ppois(50, 50)
## [1] 0.4624833
p=0.1
n=10
x=1
pbinom(q = x, size = n, prob = p)
## [1] 0.7360989
q=0
size=200
prob=1/50
pbinom(q, size, prob)
## [1] 0.01758795
ou pela aproximação de Poissoon
q=0
lambda=1/50*200
ppois(q,lambda)
## [1] 0.01831564
tempo = 27 # em segundos
janela = 3 # em minutos
nchegadas = 4
tempo = 27/60
lambda = 1/tempo*janela
p = round(ppois(q = (nchegadas-1), lambda = lambda), 4)
p
## [1] 0.1009
p = ppois(1, 3/12) # falhar uma vez ou menos no mês
1 - p # falhar mais que uma vez no mês
## [1] 0.02649902
1 - ppois(2, lambda = 12/8)
## [1] 0.1911532
lambda=18 #veiculos por hora
janela=30/60
nchegadas=10
lambda=lambda*janela
p=round(ppois(nchegadas-1,lambda=lambda),4)
p=1-p
p
## [1] 0.4126
n = 400
percfalha = 0.0015
nfalhas = 2
p = round(dbinom(x = nfalhas-1, size = n, prob = percfalha), 4)
p = 1-p
p
## [1] 0.6704
As características para se usar esta distribuição é quando há mais de dois resultados possíveis em cada prova, as probabilidades dos vários resultados permanecem as mesmas para cada prova, e as provas são todas independentes.
\[ p = \dfrac{n!}{x_1!x_2!x_3!x_4!}\,p_1^{x_1}\,p_2^{x_2}\,p_3^{x_3}\,p_4^{x_4} \]
ou pela fórmula do R:
\(p = factorial(n)/(factorial(x1)*factorial(x2)*factorial(x3)*factorial(x4))*p1^x1*p2^x2*p3^x3* p4^x4\)
n=7
x1=3
x2=1
x3=2
x4=1
p1=0.3
p2=0.2
p3=0.4
p4=0.1
p = factorial(n)/(factorial(x1)*factorial(x2)*factorial(x3)*factorial(x4))*p1^x1*p2^x2*p3^x3* p4^x4
p
## [1] 0.036288
n=10
n1=5
n2=4
n3=1
p1=0.30
p2=0.20
p3=0.50
x1=1
x2=4
x3=5
p = factorial(10)/(factorial(n1)*factorial(n2)*factorial(n3))*p1^x1*p2^x2*p3^x3
p
## [1] 0.0189
pA = 0.9
pB = 0.5
pab = 0.4
pa = pA - pab
pb = pB - pab
na = 5
nb = 0
nab = 5
p = factorial(na+nb+nab)/(factorial(na)*factorial(nb)*factorial(nab))*pa^na*pb^nb*pab^nab
p = round(p, 4)
p
## [1] 0.0806
pmultinom = function(n, p) {
if(length(n)!=length(p)) stop("Vetores com comprimentos diferentes")
if(sum(p)!=1) stop("Probabilidades não somam 1")
factorial(sum(n))/prod(sapply(n, factorial))*prod(p^n)
}
pp = c(0.3, 0.2, 0.4, 0.1)
nn = c(1, 1, 2, 1)
p = pmultinom(nn, pp)
p = round(p, 4)
p
## [1] 0.0576
Sabendo-se que, se x1 ~ N(µ1,σ1) e x2 ~ N(µ2,σ2), então x3 ~ N(µ1 + µ2), (σ12+σ22)^1/2. Assim:
mu1 = 10
sigma1 = 2
mu2 = 20
sigma2 = 3
mu3 = mu1 + mu2
sigma3 = sqrt(sigma1^2+sigma2^2)
c(mu3, sigma3)
## [1] 30.000000 3.605551
xbarra = 100
desvpad = 20
xmin = 65
xmax = 95
p = 1-pnorm(xmax,xbarra,desvpad)+pnorm(xmin,xbarra,desvpad)
p = round(p, 4)
p
## [1] 0.6388
x = c(1, 1, 1)
p = c(0.22, 0.34, 0.44)
factorial(sum(x))/prod(factorial(x))*prod(p^x)
## [1] 0.197472
Apos a padronização dos dados, com a operação $ ap = {} $
pode-se afirmar que:
a = c(102, 91, 112, 101, 105, 85, 92, 98, 80, 95)
ap = scale(a)
summary(ap)
## V1
## Min. :-1.68578
## 1st Qu.:-0.50783
## Median : 0.04188
## Mean : 0.00000
## 3rd Qu.: 0.59160
## Max. : 1.66484
\(p = pnorm(xmax,xbarra,desvpad)-pnorm(xmin,xbarra,desvpad)\)
xbarra = 10
desvpad = 2
xmin = 6
xmax = 8
p = pnorm(xmax,xbarra,desvpad)-pnorm(xmin,xbarra,desvpad)
p
## [1] 0.1359051
xbarra = 15
desvpad = 2.7
q = round(qnorm(0:4/4, xbarra, desvpad),4)
names(q) = paste("q",0:4, sep = "")
q
## q0 q1 q2 q3 q4
## -Inf 13.1789 15.0000 16.8211 Inf
q[4]-q[2]
## q3
## 3.6422
Uma característica importante das distribuições normais, é que elas dependem apenas da média \((\mu)\) e do desvio padrão \((\sigma)\).
meuhist = function(x, title = NA) {
hist(x, freq = FALSE, main = title)
amp = max(x)-min(x)
m = mean(x)
s = sd(x)
xx = (0:200)/200*amp+min(x)
yy = dnorm(xx, m, s)
lines(xx, yy, type = "l", col = 4, lwd = 2)
}
plotnorm = function(media, dp) {
x = (-300:300)/100*dp+media
y = dnorm(x, media, dp)
plot(x, y, type = "l")
lines(c(min(x), max(x)), c(0, 0))
abline(v=media, lty = 2, col = "darkgrey")
}
plotarea = function(x1, x2, media, dp, col="lightblue", density=40, angle=45) {
x1 = max(x1, media-3*dp)
x2 = min(x2, media+3*dp)
x = seq(x1, x2, (x2-x1)/100)
y = c(0, dnorm(x, media, dp), 0)
x = c(x1, seq(x1, x2, (x2-x1)/100), x2)
polygon(x, y, col=col, density = density, fillOddEven = TRUE, border = "black", xpd = NA, angle = angle)
#curve(dnorm(x, media, dp), add = TRUE)
}
plotareas = function(x1, x2, media, dp, col=c("lightblue"), density=c(40), angle=c(45)) {
plotnorm(media, dp)
for (i in 1:length(x1)) {
ii = i - 1
plotarea(x1[i], x2[i], media, dp, col[(ii %% length(col)) + 1],
density[(ii %% length(density)) + 1],
angle[(ii %% length(angle)) + 1]
)
}
}
plotareas(x1 = 150, x2 = 200, media = 180, dp = 22, density = 80)
pnorm(200, 180, 22)-pnorm(150, 180, 22)
## [1] 0.7320079
m=100
sd=15
q=120
1-pnorm(q, m, sd)
## [1] 0.09121122
q=qnorm(0.99,100,15)
plotareas(q,999,100,15)
plotareas(c(90,-999), c(999,70),100,15)
pnorm(70,100,15) + (1 - pnorm(90,100,15))
## [1] 0.7702576
plotareas(c(90, 110), c(120, 999), 100, 15, col = c(4, 2), density = 50, angle = c(45, -45))
O que, por meio de observação e cálculo direto, fornece
1-pnorm(90, 100, 15)
## [1] 0.7475075
q = qnorm(0.8+pnorm(15, 20, 3), 20, 3)
q
## [1] 23.08101
verificando:
pnorm(q, 20, 3) - pnorm(15, 20, 3)
## [1] 0.8
plotareas(15, q, 20, 3)
pnorm(3, 10, 2)
## [1] 0.0002326291
1-pnorm(8, 10, 2)
## [1] 0.8413447
pnorm(11, 10, 2)-pnorm(9, 10, 2)
## [1] 0.3829249
pnorm(12, 10, 2)-pnorm(10, 10, 2)
## [1] 0.3413447
s=2
m=8
p=5
q=pnorm(p,m,s)
q
## [1] 0.0668072
Portanto, como o valor da probabilidade é 0.0668 (6,68%) que é a área hachurada, o restante da área obtem-se subtraindo 6,668 de 50 que resulta em uma probabilidade de 43.32
plotareas(5,q,8,2)
q=pnorm(10,m,s)
q
## [1] 0.8413447
plotareas(10,q,8,2)
Portanto, conforme a figura, o valor hachurado equivale a 0.84134 ou 84,13%. Logo subtraindo este valor de 100, teremos a probabilidade de 15.87 referente a área não hachurada que é a solução do problema.
q=pnorm(9,8,2)-pnorm(7,8,2)
q
## [1] 0.3829249
x1 = 7
x2 = 9
m = 8
s = 2
plotareas(x1,x2,m,2)
A área hachurada do gráfico equivale a 38,29%