Teoria e Aplicações Práticas sobre Arranjos, Permutações, Análise Combinatória e Probabilidade
Neste relatório será tratado tanto o conceito quanto a prática referente aos Capítulos 05, 06 e 07 do livro do Freund. Como o conteúdo é bastante denso, provavelmente o relatório será um pouco mais extenso do que o de praxe.
Combinação e Permutação
A probabilidade estuda os experimentos aleatórios, ou seja, trata-se de eventos que têm um resultado imprevisível. Como exemplos práticos desses eventos imprevisíveis, é possível citar o cara e coroa com uma moeda, o lançamento de dados com faces numéricas e o sorteio de bolas em uma urna durante o jogo de bingo.
O espaço amostral define o conjunto de todos os possíveis resultados desse experimento específico. Por isso, é essencial saber qual é o experimento que será feito e a quantidade para determinar o espaço amostral. Dentro do espaço amostral, é possível analisar a quantidade de eventos que podem acontecer. A probabilidade é um tema bastante interligado à análise combinatória.
Permutação com Repetição
O número de permutações com repetição (ou com substituição) é calculado simplesmente por \(n^r\), onde n é o número de coisas para escolher, r número de vezes.
Por exemplo, você tem uma urna com uma bola vermelha, azul e preta. Se escolher duas bolas com substituição / repetição, existem \(3 ^ 2\) permutações: {vermelho, vermelho}, {vermelho, azul}, {vermelho, preto}, {azul, vermelho}, {azul, azul}, {azul, preto}, {preto, vermelho}, {preto, azul} e {preto, preto}. Em R temos:
Permutação Simples - Sem repetição
Qualquer sequência formada a partir de todos os elementos de um conjunto com n elementos é chamada permutação simples. O total de permutações simples de um conjunto com essa quantidade de elementos é dado por: \(Pn = n!\)
Calcular as permutações sem repetição / substituição significa apenas que, para casos em que r> 1, n fica menor após cada escolha. Por exemplo, se escolhermos duas bolas da urna com a bola vermelha, azul e preta, mas sem repetição / substituição, a primeira escolha tem 3 opções e a segunda escolha tem 2 opções: {vermelho, azul}, {vermelho, preto} , {azul, vermelho}, {azul, preto}, {preto, vermelho} e {preto, azul}. Em R temos:
Comentário
Vamos usar um exemplo com mais opções, por exemplo, escolher bolas de bilhar. Se escolhermos 3 bolas sem substituição (de um total de 16), o número de permutações seria 3.360. Este cálculo é realizado pela fórmula
Fazendo isso no R temos:
Combinação sem repetição
Até agora você provavelmente já ouviu falar de células-tronco pluripotentes induzidas (iPSCs), que são um tipo de célula-tronco pluripotente derivada artificialmente de uma célula não pluripotente através da expressão forçada de quatro fatores de transcrição específicos (TFs). Esta descoberta foi feita por Yamanaka-sensei e sua equipe. Antes da descoberta, Yamanaka-sensei e sua equipe investigaram 24 FTs conhecidos por serem importantes no embrião inicial e testaram diferentes combinações desses FTs. Quantas combinações existem para um conjunto de 4 TFs?
Neste comentário trataremos de quantas combinações existem para um conjunto de 4 TFs(specific transcription factors).Como os TFs são usados uma vez, o número de combinações é sem repetição / substituição e a ordem não importa; todos os quatro TFs precisam ser adicionados.Calculando o número de permutações teremos:
Como apontado acima, muitas dessas permutações são a mesma combinação. Para cada 4 TFs existem \(4*3*2*1=24\) permutações que são a mesma combinação.Portanto, devemos reduzir o número de permutações, em 24, para chegar ao número de combinações, ou seja \(\frac{255024}{24}=10626\). No R teremos:
Formulário
Equações - Combinação
Equações - Arranjo
Equações - Permutação
Equações - Teorema de Bayes
\[ P(B|A) = \frac{P(B).P(A|B)}{P(A)}\]
Probabilidade
A probabilidade é um número que varia de 0 (zero) a 1 (um) e que mede a chance de ocorrência de um determinado resultado. Quanto mais próxima de zero for a probabilidade, menores são as chances de ocorrer o resultado e quanto mais próxima de um for a probabilidade, maiores são as chances.Em resumo, probabilidade é o estudo das chances de ocorrência de um resultado, que são obtidas pela razão entre casos favoráveis e casos possíveis.
Exemplo
Suponha que haja 12 questões de múltipla escolha em um questionário de inglês. Cada questão tem 5 respostas possíveis e apenas uma delas está correta. Encontre a probabilidade de ter 4 ou menos respostas corretas se um aluno tentar responder a cada pergunta aleatoriamente.
Solução: Como apenas uma das 5 respostas possíveis está correta, a probabilidade de responder corretamente a uma pergunta aleatória é \(1/5 = 0,2\). Podemos encontrar a probabilidade de ter exatamente 4 respostas corretas por tentativas aleatórias como segue.
Para encontrar a probabilidade de ter quatro ou menos respostas corretas por tentativas aleatórias, aplicamos a função dbinom com x = 0,…, 4.
Alternativamente, podemos usar a função de probabilidade cumulativa para o pbinom de distribuição binomial.
Resposta: The probability of four or less questions answered correctly by random in a twelve question multiple choice quiz is 92.7%.
Exemplo
A função R \(dbinom (x, size, prob)\) é a probabilidade de x sucessos em tentativas de tamanho quando a probabilidade de sucesso é prob. Esta função é a probabilidade cumulativa (lower.tail = TRUE para a cauda esquerda, lower.tail = FALSE para a cauda direita) menor ou igual a q sucessos. Função R rbinom (n, tamanho, prob) retorna n números aleatórios da distribuição binomial x ~ b (n, prob).
Qual a probabilidade de obter 2 caras no lançamento de 5 moedas honestas?
Ou utilizando a equação dbinom teremos:
Exemplo
Qual é a probabilidade de 2 caras em 10 lançamentos de moeda, onde a probabilidade de caras é de 0,3?
Exemplo
Qual é a probabilidade de <= 5 cabeças em 10 lançamentos de moeda, onde a probabilidade de cabeças é de 0,3?
Exemplo
Qual é o número esperado de caras em 25 moedas onde a probabilidade de cara é 0,3?
Exemplo
Suponha que X seja uma variável aleatória b (10, .6) e Y seja uma variável aleatória b (10, .7), e X e Y eles sejam independentes. Qual é a probabilidade de que qualquer variável seja <= 4?
Exemplo
Uma empresa farmacêutica afirma que um novo tratamento é bem sucedido na redução da febre em mais de 60% dos casos. O tratamento foi tentado em 40 casos selecionados aleatoriamente e 11 foram bem sucedidos. Você duvida da afirmação da empresa? Se a reivindicação for válida, π = 0,6.
Duvidar a reivindicação porque 11 sucessos não estão dentro de 3 SD do valor esperado n * p = 24 (o intervalo é de 15 a 33).
Exemplo
Eu tenho uma classe em que 80% dos meus alunos são estudantes de biologia e 20% são estudantes de química. Eu quero saber se ao escolher alunos desta turma, qual seria a probabilidade de selecionar 2 melhores de química e 3 melhores de biologia se eu os selecionasse em grupos de 5.Para ser um sucesso para os fins deste exemplo, vou usar neste caso, p = 0,8, n = 5 e X = 3:
Então, eu teria cerca de 20,5% de chance de selecionar 3 melhores deste grupo se eu as amostrasse em grupos de 5. E se eu quisesse saber a probabilidade de conseguir 3 ou mais dos melhores em grupos de 5? Este usaria \(Pr [3 ou mais] = Pr [3] + Pr [4] + Pr [5]\). Assim, poderia se usar a função \(dbinom ()\) mais duas vezes e soma-las:
\(Pr [3 ou mais] = 0,21 + 0,41 + 0,33 = 0,95\). Isso significa que eu esperaria conseguir 3 ou mais mestres de biologia 95% do tempo com amostragens repetidas. Outra maneira de se calcular isto seria:
Exemplo
Qual a probabilidade de obter ao menos 2 caras ao lançar 5 moedas?
Exemplo
Ao lançar 5 moedas, qual a probabilidade de obter no máximo 2 caras?
Exemplo
Se passam 10 caminhões por hora, em média, por um posto de pedágio, qual a probabilidade de em uma hora chegarem 15 caminhões?
Exemplo
Se passam 10 caminhões por hora, em média, por um posto de pedágio, qual a probabilidade de em uma hora chegarem 15 ou mais caminhões?
Exemplo
No meu empreendimento, chegam em média 2 clientes por hora. Se eu parei para almoçar durante 30 minutos e fechei a loja, qual a probabilidade de eu ter perdido ao menos um cliente?
Exemplo (8.30 do Freund)
Se 3% das pessoas que visitam um apartamento decorado de um prédio em construção estão seriamente interessadas em comprar um apartamento do prédio, qual é a probabilidade de Poisson para aproximar a probabilidade de que, dentre 180 pessoas que visitam um apartamento decorado de um prédio em construção, 5 estejam seriamente interessados em comprar um apartamento do prédio?
Lista de Exercícios 002/2017
1. Em um estudo, concluiu-se que, de um total de 250 alunos pesquisados, 120 cursam a disciplina A, 150 a disciplina B e 80 a disciplina C. Desses, 30 cursam exclusivamente a disciplina A, 80 exclusivamente a disciplina B e 10 cursam as 3 disciplinas. Nenhum aluno cursa as disciplinas B e C em conjunto e exclusivamente. Quantos alunos não cursam nenhuma das disciplinas A, B ou C?
De outra forma teremos: A = 120, B = 150,C = 80, A − ab − ac − abc = 30, B − ab − bc − abc = 80, abc = 10, bc = 0, assim, B−ab−0−10 = 80 → 150−80−10 = ab → ab = 60. Da mesma forma, A−ab−ac−abc = 30 → 120−60−ac−10 = 30 → ac = 20. Como U = 250 e calculando A+B+C+x−ab−ac−bc−abc = U → 120+150+80+x−60−20−20−0 = 250. Logo, x = 0 é o número de alunos que não cursam qualquer uma das três disciplinas. No diagrama,
2. Um lote de documentos gerados por uma determinada unidade administrativa é composto por 50 processos; dentre eles, há 20 com erros leves e 5 com erros graves, considerando-se os demais sem erros. Um auditor sorteia dois processos do lote e adota o seguinte procedimento: 1) se forem dois processos com erros graves, a unidade é autuada; 2) se há um processo com erro grave e outro com erro leve, a unidade é notificada; e 3) se há apenas um processo com erro grave e o outro é sem erros, ou se há dois processos com erros leves, a unidade é advertida. Nas demais situações, a unidade passa ilesa pela auditoria. Pergunta-se:
Como temos um número finito de processos, com características diversas e formando diferentes grupos, esse é um caso de x discreto, n finito e sem reposição, aplicando-se a distribuição hipergeométrica.
Ítem a: \[
p1 = \frac{\left(\begin{array}{c}5\\2\end{array}\right)\left(\begin{array}{c}25\\0\end{array}\right)}{\left(\begin{array}{c}50\\2\end{array}\right)}
\]
Ítem b: \[
p2 = \frac{\left(\begin{array}{c}5\\1\end{array}\right)\left(\begin{array}{c}20\\1\end{array}\right)}{\left(\begin{array}{c}50\\2\end{array}\right)}
\]
Ítem c: \[
p3 = \frac{\left(\begin{array}{c}5\\1\end{array}\right)\left(\begin{array}{c}25\\1\end{array}\right)}{\left(\begin{array}{c}50\\2\end{array}\right)}+\frac{\left(\begin{array}{c}20\\2\end{array}\right)\left(\begin{array}{c}25\\0\end{array}\right)}{\left(\begin{array}{c}50\\2\end{array}\right)}
\]
Ítem d: \[
p4 = \frac{\left(\begin{array}{c}25\\2\end{array}\right)\left(\begin{array}{c}20\\0\end{array}\right)}{\left(\begin{array}{c}50\\2\end{array}\right)}+\frac{\left(\begin{array}{c}20\\1\end{array}\right)\left(\begin{array}{c}25\\1\end{array}\right)}{\left(\begin{array}{c}50\\2\end{array}\right)}
\]
3. Um jogo é proposto a você: 3 dados (a,b,c) são lançados. Se as faces viradas para cima somarem 3, 4, ou 5, você ganha $40, caso contrário perde $2. Você aceitaria entrar nesse jogo? Por que?
Totalizando s = 10 alternativas.O total de alternativas é \(n = 6 × 6 × 6 = 216\). Assim, \(p=\frac{s}{n}=\frac{10}{216}=0.0463\) e \(1-p=0.9537\).
Dessa forma, temos que:\(V=v_f*p+v_d*(1-p)=40*0.0463-2*0.9537=1.852-1.9074=-0.0554\). Como o valor é negativo, significa que o fluxo de pagamento é desfavorável a mim, portanto não aceito participar desse jogo.
4. Uma empresa possui 10 engenheiros e 5 estagiários. De quantas formas pode ser montada uma comissão de 4 pessoas, garantindo que pelo menos 2 delas sejam engenheiros?
Para garantir pelo menos dois engenheiros na comissão, combinam-se grupos com 2, 3 ou 4 engenheiros. Assim:
Ou então, colocando no R temos:
Alternativamente, pode-se calcular o número total possível de comissões e dele subtrair o número de comissões com menos de dois engenheiros (0 ou 1)
E colocando no R temos:
5. Em uma determinada noite, tenho 60% de probabilidade de ir ao cinema, 50% de probabilidade de jantar fora e 30% de probabilidade de fazer as duas coisas. Qual a probabilidade de, em uma determinada noite, eu não jantar fora nem ir ao cinema?
Chamando o evento ir ao cinema de A e jantar fora de B, tem-se:\(P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.6 + 0.5 − 0.3 = 0.8\). A
probabilidade de não fazer nada disso é: \(P(A ∪ B)=1 − P(A ∪ B) = 1 − 0.8 = 0.2\)
Ou seja, a probabilidade de eu não jantar fora nem ir ao cinema em uma determinada noite é de 20%.
Se quiser saber qual é a probabilidade de ir ao cinema e não jantar fora é \(P(A)-P(A ∩ B)=0.6-0.3=0.3\)
6. Três pessoas elaboram documentos em uma empresa. A primeira produz 20 documentos em um dia de trabalho e tem uma taxa de falha de 20%. A segunda produz 40 documentos por dia e tem uma taxa de falha de 30%. A terceira produz 10 documentos por dia e tem uma taxa de falha de 10%. Se o conferente detectar um documento defeituoso, qual a probabilidade dele ter sido gerado pela pessoa número 3?
Chamando o evento documento gerado pela pessoa 3 de A e documento com defeito de B, tem-se
Total de documentos gerados = 70
Total de documentos com defeito = 0.2 × 20 + 0.3 × 40 + 0.1 × 10 = 4 + 12 + 1 = 17
Logo, temos que \(P(B)=\frac{17}{70}\) e que \(P(A ∩ B)=\frac{1}{70}\)
Assim, temos que: \[ P(\frac{A}{B})=\frac{P(A ∩ B)}{P(B)} = \frac{\frac{1}{70}}{\frac{17}{70}}=0.0588\]
Lista de Exercícios 002/2018
1. Seja o diagrama de Venn apresentado na Figura 1. Sabe-se que A e o conjunto de pessoas que falam inglês, B é o conjunto de pessoas que falam espanhol e que U e o universo pesquisado. Se 20 pessoas falam apenas inglês, 67 falam espanhol ou inglês (um, outro ou ambos), 19 falam apenas espanhol e 100 e o universo pesquisado, quantas pessoas não falam nem inglês nem espanhol?
2. Foi feita uma consulta com alunos de uma universidade a respeito dos cursos A, B e C. Dado que o total de alunos que cursam exclusivamente 2 cursos quaisquer e 93, que o total de alunos que cursam os 3 cursos é 18, que o total de alunos que não cursa nenhum dos 3 cursos é 19, que o total de alunos que cursam exclusivamente o curso A é 22, que o total de alunos que cursam exclusivamente o curso B é 17, que o total de alunos que cursam exclusivamente o curso C é 5, que o total de alunos que cursam exclusivamente os cursos A e C é 33 e que o total de alunos que cursam exclusivamente os cursos A e B é 25 pode-se afirmar que o total de alunos consultados é:
3. Em um estudo, concluiu-se que, de um total de 300 alunos pesquisados, 160 cursam a disciplina A (exclusivamente ou não), 150 a disciplina B (exclusivamente ou não) e 70 a disciplina C (exclusivamente ou não). Desses, 30 cursam exclusivamente a disciplina A, 60 exclusivamente a disciplina B e 25 cursam as 3 disciplinas. O número de alunos cursanado as disciplinas B e C em conjunto e exclusivamente é 0. Quantos alunos não cursam nenhuma das disciplinas A, B ou C?
5. Um lote de documentos gerados por uma determinada unidade administrativa é composto por 50 processos; dentre eles, há 20 com erros leves e 10 com erros graves, considerando-se os demais sem erros. Um auditor sorteia 4 processo(s) do lote e adota o seguinte procedimento: 1) se forem 2 processo(s) com erros graves, a unidade ´e autuada; 2) se há 1 processo(s) com erro grave e 1 com erros leves, a unidade é notificada; e 3) se há 1 processo(s) com erro grave e os outros são sem erros, ou se há 3 processo(s) com erros leves, a unidade é advertida. Nas demais situações, a unidade passa ilesa pela auditoria. Qual a probabilidade da empresa passar ilesa pela auditoria?
Assim a resposta do exercício é: \(p.ilesa = 1−(p.autua+ p.notifica+ p.adverte) = 1−0.4659 = 0.5341\)
6. Um colega auditor sugeriu a seguinte modificação dos critérios: Um lote de documentos gerados por uma determinada unidade administrativa ´e composto por 50 processos; dentre eles, há 20 com erros leves e 10 com erros graves, considerando-se os demais sem erros. Um auditor sorteia 4 processo(s) do lote e adota o seguinte procedimento: 1) se forem 2 OU MAIS processo(s) com erros graves e os demais sem erros, a unidade é autuada; 2) se h´a 1 processo(s) com erro grave e 1 OU MAIS com erros leves, a unidade ´e notificada; e 3) se há 1 processo(s) com erro grave e os outros são sem erros, ou se há 3 ou 4 processo(s) com erros leves, a unidade é advertida. Nas demais situações, a unidade passa ilesa pela auditoria. Qual a probabilidade da empresa passar ilesa pela auditoria?
Assim a resposta do exercício é:\(p.ilesa = 1−(p.autua+ p.notifica+ p.adverte) = 1−0.5764 = 0.4026\)
7. Ainda mais uma modifição: Um lote de documentos gerados por uma determinada unidade administrativa é composto por 50 processos; dentre eles, há 20 com erros leves e 10 com erros graves, considerando-se os demais sem erros. Um auditor sorteia 4 processo(s) do lote e adota o seguinte procedimento: 1) se forem 2 OU MAIS processo(s) com erros graves e com qualquer número de erros leves, a unidade é autuada; 2) se há 1 processo(s) com erro grave e 1 OU MAIS com erros leves, a unidade é notificada; e 3)se há 1 processo(s) com erro grave e os outros são sem erros,ou se há 3 ou 4 processo(s) com erros leves, a unidade é advertida. Nas demais situações, a unidade passa ilesa pela auditoria. Qual a probabilidade da empresa passar ilesa pela auditoria?
Assim a resposta do exercício é:\(p.ilesa = 1−(p.autua+ p.notifica+ p.adverte) = 1−0.7021 = 0.2769\)
Lista de Exercícios 002/2019
1. Seja o diagrama de Venn apresentado na Figura 1a. Sabe-se que A é o conjunto de pessoas que falam inglês, B é o conjunto de pessoas que falam espanhol e que U é o universo pesquisado. Se 80 pessoas falam somente espanhol, 103 falam espanhol (exclusivamente ou não), 42 não falam nem inglês nem espanhol, e 175 é o universo pesquisado, quantas pessoas falam somente inglês?
2. Um lote de documentos gerados por uma determinada unidade administrativa é composto por 60 processos; dentre eles, há 25 com erros leves e 10 com erros graves, considerando-se os demais sem erros. Um auditor sorteia 5 processo(s) do lote e adota o seguinte procedimento: 1) se entre eles houver 2 OU MAIS processo(s) com erros graves, independentemente do número de processos com erros leves, a unidade é autuada; Qual a probabilidade da empresa não ser autuada pela auditoria? $$ p = + =0.8096
3. Numa pesquisa, foram identificados associados, todos eles pertencentes a pelo menos uma de 3 associações diferentes, nominadas A, B e C. Desses, identificou-se que:
Pergunta-se: qual o número total de associados?
4. Um jogo é proposto a você: 3 dados são lançados. Se a soma das faces viradas para cima estiver no conjunto (6, 7, 8), você ganha $10 caso contrário perde $3.5. Aproximadamente, qual a probabilidade de perda e o VME do jogo? Enumerando os casos de sucesso, tem-se:
o que resulta em 46 sucessos, que, divididos pelo total de casos N = 216 resulta em uma probabilidade de sucesso p = 0.21 e um valor monetário esperado \(vme = 0.213 · 10 + 0.787 · 3.5 = −0.62\).
5. Uma empresa tem 6 engenheiros e 3 arquitetos. Qual a probabilidade de, formando um grupo de trabalho de 5 pessoas, 3 sejam engenheiros? \[ p = \frac{\left(\begin{array}{c}6\\3\end{array}\right)\left(\begin{array}{c}3\\2\end{array}\right)}{\left(\begin{array}{c}9\\5\end{array}\right)}=0.4762
\]
6. Uma associação tem 58 profissionais. De quantas maneiras pode-se montar uma chapa para eleição, contando com todos os profissionais e sabendo que cada chapa tem um Presidente e um Vice-Presidente? \[
N = \binom{58}{2} 2!=3306
\]
7. Um Programa de Pós-Graduação possui 12 professores, 3 técnicos e 40 alunos ingressantes. De quantas formas pode-se montar uma comissão composta por 2 professor(es), 2 técnico(s) e 2 aluno(s) ingressante(s)? \[
N = \binom{12}{2} \binom{3}{2}\binom{40}{2}=154440
\]library(gtools)
#urn with 3 balls
x <- c('red', 'blue', 'black')
#pick 2 balls from the urn with replacement
#get all permutations
permutations(n=3,r=2,v=x,repeats.allowed=T)
## [,1] [,2]
## [1,] "black" "black"
## [2,] "black" "blue"
## [3,] "black" "red"
## [4,] "blue" "black"
## [5,] "blue" "blue"
## [6,] "blue" "red"
## [7,] "red" "black"
## [8,] "red" "blue"
## [9,] "red" "red"
#number of permutations
nrow(permutations(n=3,r=2,v=x,repeats.allowed=T))
## [1] 9
library(gtools)
#urn with 3 balls
x <- c('red', 'blue', 'black')
#pick 2 balls from the urn with replacement
#get all permutations
permutations(n=3,r=2,v=x)
## [,1] [,2]
## [1,] "black" "blue"
## [2,] "black" "red"
## [3,] "blue" "black"
## [4,] "blue" "red"
## [5,] "red" "black"
## [6,] "red" "blue"
#number of permutations
nrow(permutations(n=3,r=2,v=x))
## [1] 6
perm_without_replacement <- function(n, r){
return(factorial(n)/factorial(n - r))
}
#escolhendo todas as 16 bolas
options(scipen = 999)
perm_without_replacement(16,16)
## [1] 20922789888000
#escolhendo 3 bolas sem reposição o número de permutações seria:
perm_without_replacement(16,3)
## [1] 3360
#calcular o número de combinações sem substituição / repetição
choose(n=24,k=4)
## [1] 10626
dbinom(4, size=12, prob=0.2)
## [1] 0.1328756
dbinom(0, size=12, prob=0.2) +
+ dbinom(1, size=12, prob=0.2) +
+ dbinom(2, size=12, prob=0.2) +
+ dbinom(3, size=12, prob=0.2) +
+ dbinom(4, size=12, prob=0.2)
## [1] 0.9274445
pbinom(4, size=12, prob=0.2)
## [1] 0.9274445
N = 5
n = 2
p = 0.5
choose(N, n)*p^n*(1-p)^(N-n)
## [1] 0.3125
dbinom(x = n, size = N, prob = p)
## [1] 0.3125
dbinom(x = 2, size = 10, prob = 0.3)
## [1] 0.2334744
#simulação
mean(rbinom(n = 10000, size = 10, prob = 0.3) == 2)
## [1] 0.234
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
#library(scales)
data.frame(heads = 0:10, prob = dbinom(x = 0:10, size = 10, prob = 0.3)) %>%
mutate(Heads = ifelse(heads == 2, "2", "other")) %>%
ggplot(aes(x = factor(heads), y = prob, fill = Heads)) +
geom_col() +
geom_text(
aes(label = round(prob,2), y = prob + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0
) +
labs(title = "Probability of X = 2 successes.",
subtitle = "b(10, .3)",
x = "Successes (x)",
y = "probability")
# exact
pbinom(q = 5, size = 10, p = 0.3, lower.tail = TRUE)
## [1] 0.952651
# simulated
mean(rbinom(n = 10000, size = 10, prob = 0.3) <= 5)
## [1] 0.9518
library(dplyr)
library(ggplot2)
data.frame(heads = 0:10,
pmf = dbinom(x = 0:10, size = 10, prob = 0.3),
cdf = pbinom(q = 0:10, size = 10, prob = 0.3,
lower.tail = TRUE)) %>%
mutate(Heads = ifelse(heads <= 5, "<=5", "other")) %>%
ggplot(aes(x = factor(heads), y = cdf, fill = Heads)) +
geom_col() +
geom_text(
aes(label = round(cdf,2), y = cdf + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0
) +
labs(title = "Probability of X <= 5 successes.",
subtitle = "b(10, .3)",
x = "Successes (x)",
y = "probability")
# exact
25 * 0.3
## [1] 7.5
mean(rbinom(n = 10000, size = 25, prob = .3))
## [1] 7.4865
# Variance
25 * 0.3 * (1 - 0.3)
## [1] 5.25
var(rbinom(n = 10000, size = 25, prob = .3))
## [1] 5.321724
library(dplyr)
library(ggplot2)
data.frame(heads = 0:25,
pmf = dbinom(x = 0:25, size = 25, prob = 0.3)) %>%
ggplot(aes(x = factor(heads), y = pmf)) +
geom_col() +
geom_text(
aes(label = round(pmf,2), y = pmf + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0
) +
labs(title = "Probability of X = x successes.",
subtitle = "b(25, .3)",
x = "Successes (x)",
y = "probability")
(x_le4 <- pbinom(q = 4, size = 10, prob = 0.6, lower.tail = TRUE))
## [1] 0.1662386
(y_le4 <- pbinom(q = 4, size = 10, prob = 0.7, lower.tail = TRUE))
## [1] 0.04734899
(x_or_y_le4 <- x_le4 + y_le4 - x_le4 * y_le4)
## [1] 0.2057164
pi = 0.6
n = 40
k = 11
p = k / 40
# probability of k <= 11 when n = 40 and pi = 0.6
pbinom(q = k, size = 40, prob = pi)
## [1] 0.00003163713
# 3 standard deviations from the expected value
n * pi - 3 * sqrt(n * pi * (1 - pi))
## [1] 14.70484
n * pi + 3 * sqrt(n * pi * (1 - pi))
## [1] 33.29516
p = 0.8
n = 5
X = 3
dbinom(3, size = 5, prob = 0.8)
## [1] 0.2048
dbinom(4, size = 5, prob = 0.8)
## [1] 0.4096
dbinom(5, size = 5, prob = 0.8)
## [1] 0.32768
# calculate the number of hits from 3 to 5
xsuccesses <- 3:5
# do each calculation
probx <- dbinom(xsuccesses, size = 5, prob = 0.8)
# make a table from those two values
probTable <- data.frame(xsuccesses, probx)
# display the table
show(probTable )
## xsuccesses probx
## 1 3 0.20480
## 2 4 0.40960
## 3 5 0.32768
dbinom(2, 5, 0.5)+dbinom(3, 5, 0.5)+dbinom(4, 5, 0.5)+dbinom(5, 5, 0.5)
## [1] 0.8125
sum(dbinom(2:5, 5, 0.5))
## [1] 0.8125
1-pbinom(1, 5, 0.5)
## [1] 0.8125
pbinom(2, 5, 0.5)
## [1] 0.5
lambda = 10
x = 15
lambda^x*exp(-lambda)/factorial(x)
## [1] 0.03471807
dpois(x = 15, lambda = 10)
## [1] 0.03471807
lambda = 10
x = 15
1-sum(dpois(x = 0:14, lambda = 10))
## [1] 0.08345847
1-ppois(q = 14, lambda = 10)
## [1] 0.08345847
sum(dpois(x = 15:1000, lambda = 10))
## [1] 0.08345847
1-dpois(0, 0.5*2)
## [1] 0.6321206
sum(dpois(1:1000, 0.5*2))
## [1] 0.6321206
dpois(5, 0.03*180)
## [1] 0.1728213
dpois(3, 0.05*120)
## [1] 0.08923508
dbinom(3, 120, 0.05)
## [1] 0.08690221
# A*x = c
# x = A^−1*c
# +a +b +c +ab +ac +bc +abc +x = 250
# +a +ab +ac +abc = 120
# +b +ab +bc +abc = 150
# +c +ac +bc +abc = 80
# +a = 30
# +b = 80
# +abc = 10
# +bc = 0
A = rbind(c(1, 1, 1, 1, 1, 1, 1, 1),
c(1, 0, 0, 1, 1, 0, 1, 0),
c(0, 1, 0, 1, 0, 1, 1, 0),
c(0, 0, 1, 0, 1, 1, 1, 0),
c(1, 0, 0, 0, 0, 0, 0, 0),
c(0, 1, 0, 0, 0, 0, 0, 0),
c(0, 0, 0, 0, 0, 0, 1, 0),
c(0, 0, 0, 0, 0, 1, 0, 0)
)
Ainv = solve(A)
c = c(250, 120, 150, 80, 30, 80, 10, 0)
x = as.numeric(Ainv %*% c)
names(x) = c("a", "b", "c", "ab", "ac", "bc", "abc", "x")
x
## a b c ab ac bc abc x
## 30 80 50 60 20 0 10 0
p.autuada = choose(5, 2)/choose(50, 2)
p.autuada
## [1] 0.008163265
p.notificada = choose(5, 1) * choose(20, 1)/choose(50, 2)
p.notificada
## [1] 0.08163265
p.advertida = choose(5, 1) * choose(25, 1)/choose(50, 2) + choose(20, 2)/choose(50,2)
p.advertida
## [1] 0.2571429
p.ilesa = choose(25, 2)/choose(50, 2) + choose(25, 1) * choose(20, 1)/choose(50,2)
p.ilesa
## [1] 0.6530612
# prova real
p.total = p.autuada + p.notificada + p.advertida + p.ilesa
p.total
## [1] 1
a, b, c
1, 1, 1
1, 1, 2
1, 2, 1
2, 1, 1
1, 1, 3
1, 2, 2
1, 3, 1
2, 1, 2
2, 2, 1
3, 1, 1
N = choose(10, 2) * choose(5, 2) + choose(10, 3) * choose(5, 1) + choose(10, 4)
N
## [1] 1260
N = choose(15, 4) - choose(10, 0) * choose(5, 4) - choose(10, 1) * choose(5, 3)
N
## [1] 1260
# +1a = 20
# +1a +1b +1ab = 67
# +1b = 19
# +1U =100
# +1a +1b +1ab +1x −1U = 0
names2 = c("a", "b", "ab", "x", "U")
names3 = c("a", "b", "c", "ab", "ac", "bc", "abc", "x", "U")
toEquation = function (A, c, namesx) {
f = function(x) {
paste(x, namesx, sep = "\\,", collapse = " &+& ")
}
s = paste(apply(A, 1, f), c, sep = " &=& ")
s = paste(s, collapse = "\\cr\n")
s = paste0("$$\\begin{matrix}\n", s, "\n\\end{matrix}$$\n")
s
}
A = rbind(
c(1, 0, 0, 0, 0),
c(1, 1, 1, 0, 0),
c(0, 1, 0, 0, 0),
c(0, 0, 0, 0, 1),
c(1, 1, 1, 1, -1)
)
c = c(20, 67, 19, 100, 0)
cat(toEquation(A, c, names2))
## $$\begin{matrix}
## 1\,a &+& 0\,b &+& 0\,ab &+& 0\,x &+& 0\,U &=& 20\cr
## 1\,a &+& 1\,b &+& 1\,ab &+& 0\,x &+& 0\,U &=& 67\cr
## 0\,a &+& 1\,b &+& 0\,ab &+& 0\,x &+& 0\,U &=& 19\cr
## 0\,a &+& 0\,b &+& 0\,ab &+& 0\,x &+& 1\,U &=& 100\cr
## 1\,a &+& 1\,b &+& 1\,ab &+& 1\,x &+& -1\,U &=& 0
## \end{matrix}$$
x = solve(A, c)
names(x) = names2
x
## a b ab x U
## 20 19 28 33 100
# 0a + 0b + 0c + 1ab + 1ac + 1bc + 0abc + 0x + 0U = 93
# 0a + 0b + 0c + 0ab + 0ac + 0bc + 1abc + 0x + 0U = 18
# 0a + 0b + 0c + 0ab + 0ac + 0bc + 0abc + 1x + 0U = 19
# 1a + 0b + 0c + 0ab + 0ac + 0bc + 0abc + 0x + 0U = 22
# 0a + 1b + 0c + 0ab + 0ac + 0bc + 0abc + 0x + 0U = 17
# 0a + 0b + 1c + 0ab + 0ac + 0bc + 0abc + 0x + 0U = 5
# 0a + 0b + 0c + 0ab + 1ac + 0bc + 0abc + 0x + 0U = 33
# 0a + 0b + 0c + 1ab + 0ac + 0bc + 0abc + 0x + 0U = 25
# b1a + 1b + 1c + 1ab + 1ac + 1bc + 1abc + 1x + −1U = 0
A = rbind(
c(0, 0, 0, 1, 1, 1, 0, 0, 0),
c(0, 0, 0, 0, 0, 0, 1, 0, 0),
c(0, 0, 0, 0, 0, 0, 0, 1, 0),
c(1, 0, 0, 0, 0, 0, 0, 0, 0),
c(0, 1, 0, 0, 0, 0, 0, 0, 0),
c(0, 0, 1, 0, 0, 0, 0, 0, 0),
c(0, 0, 0, 0, 1, 0, 0, 0, 0),
c(0, 0, 0, 1, 0, 0, 0, 0, 0),
c(1, 1, 1, 1, 1, 1, 1, 1, -1)
)
c = c(93, 18, 19, 22, 17, 5, 33, 25, 0)
cat(toEquation(A, c, names3))
## $$\begin{matrix}
## 0\,a &+& 0\,b &+& 0\,c &+& 1\,ab &+& 1\,ac &+& 1\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 93\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 18\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 1\,x &+& 0\,U &=& 19\cr
## 1\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 22\cr
## 0\,a &+& 1\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 17\cr
## 0\,a &+& 0\,b &+& 1\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 5\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 1\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 33\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 1\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 25\cr
## 1\,a &+& 1\,b &+& 1\,c &+& 1\,ab &+& 1\,ac &+& 1\,bc &+& 1\,abc &+& 1\,x &+& -1\,U &=& 0
## \end{matrix}$$
x = solve(A, c)
names(x) = names3
x
## a b c ab ac bc abc x U
## 22 17 5 25 33 35 18 19 174
# 1a + 1b + 1c + 1ab + 1ac + 1bc + 1abc + 1x + 0U = 300
# 1a + 0b + 0c + 1ab + 1ac + 0bc + 1abc + 0x + 0U = 160
# 0a + 1b + 0c + 1ab + 0ac + 1bc + 1abc + 0x + 0U = 150
# 0a + 0b + 1c + 0ab + 1ac + 1bc + 1abc + 0x + 0U = 70
# 1a + 0b + 0c + 0ab + 0ac + 0bc + 0abc + 0x + 0U = 30
# 0a + 1b + 0c + 0ab + 0ac + 0bc + 0abc + 0x + 0U = 60
# 0a + 0b + 0c + 0ab + 0ac + 0bc + 1abc + 0x + 0U = 25
# 0a + 0b + 0c + 0ab + 0ac + 1bc + 0abc + 0x + 0U = 0
# 1a + 1b + 1c + 1ab + 1ac + 1bc + 1abc + 1x + −1U = 0
A = rbind(
c(1, 1, 1, 1, 1, 1, 1, 1, 0),
c(1, 0, 0, 1, 1, 0, 1, 0, 0),
c(0, 1, 0, 1, 0, 1, 1, 0, 0),
c(0, 0, 1, 0, 1, 1, 1, 0, 0),
c(1, 0, 0, 0, 0, 0, 0, 0, 0),
c(0, 1, 0, 0, 0, 0, 0, 0, 0),
c(0, 0, 0, 0, 0, 0, 1, 0, 0),
c(0, 0, 0, 0, 0, 1, 0, 0, 0),
c(1, 1, 1, 1, 1, 1, 1, 1, -1)
)
c = c(300, 160, 150, 70, 30, 60, 25, 0, 0)
cat(toEquation(A, c, names3))
## $$\begin{matrix}
## 1\,a &+& 1\,b &+& 1\,c &+& 1\,ab &+& 1\,ac &+& 1\,bc &+& 1\,abc &+& 1\,x &+& 0\,U &=& 300\cr
## 1\,a &+& 0\,b &+& 0\,c &+& 1\,ab &+& 1\,ac &+& 0\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 160\cr
## 0\,a &+& 1\,b &+& 0\,c &+& 1\,ab &+& 0\,ac &+& 1\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 150\cr
## 0\,a &+& 0\,b &+& 1\,c &+& 0\,ab &+& 1\,ac &+& 1\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 70\cr
## 1\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 30\cr
## 0\,a &+& 1\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 60\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 25\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 1\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 0\cr
## 1\,a &+& 1\,b &+& 1\,c &+& 1\,ab &+& 1\,ac &+& 1\,bc &+& 1\,abc &+& 1\,x &+& -1\,U &=& 0
## \end{matrix}$$
x = solve(A, c)
names(x) = names3
x
## a b c ab ac bc abc x U
## 30 60 5 65 40 0 25 75 300
names2 = c("a", "b", "ab", "x", "U")
names3 = c("a", "b", "c", "ab", "ac", "bc", "abc", "x", "U")
toEquation = function (A, c, namesx) {
f = function(x) {
paste(x, namesx, sep = "\\,", collapse = " &+& ")
}
s = paste(apply(A, 1, f), c, sep = " &=& ")
s = paste(s, collapse = "\\cr\n")
s = paste0("$$\\begin{matrix}\n", s, "\n\\end{matrix}$$\n")
s
}
# +1a = 80
# +1a +1ab =103
# +1x = 42
# +1U =175
# +1a +1b +1ab +1x −1U = 0
A = rbind(
c(1, 0, 0, 0, 0),
c(1, 0, 1, 0, 0),
c(0, 0, 0, 1, 0),
c(0, 0, 0, 0, 1),
c(1, 1, 1, 1, -1)
)
c = c(80, 103, 42, 175, 0)
cat(toEquation(A, c, names2))
## $$\begin{matrix}
## 1\,a &+& 0\,b &+& 0\,ab &+& 0\,x &+& 0\,U &=& 80\cr
## 1\,a &+& 0\,b &+& 1\,ab &+& 0\,x &+& 0\,U &=& 103\cr
## 0\,a &+& 0\,b &+& 0\,ab &+& 1\,x &+& 0\,U &=& 42\cr
## 0\,a &+& 0\,b &+& 0\,ab &+& 0\,x &+& 1\,U &=& 175\cr
## 1\,a &+& 1\,b &+& 1\,ab &+& 1\,x &+& -1\,U &=& 0
## \end{matrix}$$
x = solve(A, c)
names(x) = names2
x
## a b ab x U
## 80 30 23 42 175
# +1a = 58
# +1b = 80
# +1c = 75
# +1bc = 5
# +1ab +1ac +1bc +1abc =212
# +1abc = 42
# +1ab −2ac = 0
# +1x = 0
# +1a +1b +1c +1ab +1ac +1bc +1abc +1x −1U = 0
A = rbind(
c(1, 0, 0, 0, 0, 0, 0, 0, 0),
c(0, 1, 0, 0, 0, 0, 0, 0, 0),
c(0, 0, 1, 0, 0, 0, 0, 0, 0),
c(0, 0, 0, 0, 0, 1, 0, 0, 0),
c(0, 0, 0, 1, 1, 1, 1, 0, 0),
c(0, 0, 0, 0, 0, 0, 1, 0, 0),
c(0, 0, 0, 1, -2, 0, 0, 0, 0),
c(0, 0, 0, 0, 0, 0, 0, 1, 0),
c(1, 1, 1, 1, 1, 1, 1, 1, -1)
)
c = c(58, 80, 75, 5, 212, 42, 0, 0, 0)
cat(toEquation(A, c, names3))
## $$\begin{matrix}
## 1\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 58\cr
## 0\,a &+& 1\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 80\cr
## 0\,a &+& 0\,b &+& 1\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 75\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 1\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 5\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 1\,ab &+& 1\,ac &+& 1\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 212\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 1\,abc &+& 0\,x &+& 0\,U &=& 42\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 1\,ab &+& -2\,ac &+& 0\,bc &+& 0\,abc &+& 0\,x &+& 0\,U &=& 0\cr
## 0\,a &+& 0\,b &+& 0\,c &+& 0\,ab &+& 0\,ac &+& 0\,bc &+& 0\,abc &+& 1\,x &+& 0\,U &=& 0\cr
## 1\,a &+& 1\,b &+& 1\,c &+& 1\,ab &+& 1\,ac &+& 1\,bc &+& 1\,abc &+& 1\,x &+& -1\,U &=& 0
## \end{matrix}$$
x = solve(A, c)
names(x) = names3
x
## a b c ab ac bc abc x U
## 58 80 75 110 55 5 42 0 425