O objetivo é mostrar como calcular a probabilidade binomial usando o software R. Não pretendo aqui me aprofundar na teoria nem ser tão rigoroso. A ideia é mostrar de forma prática como usar o R nos cálculos.
EXPERIÊNCIAS BINOMIAIS
Muitas vezes contamos o número de vezes que ocorre o evento de interesse (ou sucesso), em uma série de tentativas ou de experimentos.
Por exemplo:
• Um jogador conta quantas caras saem quando lança 10 moedas.
• Um pesquisador conta quantos, dos 500 chefes de família que entrevistou, eram mulheres.
• Um médico conta quantos, dos 100 pacientes que tratou com uma nova droga, ficaram curados.
• Um biomédico conta quantos, dos 32 hemogramas que fez no dia, indicaram doença contagiosa.
• Uma enfermeira conta quantos, dos nascidos vivos durante determinado ano em uma maternidade, tinham doença ou defeito sério.
Os experimentos binomiais são experimentos aleatórios como os citados acima, ou seja,consistem em um número fixo de tentativas repetidas, no entanto, essas tentativas precisam ser independentes, no sentido de que o resultado de uma tentativa não tem efeito sobre o resultado de outra tentativa. Além disso, em cada uma dessas tentativas há um resultado que é de interesse para nós (chamamos esse resultado de “sucesso”), e em cada uma das tentativas a probabilidade de que ocorra um “sucesso” é o mesmo em cada uma das tentativas.
Resumidamente,os requisitos para um experimento aleatório ser um experimento binomial são:
um número fixo (n) de tentativas
cada tentativa deve ser independente das outras
cada tentativa tem apenas dois resultados possíveis, chamados de “sucesso” (o resultado de interesse) e “fracasso”
há uma probabilidade constante (p) de sucesso para cada tentativa, cujo complemento é a probabilidade (1 - p) de fracasso, muitas vezes denotada como q = (1 - p)
Para se calcular a probabilidade de x “sucessos” usamos a seguinte fórmula:
\[ P(X=x)= \frac{n!}{x!(n-x)!} \times p^x \times q^{(n-x)} \]
Exemplo usando a fórmula:
Se eu jogar uma moeda 5 vezes, qual é a probabilidade de resultar em cara 3 vezes?
Solução: Observe que X é uma variável binomial pois cada realização do evento resulta em duas possibilidades: sair cara ou coroa; cada lançamento da moeda é independente do lançamento anterior; e sair cara tem a mesma probabilidade 0.5 para todos lançamentos.
Agora basta identificar os parâmetros na fórmula: No caso temos
n= 5 - número de tentativas
p= 0.5 - probabilidade de resultar cara
x= 3 - contagem dos sucessos
Substituindo na fórmula:
\[ P(X=3)= \frac{5!}{3!(5-3)!} \times 0.5^3 \times 0.5^{(5-3)} \]
Usando uma calculadora ou calculando manualmente chegamos que a probabildade de resultar cara 3 vezes é 0.3125 ou 31.25%.
A função “dbinom” calcula a probabilidade binomial no R.
A função completa com os parametros é:
dbinom(x, size, prob, log = FALSE)
Onde: x - numero de sucessos desejado, é o “x” na fórmula; size - numero de realizaçoes do evento, ou seja, o “n” da fórmula; prob - probabilidade de sucesso em uma tentativa, o “p” na fórmula.
Obs.:log=FALSE é o padrão e não precisa ser colocado. Se colocar log=TRUE ele trará o log dos valores.
Usando o mesmo exemplo das moedas acima calculariamos assim no R:
dbinom(x=3, size = 5,prob = 0.5)
## [1] 0.3125
Outro exemplo:
Suponha que foi constatado que a probabilidade de ter sangue tipo A é 0,4. Escolha 4 pessoas aleatoriamente e seja X o número com o tipo sanguíneo A.
Faça a distribuição com todas as probabilidades de x=0,1,2,3 ou 4
Faça um gráfico da distribuição do exercício 1
Calcule a probabilidade de exatamente duas pessoas terem sangue do tipo A.
Calcule a probabilidade de no máximo 3 pessoas terem sangue do tipo A.
Solução de 1:
n <- 4 #experimentos realizados
p <- 0.4 #probabilidade de um experimento resultar em sucesso
x <- seq(0,n,1) # valores de x =0,1,2,3 ou 4
p_x <- dbinom(x,n,p) #distribuição dos resultados
p_x
## [1] 0.1296 0.3456 0.3456 0.1536 0.0256
Solução de 2:
library(ggplot2)
a <- data.frame(x,p_x) #cria um dataframe para usar ggplot
ggplot(a, aes(x=x, y=p_x)) + geom_bar(stat="identity",fill="steelblue")+
ggtitle('Distribuição Binomial - Sangue Tipo A')+
geom_text(aes(label=p_x), vjust=1.6, color="white", size=3.5)
Solução de 3: Basta observar que p_x é um vetor e que cada índice desse vetor resulta tem uma probabilidade associada da seguinte forma:
p_x[1]- corresponde a P(X=0)
p_x[2]- corresponde a P(X=1)
p_x[3]- corresponde a P(X=2)
E assim por diante.
Logo a probabilidade de duas pessoas ter sangue do tipo A será:
p_x[3]
## [1] 0.3456
Solução 5:
Basta somar as probabilidades de 0 até 3, que são os vetores de p_x com índices 1,2,3 e 4:
p_x[1]+ p_x[2]+ p_x[3]+ p_x[4]
## [1] 0.9744
Poderia ser usado ainda a função cumulativa “pbinom”
pbinom(3,4,0.4) # onde o primeiro parametro é o limite que se está acumulando, o segundo é o número de tentativas e o terceiro é a probabilidade de um sucesso
## [1] 0.9744
ESpero que tenha aprendido um pouco mais sobre a distribuição binomial e como calcular usando o R.
Keep calm and analysing data!