Introdução ao Cálculo das probabilidades
Conceitos e Axiomas da Probabilidade
- A teoria das probabilidades nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que a incerteza se encontra presente.
- Existem três conceitos fundamentais em probabilidade, quais sejam:
Experimento Aleatório
Uma ação cujo resultado não pode ser previsto, embora não possamos determinar seu resultado, é possível mapear o conjunto de todos os resultados possíveis de ocorrência do experimento (Espaço Amostral).
- Lançamento de um dado e observar qual número sairá em sua face voltada para cima.
- selecionar bolas em uma urna e verificar as suas respectivas cores.
Espaço Amostral
Conjunto de todos os resultados possíveis de ocorrência do experimento aleatório, representado por Ω ou S.
Lançamento de um dado e observar qual número sairá em sua face voltada para cima.
- Espaço amostral associado: S = {1,2,3,4,5,6}
- Selecionar bolas em uma urna e verificar as suas respectivas cores.
- Espaço amostral associado: S = {“Branca”,” Preta”}
Evento
É um subconjunto do Espaço Amostral, podem existir diversos tipos de eventos.
- Lançamento de um dado e observar qual número sairá em sua face voltada para cima.
- Espaço amostral associado: S = {1,2,3,4,5,6}
- Evento Associado(A) - Faces Pares do dado: {2, 4, 6}
- Selecionar bolas em uma urna e verificar as suas respectivas cores.
- Espaço amostral associado: S = {“Branca”,” Preta”}
- Evento Associado(B) - bola de Cor Branca: {“Branca”}
Existência do evento
- A existência do evento está associada a ocorrência de um valor pertencente ao espaço amostral do experimento aleatório.
- Se a face par de um dado ocorreu, dizemos que o evento A ocorreu.
- Se saiu a cor de uma bola branca, dizemos que o evento B ocorreu.
Eventos Especiais
Existem alguns eventos especiais, quais sejam:
Eventos Certos: A ocorrência do espaço amostral, é chamada de Evento Certo.
Eventos Impossíveis: A ocorrência do conjunto vazio (∅) é chamado de evento impossível.
Evento Complementar: É o evento oposto/contrário a determinado evento.
Evento União(∪) e Intersecção (∩):
- Seja o Evento A e B, definidos a seguir:
- A: “Aparecer Faces Pares do dado”: {2, 4, 6}
- B: “Aparecer Faces maiores 3”: {4,5,6}
- A união do evento A e B é dado por: {2,4,5,6}, ou seja, o evento A ou(Inclusivo) o evento B ocorrem, significa dizer que abarcamos todos os elementos de A e B.
- A Intersecção do evento A e B é dado por: {4, 6}, ou seja, o evento A e o evento B ocorrem simultaneamente, significa dizer que abarcamos tão somente os valores comuns aos dois eventos.
- Eventos Mutuamente Exclusivos (Disjuntos): A ocorrência de um impede a ocorrência do outro, portanto não possuem ponto em comum(A∩B)=∅.
- Eventos Independentes: A ocorrência de um não modifica a probabilidade de ocorrência do outro, ou seja: P(A|B) =P(A).
É comum de serem confundidos os eventos mutuamente exclusivos com os eventos independentes, mas não são a mesma coisa! Portanto fiquem atentos!
Aplicando conceitos básicos no software R
Instalando pacotes
Exemplos de espaço amostral com R
- Criando o dado e visualizando resultados (Times é igual o Número de vezes que joga o dado)
set.seed(123)
roll_dice(times = 3) %>%
plot_dice()
## Exemplo da união e interseção
- Seja o Evento A e B, definidos a seguir:
- A: “Aparecer Faces Pares do dado”: {2, 4, 6}
- B: “Aparecer Faces maiores 3”: {4,5,6}
- A união do evento A e B é dado por:
- Criando os resultados do dado
= data.frame(c(0,1,2,3,4,5,6))
dado_resultado names(dado_resultado)="X1"
- Criando os eventos
=subset(dado_resultado,X1%%2==0)
A=subset(dado_resultado,X1>3) B
Evento A
A
## X1
## 1 0
## 3 2
## 5 4
## 7 6
Evento B
B
## X1
## 5 4
## 6 5
## 7 6
- União
=union(A,B) uniao
- Interseção
=intersect(A,B) intersecao
- Criando a moeda e visualizando os resultados
set.seed(123)
flip_coin(times = 3) %>%
plot_coin()
Axiomas da Probabilidade (Kolmogorov)
Toda probabilidade é uma função é uma função que satisfaz os 3 axiomas de kolmogorov.
Primeiro Axioma de Kolmogorov: Toda probabilidade é limitada inferiormente em 0 e superiormente em 1, para o seu espaço amostral associado.
Segundo Axioma de Kolmogorov: Nada mais é que a definição de evento certo e evento impossível.
Eventos Certos: A ocorrência do espaço amostral, é chamada de Evento Certo. P(S)=1
Eventos Impossíveis: A ocorrência do conjunto vazio (∅) é chamado de evento impossível. P(∅)=𝟎.
Terceiro Axioma de Kolmogorov: Se existem eventos, que não possuem intersecção, a probabilidade da união entre esses eventos, será dada tão somente pela soma das probabilidades dos mesmos.
Atribuição das Probabilidades
- Para Elementos do espaço amostral com equiprobabilidade (Mesma Probabilidade de acontecerem), podemos usar esta abordagem:
P(A)=(#𝑨)/(#𝑩) = (“𝑪𝒂𝒔𝒐𝒔 𝑭𝒂𝒗𝒐𝒓á𝒗𝒆𝒊𝒔”)/(“𝑪𝒂𝒔𝒐𝒔 𝑷𝒐𝒔𝒔í𝒗𝒆𝒊𝒔”) =(“𝑸𝒖𝒆𝒓𝒐”)/“𝑻𝒐𝒕𝒂𝒍”
Seja o evento: Obter duas caras no lançamento de 3 moedas. Calcule a probabilidade da ocorrência do evento, ocorrer duas caras.
Vamos definir cada elemento do problema:
Experimento aleatório:” lançar três moedas e observar o resultado da face voltada para cima”
Evento Associado: “obter duas caras no lançamento de três moedas”.
Espaço Amostral (“Casos Possíveis”/”Total”):
{(ca, ca, ca), (ca, ca, co), (ca, co, ca), (co, ca, ca), (ca, co, co), (co, ca, co), (co, co, ca), (co, co, co)}
(8 possíveis)
- Casos Favoráveis:
{(ca, ca, co), (ca, co, ca), (co, ca, ca)}
(3 favoráveis)
P(A)=(#𝐴)/(#𝐵) =3/8 = 0,375 ou 37,5%
Probabilidade da União Entre dois Eventos
- Sejam os Eventos A e B, dispostos no diagrama de ven:
Notem que ao se fazer a união entre os eventos A e B , os mesmos possuem pontos em comum , sendo contados duas vezes, portanto há a necessidade de se retirar a intersecção entre os mesmos , para não haver duplicidade!
Uma empresa precisa analisar a propensão de compra de um certo produto de dois clientes. Baseado em dados históricos da empresa, o cliente A tem propensão de compra de 30%, já o cliente B possui 28% de propensão a comprar este produto. Ambos juntos tem a propensão de compra de 24%.
Qual a probabilidade de que o mesmo seja comprado por pelo menos um dos clientes?
Vamos definir os eventos, galera:
- Evento A = “O cliente A comprar o produto”
- Evento B = “O cliente B comprar o produto”
- Sabemos pelo enunciado que:
✔️ P(A)=0,30
✔️ P(B)= 0,28
✔️ P(A ∩ B)= 0,24
- Então a união entre os eventos será dada por:
✔️ P(A ∪ B)= P(A)+P(B)-P(A ∩ B).
✔️ Substituindo: P(A U B )= 0,30 + 0,28 – 0,24= 0,34 ou 34%.
Probabilidade da Intersecção Entre dois Eventos
P (A ∩ B) = P(A)+P(B) - P (A ∪ B)
💡 Percebam que basta somente isolar o P (A ∩ B), na fórmula da probabilidade da união, para se chegar a fórmula da probabilidade da intersecção.
Leis de Demorgan
Sejam:
- A^𝑪 = ”Evento Complementar de A”
- B^𝑪 = ”Evento Complementar de B”
✔️ Primeira Lei de Morgan: ( A^𝑪) ∩ (𝑩^𝑪) =(𝑨∪𝑩)^𝑪
✔️ Segunda Lei de Morgan:( A^𝑪) ∪ (𝑩^𝑪) = (𝑨∩𝑩)^𝑪
Aplicando probabilidade da união no software R
Baseado em dados históricos da empresa, o cliente A tem propensão de compra de 30%, já o cliente B possui 28% de propensão a comprar este produto. Ambos juntos tem a propensão de compra de 24%. Qual a probabilidade de que o mesmo seja comprado por pelo menos um dos clientes?
=0.30
PA=0.28
PB=0.24
PAinterB=PA+PB-PAinterB PAuniaoB
Lei da Probabilidade Total
Nada mais é que contemplar todos os caminhos possíveis para se chegar ao evento B.
💡 Veremos a seguir que essa representação é o denominador do teorema de Bayes
Em uma empresa de tecnologia, existe um grupo de trabalhadores, em que apenas 10% mulheres. Dentre as mulheres, 50% moram longe, enquanto dentre os homens, 15% moram longe.
Relativamente a empresa toda, qual é o percentual de empregados que moram longe?
Teorema de Bayes
Quando um determinado evento é condicionado, seu espaço amostral é reduzido, por uma informação adicional que o limita, ou seja há uma restrição do seu espaço amostral.
Em certa empresa, 40% dos homens e 20% das mulheres falam inglês fluentemente. 80% das pessoas são homens. A probabilidade de um aluno fluente na língua inglesa, selecionado ao acaso, ser homem é:
Vamos esquematizar para gerar um melhor entendimento:
Aplicando lei da probabilidade total e teorema de bayes no software R
Teorema da probabilidade total
Em uma empresa de tecnologia, existe um grupo de trabalhadores, apenas 10% mulheres. Dentre as mulheres, 50% moram longe, enquanto, dentre os homens, 15% moram longe. Relativamente a empresa toda, qual é o percentual de empregados que moram longe?
Primeira maneira (Utilizando a fórmula tradicional)
=0.1
PA=0.9
PAC#----
=0.5
PBdadoA=0.5
PBCdadoA#----
=0.15
PBdadoAC=0.85
PBCdadoAC
#Queremos saber PB
=PA*PBdadoA+PAC*PBdadoAC
PB PB
## [1] 0.185
Segunda maneira (Utilizando o diagrama de árvores)
=0.1*0.5
PAinterB=0.9*0.15
PACinterB=PAinterB+PACinterB
PB PB
## [1] 0.185
Teorema de Bayes
Em certa empresa, 40% dos homens e 20% das mulheres falam inglês fluentemente.80% das pessoas são homens. A probabilidade de um aluno fluente na língua inglesa, selecionado ao acaso, ser homem é?
Primeira maneira (Utilizando a fórmula tradicional)
=0.8
PA=0.2
PAC#----
=0.4
PBdadoA=0.6
PBCdadoA#----
=0.2
PBdadoAC=0.8
PBCdadoAC
#Queremos saber PAdadoB
#Denominador(Lei da probabilidade total)
=PA*PBdadoA+PAC*PBdadoAC
PB
#Numerador( Uma parte do denominador)
=PA*PBdadoA
PAinterB
=PAinterB/PB
bayes bayes
## [1] 0.8888889
Segunda maneira (Utilizando o diagrama de árvores)
=0.8*0.4
PAinterB=0.2*0.2
PACinterB=PAinterB+PACinterB
PB
=PAinterB/PB
bayes bayes
## [1] 0.8888889
O que é uma variável aleatória?
É uma representação numérica dos resultados possíveis de um experimento aleatório
- Tipos de Variáveis Aleatórias
Distribuições de Probabilidade Discretas
Descrevem a probabilidade de ocorrência de cada valor de uma variável aleatória discreta (Valores finitos e enumeráveis).
Distribuição de Bernoulli
É um experimento aleatório com dois resultados possíveis (Fracasso ou Sucesso) e efetuado em uma única realização.
Jogar a moeda uma vez para cima e ver se sai cara ou coroa, uma empresa ter que pagar um determinado imposto ou não, etc..
Vejamos a tabela a seguir:
A variável aleatória X, está assumindo 0 (Fracasso), com probabilidade q ou 1-p e assumindo 1 (Sucesso), com probabilidade p.
Imaginemos que X=”O aluno acertar uma questão na prova”, sendo que a prova só tem uma questão, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em duas possíveis, 50% de chance de acertar a questão.
Vamos chamar então de p, a probabilidade de sucesso, o nosso sucesso é ele acertar a questão e de q ou 1-p a probabilidade de fracasso, ou seja, ele errar a questão.
Nesse caso então p=0,5 e q=0,5 também.
Logo concluímos que P(X=x) = (𝟎,𝟓) ^𝒙 (𝟎,𝟓) ^ (𝟏−𝒙), onde x =0,1 e 0≤p≤1
Queremos que ele acerte uma questão em uma. Então x é o número de sucessos que queremos, logo x=1.
✔️ P(X=1) = 0,5 ou 50%
Distribuição de Bernoulli
Dizemos que x ~ Bernoulli (p) e sua fórmula é dada genericamente por:
𝑷(𝑿=𝒙)=𝒑^𝒙 (𝟏−𝒑) ^ (𝟏−𝒙), onde x=0,1 e 0≤p≤1
𝑽𝒂𝒍𝒐𝒓 𝑬𝒔𝒑𝒆𝒓𝒂𝒅𝒐 / 𝑬𝒙𝒑𝒆𝒄𝒕â𝒏𝒄𝒊𝒂 / 𝑴é𝒅𝒊𝒂 = 𝒑
𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒑𝒒 𝒐𝒖 𝒑(𝟏−𝒑)
Distribuição Binomial
Representa n realizações independentes de experimentos Bernoulli, com a mesma probabilidade de sucesso p.
Jogar uma moeda, mais de uma vez e ver quantas caras e coroas, ter que pagar mais de uma vez determinado imposto.
Vejamos a tabela a seguir:
A variável aleatória X, está assumindo 0 (Fracasso), com probabilidade q ou1-p e assumindo 1 (Sucesso), com probabilidade p, mas agora a mesma variável X tem duas realizações distintas.
Imaginemos que X=”O aluno acertar uma questão na prova”, sendo que a prova só tem duas questões, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em duas possíveis, 50% de chance de acertar a questão.
Vamos chamar então de p, a probabilidade de sucesso, o nosso sucesso é ele acertar a questão e de q ou 1-p a probabilidade de fracasso, ou seja, ele errar a questão.
Nesse caso então p=0,5 e q=0,5 também
💡 Note que o aluno tem essas possibilidades para acertar só uma questão, fazendo as duas questões e acertar a primeira questão é independente de acertar a segunda e vice versa:
- Logo concluímos que ele pode acertar tanto na primeira e errar a segunda, como acertar a segunda e errar a primeira, todas as possibilidades devem ser levadas em consideração, portanto como a ordem não está importando, será a combinação de n elementos tomados x a x, neste caso, combinação de 2 elementos tomados 1 a 1.
Ficamos com:
P(X=x)=(𝒏¦𝒙) (𝟎,𝟓) ^𝒙 (𝟎,𝟓)^(𝒏−𝒙), onde x =0,1 e 2 e 1≤p≤0
X é o número de sucessos que queremos, logo 1.
n é a quantidade de tentativas possíveis, logo 2, pois são duas questões.
P(X=1)=(𝟐¦𝟏) (𝟎,𝟓)^𝟏 (𝟎,𝟓)^(𝟐−𝟏)
✔️ P(X=1)=0,5 ou 50%
Distribuição Binomial
Dizemos que x ~ Binomial (n, p) e sua fórmula é dada genericamente por:
𝑷(𝑿=𝒙)=(𝒏¦𝒙) 𝒑^𝒙 (𝟏−𝒑)^(𝒏−𝒙), onde x=0,1,2… n e 0≤p≤1
𝑽𝒂𝒍𝒐𝒓 𝑬𝒔𝒑𝒆𝒓𝒂𝒅𝒐 / 𝑬𝒙𝒑𝒆𝒄𝒕â𝒏𝒄𝒊𝒂 / 𝑴é𝒅𝒊𝒂 = 𝒏𝒑
𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒏𝒑𝒒 𝒐𝒖 𝒏𝒑(𝟏−𝒑)
💡 Note também que a bernoulli é um caso particular de binomial, com n=1, alterando n=1 na fórmula da binomial, chegamos tanto a fórmula da bernoulli, quanto a sua esperança e variância.
Considere um exame de múltipla escolha com 20 questões, 5 alternativas pra cada pergunta. Caso o aluno não estude e “chute” todas as respostas, qual a probabilidade de acertar 30% da prova? E qual seu número esperado de acertos?
- n = 20, número de questões (tentativas)
- X = ”O aluno acertar uma questão”
- 𝒑=𝟏/𝟓 𝒐𝒖 𝟐𝟎%
- 𝒒=𝟏−𝒑=𝟒/𝟓 𝒐𝒖 𝟖𝟎%
- 𝑿~𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍(𝟐𝟎,𝟏/𝟓)
Queremos que ele acerte 30% de 20, que é acertar 6 questões, logo precisamos calcular a probabilidade de X=6, então substituindo na fórmula:
✔️ P(X=6) = (𝟐𝟎¦𝟔) (𝟎,𝟐)^𝟔 (𝟎,𝟖)^𝟏𝟒 = 0,109 ou 10,9%.
✔️ O valor esperado da Binomial é, E(x)= n.p= 20.0,2= 4 Acertos em média.
Distribuição de Poisson
Distribuição que representa números de ocorrências de um evento em um intervalo correspondente.
Número de carros passando em uma ponte, número de pessoas chegando em uma fila, número de navios atracando no porto, número de chamadas aten didas por um call center, … etc.
Fórmula da distribuição de Poisson:
-𝝀=“taxa média em determinado período de tempo”
-𝑿= “𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝑺𝒖𝒄𝒆𝒔𝒔𝒐𝒔”
𝑷(𝑿=𝒙)=( (𝝀^𝒙) 𝒆^(−𝝀) )/𝒙!, 𝒙=𝟎,𝟏….; 𝝀>𝟎.
𝑿 ~ 𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝝀)
𝑽𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐=𝑬(𝑿)= 𝜆
𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂=𝑽(𝑿)= 𝜆
O número de acidentes que acontecem na ponte Rio Niterói segue uma distribuição de Poisson com média 3 por hora.
- Calcule a probabilidade de 2 acidentes em uma hora.
𝑷(𝑿=𝟐)=(𝟑²𝒆^(−𝟑)) /𝟐! =𝟒,𝟓𝒆^(−𝟑)= 0,22404 ou 22,404%
- Calcule a probabilidade de pelo menos 2 acidentes em 2 horas. Como queremos para duas horas e nosso lâmbida é 3 por hora, vamos fazer a regra de 3 pra achar nosso lâmbida.
3 – 1hora
x – 2horas x= 6, portanto nosso novo lâmbida é 6.
Pelo menos 2, são 2 ou mais, então: 𝑷(𝒙≥𝟐)=𝟏−(𝑷(𝑿=𝟎)+𝑷(𝑿=𝟏))=
(𝟔^𝟎 𝒆^(−𝟔) )/𝟎!+(𝟔^𝟏 𝒆^(−𝟔) )/𝟏!=
𝟏−(𝒆^(−𝟔) (𝟏+𝟔))=
✔️ 𝟏−𝟕𝒆^(−𝟔)=𝟎,𝟗𝟖𝟐𝟔 𝒐𝒖 𝟗𝟖,𝟐𝟔%.
Aplicando distribuições discretas no software R
Bernoulli
Imaginemos que X=“O aluno acertar uma questão na prova”, sendo que a prova só tem uma questão, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em duas possíveis, 50% de chance de acertar a questão.
Fazendo pela distribuição acumulada:
pbinom(1,size=1,p=0.5)-pbinom(0,size=1,p=0.5)
## [1] 0.5
Fazendo pela função massa:
dbinom(1,size=1,p=0.5)
## [1] 0.5
Binomial
Imaginemos que X=“O aluno acertar uma questão na prova”, sendo que a prova só tem três questões, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em três possíveis.
Fazendo pela distribuição acumulada:
pbinom(1,size=3,p=1/3)-pbinom(0,size=3,p=1/3)
## [1] 0.4444444
Fazendo pela função massa:
dbinom(1,size=3,p=1/3)
## [1] 0.4444444
Binomial
Considere um exame de múltipla escolha com 20 questões, 5 alternativas pra cada pergunta. Caso o aluno não estude e “chute” todas as respostas, qual a probabilidade de acertar 30% da prova? E qual seu número esperado de acertos?
- Qual a probabilidade de acertar 30% da prova?
x ~ binomial (20,1/5)
Pela distribuição acumulada:
=20
n=0.2
ppbinom(6,size=n,p)-pbinom(5,size=n,p)
## [1] 0.1090997
Pela função massa:
=20
n=0.2
pdbinom(6,size=n,p)
## [1] 0.1090997
Qual seu número esperado de acertos?
=n*p
valor_esperado valor_esperado
## [1] 4
Poisson
O número de acidentes que acontecem na ponte Rio Niterói segue uma distribuição de Poisson com média 3 por hora.
- Calcule a probabilidade de 2 acidentes em uma hora.
- Calcule a probabilidade de pelo menos 2 acidentes em 2 horas.
Como o a taxa solicitada está em horas, manteremos o nosso lâmbida
=3 lambda
Utilizando a função massa de probabilidade aplicando para X=2: P(X=2)
dpois(2,lambda)
## [1] 0.2240418
#Utilizando a função de distribuição acumulada P(X<=2)-P(X<=1)= P(X=2)
ppois(2,lambda)-ppois(1,lambda)
## [1] 0.2240418
Na “mão”
3^2)*exp(-3)/factorial(2) (
## [1] 0.2240418
Como o a taxa solicitada está em 2horas, ajustaremos o lâmbida proporcionalmente para 6.
=6 lambda
Calculando o complementar da probabilidade solicitada ou seja:
1 - P(X<=1) = 1-P(X<2) =
P(X>=2)
1 - ppois(1,lambda)
## [1] 0.9826487
Na “mão”
1 - (exp(-6)+6*exp(-6))
## [1] 0.9826487
Distribuições de Probabilidade Contínuas
Distribuição Exponencial
Essa distribuição é caracterizada por estar definida para valores positivos, e usualmente é utilizada para representar o tempo.
Tempo de vida útil de uma lâmpada, tempo de espera em uma fila, tempo de vida útil de equipamentos..Etc
- Fórmula da Exponencial:
f(x)=(𝜆𝑒) ^ (−𝜆𝑥), x>0; 𝜆>0.
Valor esperado=E(x)= 1/λ Variância=V(x) = 1/λ²
Função de Distribuição Acumulada de uma Exponencial
O tempo de espera em uma fila em uma fila de banco, segue uma distribuição exponencial. Se o tempo médio esperado pelo cliente é 10 minutos para ser atendido qual a probabilidade:
- De que um cliente demore menos do que 12 minutos para ele ser atendido.
- De que um cliente demore entre 7 e 12 minutos para ser atendido.
𝑥 ~𝐸𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙(𝜆=1/10)
Fórmula da Exponencial:
f(x)= (𝜆𝑒)^(−𝜆𝑥) ∴ f(x)=0,1𝑒^(−0,1𝑥)
- Nos é perguntado p(x<12), Substituindo na fórmula:
f(x<12)=∫ 0 a 12 0,1 𝑒^(−0,1𝑥) =
F(X<12)= 1 - 𝑒^(−0,1.12)=
1-𝑒^(−0,1.12)=
1- 𝑒^(−1,2).
- Nos é perguntado p(7<x<12) :
=∫ 7 a 12 0,1𝑒^(−0,1𝑥) =
F(x<12)-F(x<7)=
1- 𝑒^(−1,2) - (1- 𝑒^(−0,7))=
𝑒^(−0,7) - 𝑒^(−1,2).
Distribuições de Probabilidade Normal ou Gaussiana
É uma das mais conhecidas distribuições em estatística, possui o formato de sino, é uma distribuição simétrica (Moda=Mediana=Média).
Cálculo de probabilidades Normal
Para efetuar o cálculo da probabilidade em variáveis que seguem normais, não é tão simples quanto nas outras distribuições, uma vez que a normal é uma distribuição contínua não integrável analiticamente, somente através de métodos numéricos iterativos, não possuindo solução analítica.
Então existe uma tabela Normal, que fornece probabilidades associadas a uma variável aleatória padronizada(Z) : Z = (X − 𝜇)/𝜎 , onde z possui distribuição normal padrão(Média 0 e Variância 1).
Considere que o peso dos alunos segue uma normal com média igual a 70kg e desvio padrão igual a 5 kg.
- Calcule a probabilidade de um aluno possuir um peso entre 60 e 80 kg.
Queremos P(60<x<80) =
𝑃( (60−70)/5 <𝑥< (80−70)/5)
=𝑃( −2<𝑍<2) = 2P( 0<Z<2)=
✔️ 2(0,47725)=0,9545 ou 95,45%.
Existem Quantis da normal que serão úteis na parte de intervalos de confiança e testes de hipóteses, portanto é importante estudá-los, são eles:
-𝑧_0,05 = Quantil de k tal que P(0<Z<K)=45% ; K=1,64.
-𝑧_0,025= Quantil de k tal que P(0<Z<K)=47,5% ; k=1,96.
-𝑧_0,005= Quantil de k tal que P(0<Z<K)=49,5% ; k= 2,58.
Aplicando distribuições contínuas no software R
Exponencial
O tempo de espera em uma fila segue uma distribuição exponencial. Se o tempo médio esperado pelo cliente é 10 minutos para ser atendido qual a probabilidade:
- De que um cliente demore menos do que 12 minutos para ele ser atendido.
Utilizando a função de distribuição acumulada P(X<=12)
pexp(12,rate=1/10)
## [1] 0.6988058
Exponencial na “Mão”
1-exp(-1.2)
## [1] 0.6988058
- De que um cliente demore entre 7 e 12 minutos para ser atendido.
Utilizando a função de distribuição acumulada P(X<=12)-P(X<=7)
pexp(12,rate=1/10) - pexp(7,rate=1/10)
## [1] 0.1953911
#Exponencial na “Mão”
1 - exp(-1.2) - (1- exp(-0.7))
## [1] 0.1953911
#ou
exp(-0.7) - exp(-1.2)
## [1] 0.1953911
Distribuição Normal
Considere que o peso dos alunos segue uma normal com média igual a 70kg e desvio padrão igual a 5 kg. Calcule a probabilidade de um aluno possuir um peso entre 60 e 80 kg.
Utilizando a função de distribuição acumulada P(x<=80) - P(x<=60)
pnorm(80,mean = 70, sd = 5) - pnorm(60,mean = 70, sd = 5)
## [1] 0.9544997
Normal na “Mão”
=(60-70)/5
limite_inf=(80-70)/5
limite_sup limite_inf
## [1] -2
limite_sup
## [1] 2
Utilizando a função de distribuição acumulada da normal padrão P(z<=2) - P(z<=-2)
pnorm(limite_sup) - pnorm(limite_inf)
## [1] 0.9544997
Suponha que o valor das causas de ações (X) de um tribunal de justiça, seja normalmente distribuído com média 20 (salários mínimos) e variância 25 (Salários mínimos ao quadrado). Além disso, então a probabilidade de que uma causa seja maior que 26,25 salários mínimos é de?
Utilizando a função de distribuição acumulada 1 - P(x<=26,25)
1-pnorm(26.25,mean = 20, sd = 5)
## [1] 0.1056498
Utilizando lower tail=F
pnorm(26.25,mean = 20, sd = 5,lower.tail = F)
## [1] 0.1056498
Normal na “Mão”
=(26.25-20)/5 z
Utilizando a função de distribuição acumulada da normal padrão 1 - P(z<=1.25)
1-pnorm(z)
## [1] 0.1056498
Teorema central do limite
No diz que a soma ou a média de variáveis aleatórias independentes quaisquer, quando padronizadas ou não, convergem em distribuição para Z ~ N (0,1)
💡 Note que este teorema é muito forte, note que independente da distribuição, quando a nossa amostra é grande(n>30), a média/soma das variáveis aleatórias terão distribuição aproximadamente normal.
Aplicando distribuições amostrais da média no R
Considere a população de uma distribuição discreta binomial de 100 elementos
= rbinom(100,size=1,1/2)
pop
= mean(pop)
mi
= sample(pop,size=100,replace=T)
amostra1 = sample(pop,size=100,replace=T)
amostra2 = sample(pop,size=100,replace=T)
amostra3
= mean(amostra1)
xbarra1 = mean(amostra2)
xbarra2 = mean(amostra3)
xbarra3
cbind(mi,xbarra1,xbarra2,xbarra3)
## mi xbarra1 xbarra2 xbarra3
## [1,] 0.56 0.53 0.56 0.55
hist(t(data.frame(xbarra1,xbarra2,xbarra3)))
Para n = 30
= 30
tentativas = numeric(tentativas)
medias
for (i in (1:tentativas)) {
= mean(sample(pop,size=100,replace=T))
medias[i]
}
hist(medias)
Para n = 100
= 100
tentativas = numeric(tentativas)
medias
for (i in (1:tentativas)) {
= mean(sample(pop,size=100,replace=T))
medias[i]
}
hist(medias)
Para n = 1000
= 1000
tentativas = numeric(tentativas)
medias
for (i in (1:tentativas)) {
= mean(sample(pop,size=100,replace=T))
medias[i]
}
hist(medias)