Introdução ao Cálculo das probabilidades

Conceitos e Axiomas da Probabilidade

  • A teoria das probabilidades nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que a incerteza se encontra presente.

  • Existem três conceitos fundamentais em probabilidade, quais sejam:

Experimento Aleatório

Uma ação cujo resultado não pode ser previsto, embora não possamos determinar seu resultado, é possível mapear o conjunto de todos os resultados possíveis de ocorrência do experimento (Espaço Amostral).

  • Lançamento de um dado e observar qual número sairá em sua face voltada para cima.

  • selecionar bolas em uma urna e verificar as suas respectivas cores.

Espaço Amostral

Conjunto de todos os resultados possíveis de ocorrência do experimento aleatório, representado por ou S.

  • Lançamento de um dado e observar qual número sairá em sua face voltada para cima.

    • Espaço amostral associado: S = {1,2,3,4,5,6}
  • Selecionar bolas em uma urna e verificar as suas respectivas cores.
    • Espaço amostral associado: S = {“Branca”,” Preta”}

Evento

É um subconjunto do Espaço Amostral, podem existir diversos tipos de eventos.

  • Lançamento de um dado e observar qual número sairá em sua face voltada para cima.
    • Espaço amostral associado: S = {1,2,3,4,5,6}
    • Evento Associado(A) - Faces Pares do dado: {2, 4, 6}
  • Selecionar bolas em uma urna e verificar as suas respectivas cores.
    • Espaço amostral associado: S = {“Branca”,” Preta”}
    • Evento Associado(B) - bola de Cor Branca: {“Branca”}

Existência do evento

  • A existência do evento está associada a ocorrência de um valor pertencente ao espaço amostral do experimento aleatório.

  • Se a face par de um dado ocorreu, dizemos que o evento A ocorreu.
  • Se saiu a cor de uma bola branca, dizemos que o evento B ocorreu.

Eventos Especiais

  • Existem alguns eventos especiais, quais sejam:

    • Eventos Certos: A ocorrência do espaço amostral, é chamada de Evento Certo.

    • Eventos Impossíveis: A ocorrência do conjunto vazio (∅) é chamado de evento impossível.

    • Evento Complementar: É o evento oposto/contrário a determinado evento.

    • Evento União(∪) e Intersecção (∩):

  • Seja o Evento A e B, definidos a seguir:
    • A: “Aparecer Faces Pares do dado”: {2, 4, 6}
    • B: “Aparecer Faces maiores 3”: {4,5,6}
  • A união do evento A e B é dado por: {2,4,5,6}, ou seja, o evento A ou(Inclusivo) o evento B ocorrem, significa dizer que abarcamos todos os elementos de A e B.
  • A Intersecção do evento A e B é dado por: {4, 6}, ou seja, o evento A e o evento B ocorrem simultaneamente, significa dizer que abarcamos tão somente os valores comuns aos dois eventos.
  • Eventos Mutuamente Exclusivos (Disjuntos): A ocorrência de um impede a ocorrência do outro, portanto não possuem ponto em comum(A∩B)=∅.
  • Eventos Independentes: A ocorrência de um não modifica a probabilidade de ocorrência do outro, ou seja: P(A|B) =P(A).

É comum de serem confundidos os eventos mutuamente exclusivos com os eventos independentes, mas não são a mesma coisa! Portanto fiquem atentos!

Aplicando conceitos básicos no software R

Instalando pacotes

Exemplos de espaço amostral com R

  • Criando o dado e visualizando resultados (Times é igual o Número de vezes que joga o dado)
set.seed(123)
roll_dice(times = 3) %>% 
  plot_dice()

## Exemplo da união e interseção

  • Seja o Evento A e B, definidos a seguir:
    • A: “Aparecer Faces Pares do dado”: {2, 4, 6}
    • B: “Aparecer Faces maiores 3”: {4,5,6}
  • A união do evento A e B é dado por:
  • Criando os resultados do dado
dado_resultado = data.frame(c(0,1,2,3,4,5,6))
names(dado_resultado)="X1"
  • Criando os eventos
A=subset(dado_resultado,X1%%2==0)
B=subset(dado_resultado,X1>3)

Evento A

A
##   X1
## 1  0
## 3  2
## 5  4
## 7  6

Evento B

B
##   X1
## 5  4
## 6  5
## 7  6
  • União
uniao=union(A,B)
  • Interseção
intersecao=intersect(A,B)
  • Criando a moeda e visualizando os resultados
set.seed(123)
flip_coin(times = 3) %>%  
  plot_coin()

Axiomas da Probabilidade (Kolmogorov)

  • Toda probabilidade é uma função é uma função que satisfaz os 3 axiomas de kolmogorov.

    • Primeiro Axioma de Kolmogorov: Toda probabilidade é limitada inferiormente em 0 e superiormente em 1, para o seu espaço amostral associado.

    • Segundo Axioma de Kolmogorov: Nada mais é que a definição de evento certo e evento impossível.

    • Eventos Certos: A ocorrência do espaço amostral, é chamada de Evento Certo. P(S)=1

    • Eventos Impossíveis: A ocorrência do conjunto vazio (∅) é chamado de evento impossível. P(∅)=𝟎.

    • Terceiro Axioma de Kolmogorov: Se existem eventos, que não possuem intersecção, a probabilidade da união entre esses eventos, será dada tão somente pela soma das probabilidades dos mesmos.

Atribuição das Probabilidades

  • Para Elementos do espaço amostral com equiprobabilidade (Mesma Probabilidade de acontecerem), podemos usar esta abordagem:

P(A)=(#𝑨)/(#𝑩) = (“𝑪𝒂𝒔𝒐𝒔 𝑭𝒂𝒗𝒐𝒓á𝒗𝒆𝒊𝒔”)/(“𝑪𝒂𝒔𝒐𝒔 𝑷𝒐𝒔𝒔í𝒗𝒆𝒊𝒔”) =(“𝑸𝒖𝒆𝒓𝒐”)/“𝑻𝒐𝒕𝒂𝒍”

Seja o evento: Obter duas caras no lançamento de 3 moedas. Calcule a probabilidade da ocorrência do evento, ocorrer duas caras.

  • Vamos definir cada elemento do problema:

  • Experimento aleatório:” lançar três moedas e observar o resultado da face voltada para cima”

    • Evento Associado: “obter duas caras no lançamento de três moedas”.

    • Espaço Amostral (“Casos Possíveis”/”Total”):

    {(ca, ca, ca), (ca, ca, co), (ca, co, ca), (co, ca, ca), (ca, co, co), (co, ca, co), (co, co, ca), (co, co, co)}

    (8 possíveis)

    • Casos Favoráveis:

    {(ca, ca, co), (ca, co, ca), (co, ca, ca)}

    (3 favoráveis)

    P(A)=(#𝐴)/(#𝐵) =3/8 = 0,375 ou 37,5%

Probabilidade da União Entre dois Eventos

  • Sejam os Eventos A e B, dispostos no diagrama de ven:

Notem que ao se fazer a união entre os eventos A e B , os mesmos possuem pontos em comum , sendo contados duas vezes, portanto há a necessidade de se retirar a intersecção entre os mesmos , para não haver duplicidade!

Uma empresa precisa analisar a propensão de compra de um certo produto de dois clientes. Baseado em dados históricos da empresa, o cliente A tem propensão de compra de 30%, já o cliente B possui 28% de propensão a comprar este produto. Ambos juntos tem a propensão de compra de 24%.

Qual a probabilidade de que o mesmo seja comprado por pelo menos um dos clientes?

  • Vamos definir os eventos, galera:

    • Evento A = “O cliente A comprar o produto”
    • Evento B = “O cliente B comprar o produto”

  • Sabemos pelo enunciado que:

✔️ P(A)=0,30

✔️ P(B)= 0,28

✔️ P(A ∩ B)= 0,24

  • Então a união entre os eventos será dada por:

✔️ P(A ∪ B)= P(A)+P(B)-P(A ∩ B).

✔️ Substituindo: P(A U B )= 0,30 + 0,28 – 0,24= 0,34 ou 34%.

Probabilidade da Intersecção Entre dois Eventos

    P (A ∩ B) = P(A)+P(B) - P (A ∪ B)

💡 Percebam que basta somente isolar o P (A ∩ B), na fórmula da probabilidade da união, para se chegar a fórmula da probabilidade da intersecção.

Leis de Demorgan

Sejam:

  • A^𝑪 = ”Evento Complementar de A”
  • B^𝑪 = ”Evento Complementar de B”

✔️ Primeira Lei de Morgan: ( A^𝑪) ∩ (𝑩^𝑪) =(𝑨∪𝑩)^𝑪

✔️ Segunda Lei de Morgan:( A^𝑪) ∪ (𝑩^𝑪) = (𝑨∩𝑩)^𝑪

Aplicando probabilidade da união no software R

Baseado em dados históricos da empresa, o cliente A tem propensão de compra de 30%, já o cliente B possui 28% de propensão a comprar este produto. Ambos juntos tem a propensão de compra de 24%. Qual a probabilidade de que o mesmo seja comprado por pelo menos um dos clientes?

PA=0.30
PB=0.28
PAinterB=0.24
PAuniaoB=PA+PB-PAinterB

Lei da Probabilidade Total

Nada mais é que contemplar todos os caminhos possíveis para se chegar ao evento B.

💡 Veremos a seguir que essa representação é o denominador do teorema de Bayes

Em uma empresa de tecnologia, existe um grupo de trabalhadores, em que apenas 10% mulheres. Dentre as mulheres, 50% moram longe, enquanto dentre os homens, 15% moram longe.

Relativamente a empresa toda, qual é o percentual de empregados que moram longe?

Teorema de Bayes

Quando um determinado evento é condicionado, seu espaço amostral é reduzido, por uma informação adicional que o limita, ou seja há uma restrição do seu espaço amostral.

Em certa empresa, 40% dos homens e 20% das mulheres falam inglês fluentemente. 80% das pessoas são homens. A probabilidade de um aluno fluente na língua inglesa, selecionado ao acaso, ser homem é:

Vamos esquematizar para gerar um melhor entendimento:

Aplicando lei da probabilidade total e teorema de bayes no software R

Teorema da probabilidade total

Em uma empresa de tecnologia, existe um grupo de trabalhadores, apenas 10% mulheres. Dentre as mulheres, 50% moram longe, enquanto, dentre os homens, 15% moram longe. Relativamente a empresa toda, qual é o percentual de empregados que moram longe?

Primeira maneira (Utilizando a fórmula tradicional)

PA=0.1
PAC=0.9
#----
PBdadoA=0.5
PBCdadoA=0.5
#----
PBdadoAC=0.15
PBCdadoAC=0.85

#Queremos saber PB
PB=PA*PBdadoA+PAC*PBdadoAC
PB
## [1] 0.185

Segunda maneira (Utilizando o diagrama de árvores)

PAinterB=0.1*0.5
PACinterB=0.9*0.15
PB=PAinterB+PACinterB
PB
## [1] 0.185

Teorema de Bayes

Em certa empresa, 40% dos homens e 20% das mulheres falam inglês fluentemente.80% das pessoas são homens. A probabilidade de um aluno fluente na língua inglesa, selecionado ao acaso, ser homem é?

Primeira maneira (Utilizando a fórmula tradicional)

PA=0.8
PAC=0.2
#----
PBdadoA=0.4
PBCdadoA=0.6
#----
PBdadoAC=0.2
PBCdadoAC=0.8

#Queremos saber PAdadoB

#Denominador(Lei da probabilidade total)
PB=PA*PBdadoA+PAC*PBdadoAC

#Numerador( Uma parte do denominador)
PAinterB=PA*PBdadoA

bayes=PAinterB/PB
bayes
## [1] 0.8888889

Segunda maneira (Utilizando o diagrama de árvores)

PAinterB=0.8*0.4
PACinterB=0.2*0.2
PB=PAinterB+PACinterB

bayes=PAinterB/PB
bayes
## [1] 0.8888889

O que é uma variável aleatória?

É uma representação numérica dos resultados possíveis de um experimento aleatório

  • Tipos de Variáveis Aleatórias

Distribuições de Probabilidade Discretas

Descrevem a probabilidade de ocorrência de cada valor de uma variável aleatória discreta (Valores finitos e enumeráveis).

Distribuição de Bernoulli

É um experimento aleatório com dois resultados possíveis (Fracasso ou Sucesso) e efetuado em uma única realização.

Jogar a moeda uma vez para cima e ver se sai cara ou coroa, uma empresa ter que pagar um determinado imposto ou não, etc..

Vejamos a tabela a seguir:

  • A variável aleatória X, está assumindo 0 (Fracasso), com probabilidade q ou 1-p e assumindo 1 (Sucesso), com probabilidade p.

  • Imaginemos que X=”O aluno acertar uma questão na prova”, sendo que a prova só tem uma questão, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em duas possíveis, 50% de chance de acertar a questão.

  • Vamos chamar então de p, a probabilidade de sucesso, o nosso sucesso é ele acertar a questão e de q ou 1-p a probabilidade de fracasso, ou seja, ele errar a questão.

  • Nesse caso então p=0,5 e q=0,5 também.

Logo concluímos que P(X=x) = (𝟎,𝟓) ^𝒙 (𝟎,𝟓) ^ (𝟏−𝒙), onde x =0,1 e 0≤p≤1

Queremos que ele acerte uma questão em uma. Então x é o número de sucessos que queremos, logo x=1.

✔️ P(X=1) = 0,5 ou 50%

Distribuição de Bernoulli

Dizemos que x ~ Bernoulli (p) e sua fórmula é dada genericamente por:

𝑷(𝑿=𝒙)=𝒑^𝒙 (𝟏−𝒑) ^ (𝟏−𝒙), onde x=0,1 e 0≤p≤1

𝑽𝒂𝒍𝒐𝒓 𝑬𝒔𝒑𝒆𝒓𝒂𝒅𝒐 / 𝑬𝒙𝒑𝒆𝒄𝒕â𝒏𝒄𝒊𝒂 / 𝑴é𝒅𝒊𝒂 = 𝒑

𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒑𝒒 𝒐𝒖 𝒑(𝟏−𝒑)

Distribuição Binomial

Representa n realizações independentes de experimentos Bernoulli, com a mesma probabilidade de sucesso p.

Jogar uma moeda, mais de uma vez e ver quantas caras e coroas, ter que pagar mais de uma vez determinado imposto.

Vejamos a tabela a seguir:

  • A variável aleatória X, está assumindo 0 (Fracasso), com probabilidade q ou1-p e assumindo 1 (Sucesso), com probabilidade p, mas agora a mesma variável X tem duas realizações distintas.

  • Imaginemos que X=”O aluno acertar uma questão na prova”, sendo que a prova só tem duas questões, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em duas possíveis, 50% de chance de acertar a questão.

  • Vamos chamar então de p, a probabilidade de sucesso, o nosso sucesso é ele acertar a questão e de q ou 1-p a probabilidade de fracasso, ou seja, ele errar a questão.

Nesse caso então p=0,5 e q=0,5 também

💡 Note que o aluno tem essas possibilidades para acertar só uma questão, fazendo as duas questões e acertar a primeira questão é independente de acertar a segunda e vice versa:

  • Logo concluímos que ele pode acertar tanto na primeira e errar a segunda, como acertar a segunda e errar a primeira, todas as possibilidades devem ser levadas em consideração, portanto como a ordem não está importando, será a combinação de n elementos tomados x a x, neste caso, combinação de 2 elementos tomados 1 a 1.

Ficamos com:

P(X=x)=(𝒏¦𝒙) (𝟎,𝟓) ^𝒙 (𝟎,𝟓)^(𝒏−𝒙), onde x =0,1 e 2 e 1≤p≤0

X é o número de sucessos que queremos, logo 1.

n é a quantidade de tentativas possíveis, logo 2, pois são duas questões.

P(X=1)=(𝟐¦𝟏) (𝟎,𝟓)^𝟏 (𝟎,𝟓)^(𝟐−𝟏)
✔️ P(X=1)=0,5 ou 50%

Distribuição Binomial

Dizemos que x ~ Binomial (n, p) e sua fórmula é dada genericamente por:

𝑷(𝑿=𝒙)=(𝒏¦𝒙) 𝒑^𝒙 (𝟏−𝒑)^(𝒏−𝒙), onde x=0,1,2… n e 0≤p≤1

𝑽𝒂𝒍𝒐𝒓 𝑬𝒔𝒑𝒆𝒓𝒂𝒅𝒐 / 𝑬𝒙𝒑𝒆𝒄𝒕â𝒏𝒄𝒊𝒂 / 𝑴é𝒅𝒊𝒂 = 𝒏𝒑

𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒏𝒑𝒒 𝒐𝒖 𝒏𝒑(𝟏−𝒑)

💡 Note também que a bernoulli é um caso particular de binomial, com n=1, alterando n=1 na fórmula da binomial, chegamos tanto a fórmula da bernoulli, quanto a sua esperança e variância.

Considere um exame de múltipla escolha com 20 questões, 5 alternativas pra cada pergunta. Caso o aluno não estude e “chute” todas as respostas, qual a probabilidade de acertar 30% da prova? E qual seu número esperado de acertos?

  • n = 20, número de questões (tentativas)
  • X = ”O aluno acertar uma questão”
  • 𝒑=𝟏/𝟓 𝒐𝒖 𝟐𝟎%
  • 𝒒=𝟏−𝒑=𝟒/𝟓 𝒐𝒖 𝟖𝟎%
  • 𝑿~𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍(𝟐𝟎,𝟏/𝟓)

Queremos que ele acerte 30% de 20, que é acertar 6 questões, logo precisamos calcular a probabilidade de X=6, então substituindo na fórmula:

✔️ P(X=6) = (𝟐𝟎¦𝟔) (𝟎,𝟐)^𝟔 (𝟎,𝟖)^𝟏𝟒 = 0,109 ou 10,9%.

✔️ O valor esperado da Binomial é, E(x)= n.p= 20.0,2= 4 Acertos em média.

Distribuição de Poisson

Distribuição que representa números de ocorrências de um evento em um intervalo correspondente.

Número de carros passando em uma ponte, número de pessoas chegando em uma fila, número de navios atracando no porto, número de chamadas aten didas por um call center, … etc.

  • Fórmula da distribuição de Poisson:

    -𝝀=“taxa média em determinado período de tempo”

    -𝑿= “𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝑺𝒖𝒄𝒆𝒔𝒔𝒐𝒔”

    𝑷(𝑿=𝒙)=( (𝝀^𝒙) 𝒆^(−𝝀) )/𝒙!, 𝒙=𝟎,𝟏….; 𝝀>𝟎.

𝑿 ~ 𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝝀)

𝑽𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐=𝑬(𝑿)= 𝜆

𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂=𝑽(𝑿)= 𝜆

O número de acidentes que acontecem na ponte Rio Niterói segue uma distribuição de Poisson com média 3 por hora.

  1. Calcule a probabilidade de 2 acidentes em uma hora.

𝑷(𝑿=𝟐)=(𝟑²𝒆^(−𝟑)) /𝟐! =𝟒,𝟓𝒆^(−𝟑)= 0,22404 ou 22,404%

  1. Calcule a probabilidade de pelo menos 2 acidentes em 2 horas. Como queremos para duas horas e nosso lâmbida é 3 por hora, vamos fazer a regra de 3 pra achar nosso lâmbida.

3 – 1hora

x – 2horas x= 6, portanto nosso novo lâmbida é 6.

Pelo menos 2, são 2 ou mais, então: 𝑷(𝒙≥𝟐)=𝟏−(𝑷(𝑿=𝟎)+𝑷(𝑿=𝟏))=

(𝟔^𝟎 𝒆^(−𝟔) )/𝟎!+(𝟔^𝟏 𝒆^(−𝟔) )/𝟏!=

𝟏−(𝒆^(−𝟔) (𝟏+𝟔))=

✔️ 𝟏−𝟕𝒆^(−𝟔)=𝟎,𝟗𝟖𝟐𝟔 𝒐𝒖 𝟗𝟖,𝟐𝟔%.

Aplicando distribuições discretas no software R

Bernoulli

Imaginemos que X=“O aluno acertar uma questão na prova”, sendo que a prova só tem uma questão, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em duas possíveis, 50% de chance de acertar a questão.

Fazendo pela distribuição acumulada:

pbinom(1,size=1,p=0.5)-pbinom(0,size=1,p=0.5)
## [1] 0.5

Fazendo pela função massa:

dbinom(1,size=1,p=0.5)
## [1] 0.5

Binomial

Imaginemos que X=“O aluno acertar uma questão na prova”, sendo que a prova só tem três questões, contendo certo ou errado, portanto podemos entender que o aluno tem uma resposta favorável em três possíveis.

Fazendo pela distribuição acumulada:

pbinom(1,size=3,p=1/3)-pbinom(0,size=3,p=1/3)
## [1] 0.4444444

Fazendo pela função massa:

dbinom(1,size=3,p=1/3)
## [1] 0.4444444

Binomial

Considere um exame de múltipla escolha com 20 questões, 5 alternativas pra cada pergunta. Caso o aluno não estude e “chute” todas as respostas, qual a probabilidade de acertar 30% da prova? E qual seu número esperado de acertos?

  1. Qual a probabilidade de acertar 30% da prova?

x ~ binomial (20,1/5)

Pela distribuição acumulada:

n=20
p=0.2
pbinom(6,size=n,p)-pbinom(5,size=n,p)
## [1] 0.1090997

Pela função massa:

n=20
p=0.2
dbinom(6,size=n,p)
## [1] 0.1090997

Qual seu número esperado de acertos?

valor_esperado=n*p
valor_esperado
## [1] 4

Poisson

O número de acidentes que acontecem na ponte Rio Niterói segue uma distribuição de Poisson com média 3 por hora.

  1. Calcule a probabilidade de 2 acidentes em uma hora.
  2. Calcule a probabilidade de pelo menos 2 acidentes em 2 horas.

Como o a taxa solicitada está em horas, manteremos o nosso lâmbida

lambda=3

Utilizando a função massa de probabilidade aplicando para X=2: P(X=2)

dpois(2,lambda)
## [1] 0.2240418

#Utilizando a função de distribuição acumulada P(X<=2)-P(X<=1)= P(X=2)

ppois(2,lambda)-ppois(1,lambda)
## [1] 0.2240418

Na “mão”

(3^2)*exp(-3)/factorial(2)
## [1] 0.2240418

Como o a taxa solicitada está em 2horas, ajustaremos o lâmbida proporcionalmente para 6.

lambda=6

Calculando o complementar da probabilidade solicitada ou seja:

1 - P(X<=1) = 1-P(X<2) =

P(X>=2)

1 - ppois(1,lambda)
## [1] 0.9826487

Na “mão”

1 - (exp(-6)+6*exp(-6))
## [1] 0.9826487

Distribuições de Probabilidade Contínuas

Distribuição Exponencial

Essa distribuição é caracterizada por estar definida para valores positivos, e usualmente é utilizada para representar o tempo.

Tempo de vida útil de uma lâmpada, tempo de espera em uma fila, tempo de vida útil de equipamentos..Etc

  • Fórmula da Exponencial:

f(x)=(𝜆𝑒) ^ (−𝜆𝑥), x>0; 𝜆>0.

Valor esperado=E(x)= 1/λ Variância=V(x) = 1/λ²

Função de Distribuição Acumulada de uma Exponencial

O tempo de espera em uma fila em uma fila de banco, segue uma distribuição exponencial. Se o tempo médio esperado pelo cliente é 10 minutos para ser atendido qual a probabilidade:

    1. De que um cliente demore menos do que 12 minutos para ele ser atendido.
    1. De que um cliente demore entre 7 e 12 minutos para ser atendido.

𝑥 ~𝐸𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙(𝜆=1/10)

Fórmula da Exponencial:

f(x)= (𝜆𝑒)^(−𝜆𝑥) ∴ f(x)=0,1𝑒^(−0,1𝑥)

    1. Nos é perguntado p(x<12), Substituindo na fórmula:

f(x<12)=∫ 0 a 12 0,1 𝑒^(−0,1𝑥) =

F(X<12)= 1 - 𝑒^(−0,1.12)=

1-𝑒^(−0,1.12)=

1- 𝑒^(−1,2).

    1. Nos é perguntado p(7<x<12) :

=∫ 7 a 12 0,1𝑒^(−0,1𝑥) =

F(x<12)-F(x<7)=

1- 𝑒^(−1,2) - (1- 𝑒^(−0,7))=

𝑒^(−0,7) - 𝑒^(−1,2).

Distribuições de Probabilidade Normal ou Gaussiana

É uma das mais conhecidas distribuições em estatística, possui o formato de sino, é uma distribuição simétrica (Moda=Mediana=Média).

Cálculo de probabilidades Normal

Para efetuar o cálculo da probabilidade em variáveis que seguem normais, não é tão simples quanto nas outras distribuições, uma vez que a normal é uma distribuição contínua não integrável analiticamente, somente através de métodos numéricos iterativos, não possuindo solução analítica.

Então existe uma tabela Normal, que fornece probabilidades associadas a uma variável aleatória padronizada(Z) : Z = (X − 𝜇)/𝜎 , onde z possui distribuição normal padrão(Média 0 e Variância 1).

Considere que o peso dos alunos segue uma normal com média igual a 70kg e desvio padrão igual a 5 kg.

  1. Calcule a probabilidade de um aluno possuir um peso entre 60 e 80 kg.

Queremos P(60<x<80) =

𝑃( (60−70)/5 <𝑥< (80−70)/5)

=𝑃( −2<𝑍<2) = 2P( 0<Z<2)=

✔️ 2(0,47725)=0,9545 ou 95,45%.

Existem Quantis da normal que serão úteis na parte de intervalos de confiança e testes de hipóteses, portanto é importante estudá-los, são eles:

-𝑧_0,05 = Quantil de k tal que P(0<Z<K)=45% ; K=1,64.

-𝑧_0,025= Quantil de k tal que P(0<Z<K)=47,5% ; k=1,96.

-𝑧_0,005= Quantil de k tal que P(0<Z<K)=49,5% ; k= 2,58.

Aplicando distribuições contínuas no software R

Exponencial

O tempo de espera em uma fila segue uma distribuição exponencial. Se o tempo médio esperado pelo cliente é 10 minutos para ser atendido qual a probabilidade:

  1. De que um cliente demore menos do que 12 minutos para ele ser atendido.

Utilizando a função de distribuição acumulada P(X<=12)

pexp(12,rate=1/10)
## [1] 0.6988058

Exponencial na “Mão”

1-exp(-1.2)
## [1] 0.6988058
  1. De que um cliente demore entre 7 e 12 minutos para ser atendido.

Utilizando a função de distribuição acumulada P(X<=12)-P(X<=7)

pexp(12,rate=1/10) - pexp(7,rate=1/10)
## [1] 0.1953911

#Exponencial na “Mão”

1 - exp(-1.2) - (1- exp(-0.7)) 
## [1] 0.1953911
#ou
exp(-0.7) - exp(-1.2)
## [1] 0.1953911

Distribuição Normal

Considere que o peso dos alunos segue uma normal com média igual a 70kg e desvio padrão igual a 5 kg. Calcule a probabilidade de um aluno possuir um peso entre 60 e 80 kg.

Utilizando a função de distribuição acumulada P(x<=80) - P(x<=60)

pnorm(80,mean = 70, sd = 5) - pnorm(60,mean = 70, sd = 5) 
## [1] 0.9544997

Normal na “Mão”

limite_inf=(60-70)/5
limite_sup=(80-70)/5
limite_inf
## [1] -2
limite_sup
## [1] 2

Utilizando a função de distribuição acumulada da normal padrão P(z<=2) - P(z<=-2)

pnorm(limite_sup) - pnorm(limite_inf) 
## [1] 0.9544997

Suponha que o valor das causas de ações (X) de um tribunal de justiça, seja normalmente distribuído com média 20 (salários mínimos) e variância 25 (Salários mínimos ao quadrado). Além disso, então a probabilidade de que uma causa seja maior que 26,25 salários mínimos é de?

Utilizando a função de distribuição acumulada 1 - P(x<=26,25)

1-pnorm(26.25,mean = 20, sd = 5)
## [1] 0.1056498

Utilizando lower tail=F

pnorm(26.25,mean = 20, sd = 5,lower.tail = F)
## [1] 0.1056498

Normal na “Mão”

z=(26.25-20)/5 

Utilizando a função de distribuição acumulada da normal padrão 1 - P(z<=1.25)

1-pnorm(z)
## [1] 0.1056498

Teorema central do limite

No diz que a soma ou a média de variáveis aleatórias independentes quaisquer, quando padronizadas ou não, convergem em distribuição para Z ~ N (0,1)

💡 Note que este teorema é muito forte, note que independente da distribuição, quando a nossa amostra é grande(n>30), a média/soma das variáveis aleatórias terão distribuição aproximadamente normal.

Aplicando distribuições amostrais da média no R

Considere a população de uma distribuição discreta binomial de 100 elementos

pop = rbinom(100,size=1,1/2)

mi = mean(pop) 

amostra1 = sample(pop,size=100,replace=T)
amostra2 = sample(pop,size=100,replace=T)
amostra3 = sample(pop,size=100,replace=T)

xbarra1 = mean(amostra1) 
xbarra2 = mean(amostra2)
xbarra3 = mean(amostra3)

cbind(mi,xbarra1,xbarra2,xbarra3)
##        mi xbarra1 xbarra2 xbarra3
## [1,] 0.56    0.53    0.56    0.55
hist(t(data.frame(xbarra1,xbarra2,xbarra3)))

Para n = 30

tentativas = 30
medias = numeric(tentativas)

for (i in (1:tentativas)) {
  medias[i] = mean(sample(pop,size=100,replace=T))
}

hist(medias)

Para n = 100

tentativas = 100
medias = numeric(tentativas)

for (i in (1:tentativas)) {
  medias[i] = mean(sample(pop,size=100,replace=T))
}

hist(medias)

Para n = 1000

tentativas = 1000
medias = numeric(tentativas)

for (i in (1:tentativas)) {
  medias[i] = mean(sample(pop,size=100,replace=T))
}

hist(medias)