require(gtools)
require(tidyverse)
require(ggforce)  
options(kableExtra.latex.load_packages = TRUE)
require(kableExtra)
require(mosaicCalc)
require(gridExtra)
require(numDeriv)
require(DT)
#Para numerar tabelas e figuras:
require(captioner)
fig_nums <- captioner(prefix = "Figura")
table_nums <- captioner(prefix = "Tabela")
quadro_nums<- captioner(prefix="Quadro")

1 UNIDADE I – Medição de Incertezas

Os métodos Bayesianos têm aplicação em muitas áreas como epidemiologia, bioestatística, engenharia, ciência da computação, entre outros.

  • Thomas Bayes (1764) introduziu a inferência Bayesiana para o modelo binomial com uma priori constante;
  • Laplace (1862) estudou o resultado de Bayes para qualquer distribuição;
  • A teoria das probabilidades foi originalmente introduzida entre 1764 e 1838;
  • O conceito de probabilidade inversa foi usado entre 1838 e 1945;
  • Fisher introduziu a estatística clássica entre 1938 e 1955;
  • 1955 surgiram os testes Bayesianos;
  • De Finetti (1974) introduziu a existência da priori como principal fundamento da inferência Bayesiana;
  • 1990 surgiram os Métodos MCMC (em inglês: Markov Chain Monte Carlo, ou em português: Monte Carlo com cadeias de Markov).

1.1 Teoria das probabilidades e axiomas

Definição 1.1: Partição de um Espaço Amostral Dizemos que os eventos \(A_1,A_2,\ldots,A_n\) formam uma partição do espaço amostral \(\Omega\) se as seguintes propriedades são satisfeitas:

  • \(A_i\neq\emptyset,i=1,\ldots,n\): significa que nenhum evento pode ser igual ao conjunto vazio;
  • \(A_i\) \(\cap\) \(A_j\) = \(\emptyset\), para \(i\) \(\neq\) \(j\): significa que os eventos são disjuntos;
  • \(\cup^{n}_{i=1}A_i=\Omega\): significa que a união (ou reunião) de todos os eventos totaliza o espaço amostral.
Figura  1: Representação Gráfica de partição de um espaço amostral

Figura 1: Representação Gráfica de partição de um espaço amostral

Definição 1.2: Classe de eventos do espaço amostral A classe de eventos do espaço amostral \(\Omega\), também chamada de classe de subconjuntos do espaço amostral \(\Omega\), ou Conjunto das partes de \(\Omega\), é o conjunto que contém todos os subconjuntos de \(\Omega\) e é representado por \(\mathcal{P}(\Omega)\).

Conceito de probabilidade A probabilidade é definida numa classe de eventos do espaço amostral, com certas propriedades.

Definição 1.3: Probabilidade é uma função \(P(.)\) que associa a cada evento de \(\mathcal{P}(\Omega)\) (ou subconjunto de \(\Omega\)) um número real pertencente ao intervalo \([0,1]\), satisfazendo aos Axiomas de Kolmogorov

  • Axioma 1: \(P(A) \geq 0\) para todo evento \(A\), \(A \subset \Omega\): significa que a probabilidade é sempre um número real não negativo;
  • Axioma 2: \(P(\Omega)=1\): significa que \(\Omega\) é um evento certo pois reúne todas as possibilidades;
  • Axioma 3: \(P(\cup^{\infty}_{i=1}A_i)=\sum_{i=1}^{\infty}P(A_{i})\), se \(A_1, A_2, \ldots\) forem, dois a dois, mutuamente exclusivos:

significa que a probabilidade da união de dois ou mais eventos é igual à soma de suas respectivas probabilidades, se os eventos forem mutuamente exclusivos aos pares.

Teorema 1.4: Se os eventos \(A_1, A_2, \ldots, A_n\) formam uma partição do espaço amostral, então: \[ \sum_{i=1}^n P(A_{i})=1. \]

Demonstração: A demonstração vem da definição de partição e dos Axiomas 2 e 3 de Kolmogorov.

Definição 1.5: Probabilidade condicional A probabilidade condicional de \(B\) dado \(A\) é dada pela fórmula: \[ P(B|A) = \frac{P(A \cap B)}{P(A)}, \] sendo que \(P(A)\) deve ser maior do que zero.

Teorema 1.6: Teorema do produto \[ P(A \cap B) = P(A) P(B|A) \text{ e também } P(A \cap B) = P(B) P(A|B). \]

Demonstração: A demonstração vem da definição de probabilidade condicional.

Proposição 1.7: Generalização do Teorema do Produto Sejam \(A_1\), \(A_2\),\(\ldots\), \(A_{n-1}\), \(A_n\) eventos do espaço amostral \(\Omega\), onde está definida a probabilidade \(P\), temos: \[ P(A_1\cap A_2 \ldots \cap A_{n-1}\cap A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1\cap A_2)P(A_n|A1\cap A2 \ldots A_{n-1}). \] Demonstração: A demonstração é através do Princípio da Indução Finita.

Teorema 1.8: Teorema da Probabilidade Total (ou Fórmula da Probabilidade Total): Sejam \(A_1,A_2,\ldots,A_n\) eventos que formam uma partição do espaço amostral. Seja \(B\) um evento deste espaço. \[ P(B) = \sum_{i=1}^n P(A_i)P(B|A_i), \] onde \(A_1, A_2, \ldots A_n\) formam uma partição no espaço amostral.

A fórmula da Probabilidade Total permite calcular a probabilidade de um evento \(B\) a partir das probabilidades de um conjunto de eventos disjuntos cuja reunião é o espaço amostral; e as probabilidades condicionais de \(B\) dado cada um destes eventos são fornecidas.

Demonstração - Passo 1: Como \(A_1, \ldots, A_n\) formam uma partição, então podemos escrever \(B\) da seguinte forma: \[ B = (B \cap A_1) \cup (B \cap A_2) \cup (B \cap A_3) \cup \ldots \cup (B \cap A_n). \]

Figura  2: Representação gráfica do teorema da probabilidade total

Figura 2: Representação gráfica do teorema da probabilidade total

  • Passo 2: Como \(A_1,A_2,\ldots,A_n\) são disjuntos, então pelo axioma 3 de Kolmogorov, temos: \[ P(B)= P(B \cap A_1) + P(B \cap A_2) + P(B \cap A_3) \ldots + P(B \cap A_n). \]
  • Passo 3: Utilizando o Teorema do Produto, podemos escrever: \[ P(B)=P(A_1)P(B|A_1)+ P(A_2)P(B|A_2)+P(A_3)P(B|A_3)+ \ldots +P(A_n)P(B|A_n). \]

Teorema 1.9: Teorema de Bayes (ou fórmula de Bayes):

\[ P(A|B)=\frac{P(B|A)P(A)}{P(B)}. \] Demonstração: A demonstração vem da Definição de probabilidade condicional, Teorema do Produto e Teorema da Probabilidade Total.

Teorema de Bayes - Caso geral \[ P(A_i|B)=\frac{P(A_i)P(B|A_i)}{\sum_{i=1}^n P(A_i)P(B|A_i)}, \] onde \(A_1,A_2,\ldots A_n\) formam uma partição no espaço amostral

Exemplo 1: Exames de diagnóstico não são infalíveis, mas deseja-se que tenha probabilidade pequena de erro. Um exame detecta uma certa doença, caso ela exista, com probabilidade 0,9. Se a doença não existir, o exame corretamente aponta isso com probabilidade 0,8. Considere que estamos aplicando esses exames em uma população com \(10\%\) de prevalência dessa doença. Para um indivíduo escolhido ao acaso, pergunta-se:

    1. A probabilidade de ser realmente doente se o exame indicou que era.
    1. A probabilidade de acerto do exame.

Resolução:

  • Sejam os eventos A: o indivíduo ter a doença e B: o teste dar positivo.
  • Podemos construir o diagrama da árvore
Figura  3: Diagrama da árvore

Figura 3: Diagrama da árvore

  • item a) esta probabilidade é denotada por \(P(doente \vert +)= P(A|B)\) não é mesma coisa que \(P(B \vert A)\).

Passo I: Calcular a probabilidade Total - que vai no denominador da probabilidade que queremos:

\[ \begin{array}{lll} P(B)&=&P(B|A) \times P(A)+P(B|A^c) \times P(A^c)\\ &=&0,9 \times 0,1+0,2 \times 0,9 \\ &=&0,27 \end{array} \]

Passo II: Calcular a probabilidade condicional \[ \begin{array}{lll} P(A|B)&=& \frac{P(A \cap B)}{P(B)}\\ &=& \frac{P(B| A) \times P(A)}{P(B)} \text{ , o numerador vem da fórmula do produto} \\ &=& \frac{0,9 \times 0,1}{0,27} = \approx 0,33 = 33\% \end{array} \] - item b) esta probabilidade é dada pela soma: P(+ e o indivíduo ser doente ) + P(- e o indivíduo não ser doente): \[ \begin{array}{lll} P(A \cap B) + P(A^c \cap B^c) &=& P(B|A) \times P(A) + P( B^c|A^c) \times P(A^c) \text{ pela fórmula do produto} \\ &=& 0,9 \times 0,1 + 0,8 \times 0,9 = 0,81 = 81 \% \end{array} \]

1.2 Exercícios

    1. Um novo teste para detectar o vírus HIV apresenta \(95\%\) de sensitividade e \(98\%\) de especificidade. Numa população com uma prevalência de \(0,1\%\) para a doença
      1. qual é a probabilidade de um indivíduo com teste positivo ter o vírus HIV?
      1. qual é a probabilidade de um indívíduo com teste negativo não ter o vírus HIV?
      1. Utilize o resultado dos itens \(a)\) e \(b)\) para responder à seguinte pergunta: Por que quando o teste dá resultado positivo o laboratório repete o teste, mas do contrário não é necessário repetir o teste?

Ajuda: sensibilidade do teste: é a probabilidade do teste dar resultado positivo para um indivíduo que tem a doença, especificidade do teste: é a probabilidade do teste dar resultado negativo para um indivíduo que não tem doença, prevalência: é a proporção de pessoas com a doença em certa população de interesse. Em testes diagnósticos, temos interesse em encontrar o teste que possui os maiores valores de sensibilidade e especificidade.

    1. Em um determinado posto de gasolina, \(40\%\) dos clientes usam gasolina comum, 35% usam gasolina aditivada e 25% usam gasolina Premium. Dos clientes que usam gasolina comum apenas 30% enchem o tanque; dentre os que usam gasolina aditivada 60% enchem o tanque; e dentre os que usam Premium 50% enchem o tanque.
      1. Qual é a probabilidade de um cliente encher o tanque, sabendo-se que ele pediu gasolina comum?
      1. Qual é a probabilidade de um cliente pedir gasolina aditivada e encher o tanque?
      1. Qual é a probabilidade de um cliente encher o tanque?
      1. Dado que o cliente encheu o tanque, qual é a probabilidade dele ter pedido gasolina comum? E gasolina aditivada? E gasolina Premium?
    1. Uma máquina produz \(5\%\) de itens defeituosos. Cada item produzido passa por um teste de qualidade que o classifica como bom, defeituoso ou suspeito. Este teste classifica \(20\%\) dos itens defeituosos como bons e \(30\%\) como suspeitos. Ele também classifica \(15\%\) dos itens bons como defeituosos e \(25\%\) como suspeitos. Utilize o Teorema de Bayes para responder às perguntas abaixo:
      1. Que proporção dos itens serão classificados como suspeitos?
      1. Qual a probabilidade de um item classificado como suspeito ser defeituoso?