Probabilidade Discreta

Modelo probabilístico: descrição quantitativa de enventos incertos do mundo real.

Definição de um modelo probabilístico:

  1. Descreva os possíveis resultados do experimento (especifique o *espaço amostral).

  2. Especifique a lei probabilística que atribui probabilidades aos resultados.

Interpretação frequentista de probabilidade: proporções de eventos resultantes da repetição de um experimento.

Evento: é um resultado de uma medição ou observação de um fenômeno probabilístico.

Introdução: Cartas de um baralho

Carregamos as bibliotecas:

library(tidyverse)
library(gtools)

Definiremos um baralho:

naipes <- c("Ouros", "Corações", "Paus", "Espadas")
numeros <- c("As", "Dois", "Três", "Quatro", "Cinco", "Seis", "Sete", "Oito", "Nove", "Dez", "Valete", "Rainha", "Rei")

Definimos uma mesa de cartas:

mesa <- expand.grid(naipe=naipes, numero=numeros)
mesa2 <-paste(mesa$numero, mesa$naipe)
mesa2
 [1] "As Ouros"        "As Corações"     "As Paus"         "As Espadas"      "Dois Ouros"      "Dois Corações"  
 [7] "Dois Paus"       "Dois Espadas"    "Três Ouros"      "Três Corações"   "Três Paus"       "Três Espadas"   
[13] "Quatro Ouros"    "Quatro Corações" "Quatro Paus"     "Quatro Espadas"  "Cinco Ouros"     "Cinco Corações" 
[19] "Cinco Paus"      "Cinco Espadas"   "Seis Ouros"      "Seis Corações"   "Seis Paus"       "Seis Espadas"   
[25] "Sete Ouros"      "Sete Corações"   "Sete Paus"       "Sete Espadas"    "Oito Ouros"      "Oito Corações"  
[31] "Oito Paus"       "Oito Espadas"    "Nove Ouros"      "Nove Corações"   "Nove Paus"       "Nove Espadas"   
[37] "Dez Ouros"       "Dez Corações"    "Dez Paus"        "Dez Espadas"     "Valete Ouros"    "Valete Corações"
[43] "Valete Paus"     "Valete Espadas"  "Rainha Ouros"    "Rainha Corações" "Rainha Paus"     "Rainha Espadas" 
[49] "Rei Ouros"       "Rei Corações"    "Rei Paus"        "Rei Espadas"    

Retiremos cartas do baralho: por exemplo, qual é a probabilidade de retirarmos um rei?

4/52
[1] 0.07692308

Vamos reobter este resultado a partir das cartas do baralho. Determinemos as cartas “Rei”:

reis <-paste("Rei",naipes)
reis
[1] "Rei Ouros"    "Rei Corações" "Rei Paus"     "Rei Espadas" 

Examinemos todo a baralho e verifiquemos quantas cartas são “Rei”:

mesa2 %in% reis
 [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[22] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[43] FALSE FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE

Podemos obter a proporção de cartas “Rei” no baralho, calculando a sua proporção:

mean(mesa2 %in% reis)
[1] 0.07692308

que é o resultado esperado, 4/52=1/13.

Permutações

Exemplo 1

Suponhamos que queremos selecionar 2 elementos de um grupo de 5 elementos. Os possíveis modos são dados por

permutations(5,2)
      [,1] [,2]
 [1,]    1    2
 [2,]    1    3
 [3,]    1    4
 [4,]    1    5
 [5,]    2    1
 [6,]    2    3
 [7,]    2    4
 [8,]    2    5
 [9,]    3    1
[10,]    3    2
[11,]    3    4
[12,]    3    5
[13,]    4    1
[14,]    4    2
[15,]    4    3
[16,]    4    5
[17,]    5    1
[18,]    5    2
[19,]    5    3
[20,]    5    4
Note que a ordem importa e números repetidos não ocorrem.
Exemplo 2

Façamos uma permutação (arranjo) de 4 números, 3,4,5,6 e grupos de 3 elementos. De um modo mais concreto, se temos uma caixa com 4 bolas marcadas com números, quais são os possíveis resultados se selecionarmos 3 bolas aleatoriamente?

m <- permutations(4,3,c(3,4,5,6))
m
      [,1] [,2] [,3]
 [1,]    3    4    5
 [2,]    3    4    6
 [3,]    3    5    4
 [4,]    3    5    6
 [5,]    3    6    4
 [6,]    3    6    5
 [7,]    4    3    5
 [8,]    4    3    6
 [9,]    4    5    3
[10,]    4    5    6
[11,]    4    6    3
[12,]    4    6    5
[13,]    5    3    4
[14,]    5    3    6
[15,]    5    4    3
[16,]    5    4    6
[17,]    5    6    3
[18,]    5    6    4
[19,]    6    3    4
[20,]    6    3    5
[21,]    6    4    3
[22,]    6    4    5
[23,]    6    5    3
[24,]    6    5    4

Portanto, o número de modos é 24, o que podemos obter contando o número de linhas de \(m\):

n <-nrow(m)
n
[1] 24

Se quisermos selecionar linhas específicas de \(m\) (digamos 12, 13 e 14), procedemos do seguinte modo:

m[12:14,]
     [,1] [,2] [,3]
[1,]    4    6    5
[2,]    5    3    4
[3,]    5    3    6

A ausência de número após a vírgula significa que queremos todas as colunas de \(m\).

Façamos a simulação de 6 escolhas aleatórias de 3 bolas (amostragem):

indice <-sample(n, 6)
indice
[1] 14  2 20 19 22 17

Ou seja, as bolas selecionadas são as seguintes:

m[indice,]
     [,1] [,2] [,3]
[1,]    5    3    6
[2,]    3    4    6
[3,]    6    3    5
[4,]    6    3    4
[5,]    6    4    5
[6,]    5    6    3
Exemplo 3

Simule a seleção aleatória de 5 números de 7 dígitos.

Inicialmente contamos o número total de possibilidades (espaço amostral):

numeros <- permutations(10,7,c(0:9))
head(numeros)
     [,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,]    0    1    2    3    4    5    6
[2,]    0    1    2    3    4    5    7
[3,]    0    1    2    3    4    5    8
[4,]    0    1    2    3    4    5    9
[5,]    0    1    2    3    4    6    5
[6,]    0    1    2    3    4    6    7
n <- nrow(numeros)
n
[1] 604800

Dentre estas 604500 possibilidades (linhas) selecionemos 5 números:

indice <- sample(n,5)
indice
[1] 310783 533691 405112 145273 171761

Os números correspondentes a estas linhas são:

numeros[indice,]
     [,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,]    5    1    2    9    8    0    6
[2,]    8    7    3    2    4    5    6
[3,]    6    7    2    1    9    4    8
[4,]    2    4    6    9    5    7    0
[5,]    2    8    5    4    3    0    1

Probabilidade Condicional

Exemplo 4

Calculemos a probabilidade de que a segunda carta selecionada do baralho seja “Rei”, dado que a primeira carta selecionada tenha sido “Rei”. Sabemos que o resultado é

3/51
[1] 0.05882353

No entanto, o procedimento ilustrará o procedimento a ser utilizado em casos mais complicados.

Computemos todos os possíveis modo de se selecionar duas cartas, quando a ordem é relevante:

maos <-permutations(52,2, mesa2)
head(maos)
     [,1]          [,2]            
[1,] "As Corações" "As Espadas"    
[2,] "As Corações" "As Ouros"      
[3,] "As Corações" "As Paus"       
[4,] "As Corações" "Cinco Corações"
[5,] "As Corações" "Cinco Espadas" 
[6,] "As Corações" "Cinco Ouros"   

O número total de mãos é:

nrow(maos)
[1] 2652

Por exemplo, a primeira carta selecionada é

primeira_carta <- maos[,1]

A segunda carta selecionada é

segunda_carta <- maos[,2]

Vejamos em quantos casos, a carta é “Rei”:

k <-sum(primeira_carta %in% reis)
k
[1] 204

Devemos agora determinar, entre estes 204 casos, qual é a proporção de carta “Rei” na segunda carta.

sum(primeira_carta %in% reis & segunda_carta %in% reis)/sum(primeira_carta %in% reis)
[1] 0.05882353

Notemos que este resultado pode ser obtido calculando médias:

mean(primeira_carta %in% reis & segunda_carta %in% reis)/mean(primeira_carta %in% reis)
[1] 0.05882353

Estas relações são representações da relação fundamental para probabilidades condicionais:

\[ Pr(B|A)= \frac{Pr(A \cap B)}{Pr(A)}\,. \]

Exercícios 1

  1. Simule 10 seleções aleatórias de 5 bolas numeradas de 7 a 25.

  2. Determine todos os casos de seleções de 4 cartas de um baralho nas quais a temos três cartas com naipe espadas. Qual é a probabilidade de que tal evento ocorra?
LS0tCnRpdGxlOiAiUHJvYmFiaWxpZGFkZSBEaXNjcmV0YSBlIFNpbXVsYcOnw7VlcyBkZSBNb250ZSBDYXJsbyIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQo8aDI+UHJvYmFiaWxpZGFkZSBEaXNjcmV0YTwvaDI+CgpNb2RlbG8gcHJvYmFiaWzDrXN0aWNvOiBkZXNjcmnDp8OjbyBxdWFudGl0YXRpdmEgZGUgZW52ZW50b3MgaW5jZXJ0b3MgZG8gbXVuZG8gcmVhbC4KCkRlZmluacOnw6NvIGRlIHVtIG1vZGVsbyBwcm9iYWJpbMOtc3RpY286CgoxLiBEZXNjcmV2YSBvcyBwb3Nzw612ZWlzIHJlc3VsdGFkb3MgZG8gZXhwZXJpbWVudG8gKGVzcGVjaWZpcXVlIG8gKmVzcGHDp28gYW1vc3RyYWwpLgoKMi4gRXNwZWNpZmlxdWUgYSBsZWkgcHJvYmFiaWzDrXN0aWNhIHF1ZSBhdHJpYnVpIHByb2JhYmlsaWRhZGVzIGFvcyByZXN1bHRhZG9zLiAKCkludGVycHJldGHDp8OjbyBmcmVxdWVudGlzdGEgZGUgcHJvYmFiaWxpZGFkZTogcHJvcG9yw6fDtWVzIGRlIGV2ZW50b3MgcmVzdWx0YW50ZXMgZGEgcmVwZXRpw6fDo28gZGUgdW0gZXhwZXJpbWVudG8uIAoKRXZlbnRvOiDDqSB1bSByZXN1bHRhZG8gZGUgdW1hIG1lZGnDp8OjbyBvdSBvYnNlcnZhw6fDo28gZGUgdW0gZmVuw7RtZW5vIHByb2JhYmlsw61zdGljby4gCgo8aDM+IEludHJvZHXDp8OjbzogQ2FydGFzIGRlIHVtIGJhcmFsaG88L2gzPgoKQ2FycmVnYW1vcyBhcyBiaWJsaW90ZWNhczogCmBgYHtyfQpsaWJyYXJ5KHRpZHl2ZXJzZSkKbGlicmFyeShndG9vbHMpCmBgYApEZWZpbmlyZW1vcyB1bSBiYXJhbGhvOiAKYGBge3J9Cm5haXBlcyA8LSBjKCJPdXJvcyIsICJDb3Jhw6fDtWVzIiwgIlBhdXMiLCAiRXNwYWRhcyIpCm51bWVyb3MgPC0gYygiQXMiLCAiRG9pcyIsICJUcsOqcyIsICJRdWF0cm8iLCAiQ2luY28iLCAiU2VpcyIsICJTZXRlIiwgIk9pdG8iLCAiTm92ZSIsICJEZXoiLCAiVmFsZXRlIiwgIlJhaW5oYSIsICJSZWkiKQpgYGAKRGVmaW5pbW9zIHVtYSBtZXNhIGRlIGNhcnRhczoKCmBgYHtyfQptZXNhIDwtIGV4cGFuZC5ncmlkKG5haXBlPW5haXBlcywgbnVtZXJvPW51bWVyb3MpCm1lc2EyIDwtcGFzdGUobWVzYSRudW1lcm8sIG1lc2EkbmFpcGUpCm1lc2EyCmBgYApSZXRpcmVtb3MgY2FydGFzIGRvIGJhcmFsaG86IHBvciBleGVtcGxvLCBxdWFsIMOpIGEgcHJvYmFiaWxpZGFkZSBkZSByZXRpcmFybW9zIHVtIHJlaT8KYGBge3J9CjQvNTIKYGBgClZhbW9zIHJlb2J0ZXIgZXN0ZSByZXN1bHRhZG8gYSBwYXJ0aXIgZGFzIGNhcnRhcyBkbyBiYXJhbGhvLiBEZXRlcm1pbmVtb3MgYXMgY2FydGFzICJSZWkiOgpgYGB7cn0KcmVpcyA8LXBhc3RlKCJSZWkiLG5haXBlcykKcmVpcwpgYGAKRXhhbWluZW1vcyB0b2RvIGEgYmFyYWxobyBlIHZlcmlmaXF1ZW1vcyBxdWFudGFzIGNhcnRhcyBzw6NvICJSZWkiOiAKCmBgYHtyfQptZXNhMiAlaW4lIHJlaXMKYGBgClBvZGVtb3Mgb2J0ZXIgYSBwcm9wb3LDp8OjbyBkZSBjYXJ0YXMgIlJlaSIgbm8gYmFyYWxobywgY2FsY3VsYW5kbyBhIHN1YSBwcm9wb3LDp8OjbzoKYGBge3J9Cm1lYW4obWVzYTIgJWluJSByZWlzKQpgYGAKCnF1ZSDDqSBvIHJlc3VsdGFkbyBlc3BlcmFkbywgNC81Mj0xLzEzLgoKPGgzPiBQZXJtdXRhw6fDtWVzIDwvaDM+Cgo8aDU+RXhlbXBsbyAxPC9oNT4KU3Vwb25oYW1vcyBxdWUgcXVlcmVtb3Mgc2VsZWNpb25hciAyIGVsZW1lbnRvcyBkZSB1bSBncnVwbyBkZSA1IGVsZW1lbnRvcy4gT3MgcG9zc8OtdmVpcyBtb2RvcyBzw6NvIGRhZG9zIHBvcgoKYGBge3J9CnBlcm11dGF0aW9ucyg1LDIpCmBgYApOb3RlIHF1ZSBhIG9yZGVtIGltcG9ydGEgZSBuw7ptZXJvcyByZXBldGlkb3MgbsOjbyBvY29ycmVtLiAKPGg1PkV4ZW1wbG8gMiA8L2g1PgpGYcOnYW1vcyB1bWEgcGVybXV0YcOnw6NvIChhcnJhbmpvKSBkZSA0IG7Dum1lcm9zLCAzLDQsNSw2IGUgZ3J1cG9zIGRlIDMgZWxlbWVudG9zLiBEZSB1bSBtb2RvIG1haXMgY29uY3JldG8sIHNlIHRlbW9zIHVtYSBjYWl4YSBjb20gNCBib2xhcyBtYXJjYWRhcyBjb20gbsO6bWVyb3MsIHF1YWlzIHPDo28gb3MgcG9zc8OtdmVpcyByZXN1bHRhZG9zIHNlIHNlbGVjaW9uYXJtb3MgMyBib2xhcyBhbGVhdG9yaWFtZW50ZT8KYGBge3J9Cm0gPC0gcGVybXV0YXRpb25zKDQsMyxjKDMsNCw1LDYpKQptCmBgYApQb3J0YW50bywgbyBuw7ptZXJvIGRlIG1vZG9zIMOpIDI0LCBvIHF1ZSBwb2RlbW9zIG9idGVyIGNvbnRhbmRvIG8gbsO6bWVybyBkZSBsaW5oYXMgZGUgJG0kOiAKYGBge3J9Cm4gPC1ucm93KG0pCm4KYGBgClNlIHF1aXNlcm1vcyBzZWxlY2lvbmFyIGxpbmhhcyBlc3BlY8OtZmljYXMgZGUgJG0kIChkaWdhbW9zIDEyLCAxMyBlIDE0KSwgcHJvY2VkZW1vcyBkbyBzZWd1aW50ZSBtb2RvOiAKYGBge3J9Cm1bMTI6MTQsXQpgYGAKQSBhdXPDqm5jaWEgZGUgbsO6bWVybyBhcMOzcyBhIHbDrXJndWxhIHNpZ25pZmljYSBxdWUgcXVlcmVtb3MgdG9kYXMgYXMgY29sdW5hcyBkZSAkbSQuIAoKRmHDp2Ftb3MgYSBzaW11bGHDp8OjbyBkZSA2IGVzY29saGFzIGFsZWF0w7NyaWFzIGRlIDMgYm9sYXMgKGFtb3N0cmFnZW0pOiAKCmBgYHtyfQppbmRpY2UgPC1zYW1wbGUobiwgNikKaW5kaWNlCmBgYApPdSBzZWphLCBhcyBib2xhcyBzZWxlY2lvbmFkYXMgc8OjbyBhcyBzZWd1aW50ZXM6CgpgYGB7cn0KbVtpbmRpY2UsXQpgYGAKPGg1PiBFeGVtcGxvIDMgPC9oNT4KClNpbXVsZSBhIHNlbGXDp8OjbyBhbGVhdMOzcmlhIGRlIDUgbsO6bWVyb3MgZGUgNyBkw61naXRvcy4gCgpJbmljaWFsbWVudGUgY29udGFtb3MgbyBuw7ptZXJvIHRvdGFsIGRlIHBvc3NpYmlsaWRhZGVzIChlc3Bhw6dvIGFtb3N0cmFsKToKCmBgYHtyfQpudW1lcm9zIDwtIHBlcm11dGF0aW9ucygxMCw3LGMoMDo5KSkKaGVhZChudW1lcm9zKQpgYGAKYGBge3J9Cm4gPC0gbnJvdyhudW1lcm9zKQpuCmBgYApEZW50cmUgZXN0YXMgNjA0NTAwIHBvc3NpYmlsaWRhZGVzIChsaW5oYXMpIHNlbGVjaW9uZW1vcyA1IG7Dum1lcm9zOiAKCmBgYHtyfQppbmRpY2UgPC0gc2FtcGxlKG4sNSkKaW5kaWNlCmBgYApPcyBuw7ptZXJvcyBjb3JyZXNwb25kZW50ZXMgYSBlc3RhcyBsaW5oYXMgc8OjbzoKCmBgYHtyfQpudW1lcm9zW2luZGljZSxdCmBgYAoKPGgzPiBQcm9iYWJpbGlkYWRlIENvbmRpY2lvbmFsIDwvaDM+Cgo8aDU+IEV4ZW1wbG8gNCA8L2g1PgoKQ2FsY3VsZW1vcyBhIHByb2JhYmlsaWRhZGUgZGUgcXVlIGEgc2VndW5kYSBjYXJ0YSBzZWxlY2lvbmFkYSBkbyBiYXJhbGhvIHNlamEgIlJlaSIsIGRhZG8gcXVlIGEgcHJpbWVpcmEgY2FydGEgc2VsZWNpb25hZGEgdGVuaGEgc2lkbyAiUmVpIi4gU2FiZW1vcyBxdWUgbyByZXN1bHRhZG8gw6kgCmBgYHtyfQozLzUxCmBgYApObyBlbnRhbnRvLCBvIHByb2NlZGltZW50byAgaWx1c3RyYXLDoSBvIHByb2NlZGltZW50byBhIHNlciB1dGlsaXphZG8gZW0gY2Fzb3MgbWFpcyBjb21wbGljYWRvcy4gCgpDb21wdXRlbW9zIHRvZG9zIG9zIHBvc3PDrXZlaXMgbW9kbyBkZSBzZSBzZWxlY2lvbmFyIGR1YXMgY2FydGFzLCBxdWFuZG8gYSBvcmRlbSDDqSByZWxldmFudGU6CgpgYGB7cn0KbWFvcyA8LXBlcm11dGF0aW9ucyg1MiwyLCBtZXNhMikKaGVhZChtYW9zKQpgYGAKTyBuw7ptZXJvIHRvdGFsIGRlIG3Do29zIMOpOiAKYGBge3J9Cm5yb3cobWFvcykKYGBgClBvciBleGVtcGxvLCBhIHByaW1laXJhIGNhcnRhIHNlbGVjaW9uYWRhIMOpICAKYGBge3J9CnByaW1laXJhX2NhcnRhIDwtIG1hb3NbLDFdCmBgYAoKQSBzZWd1bmRhIGNhcnRhIHNlbGVjaW9uYWRhIMOpIAoKYGBge3J9CnNlZ3VuZGFfY2FydGEgPC0gbWFvc1ssMl0KYGBgCgpWZWphbW9zIGVtIHF1YW50b3MgY2Fzb3MsIGEgY2FydGEgw6kgIlJlaSI6CgpgYGB7cn0KayA8LXN1bShwcmltZWlyYV9jYXJ0YSAlaW4lIHJlaXMpCmsKYGBgCkRldmVtb3MgYWdvcmEgZGV0ZXJtaW5hciwgZW50cmUgZXN0ZXMgMjA0IGNhc29zLCBxdWFsIMOpIGEgcHJvcG9yw6fDo28gZGUgY2FydGEgIlJlaSIgbmEgc2VndW5kYSBjYXJ0YS4gCmBgYHtyfQpzdW0ocHJpbWVpcmFfY2FydGEgJWluJSByZWlzICYgc2VndW5kYV9jYXJ0YSAlaW4lIHJlaXMpL3N1bShwcmltZWlyYV9jYXJ0YSAlaW4lIHJlaXMpCmBgYApOb3RlbW9zIHF1ZSBlc3RlIHJlc3VsdGFkbyBwb2RlIHNlciBvYnRpZG8gY2FsY3VsYW5kbyBtw6lkaWFzOiAKCmBgYHtyfQptZWFuKHByaW1laXJhX2NhcnRhICVpbiUgcmVpcyAmIHNlZ3VuZGFfY2FydGEgJWluJSByZWlzKS9tZWFuKHByaW1laXJhX2NhcnRhICVpbiUgcmVpcykKYGBgCkVzdGFzIHJlbGHDp8O1ZXMgc8OjbyByZXByZXNlbnRhw6fDtWVzIGRhIHJlbGHDp8OjbyBmdW5kYW1lbnRhbCBwYXJhIHByb2JhYmlsaWRhZGVzIGNvbmRpY2lvbmFpczoKCiQkClByKEJ8QSk9IFxmcmFje1ByKEEgXGNhcCBCKX17UHIoQSl9XCwuCiQkCgo8aDM+IEV4ZXJjw61jaW9zIDEgPC9oMz4KCjEuIFNpbXVsZSAxMCBzZWxlw6fDtWVzIGFsZWF0w7NyaWFzIGRlIDUgYm9sYXMgbnVtZXJhZGFzIGRlICA3IGEgMjUuIDxicj4KPGJyPgoyLiBEZXRlcm1pbmUgdG9kb3Mgb3MgY2Fzb3MgZGUgIHNlbGXDp8O1ZXMgZGUgNCBjYXJ0YXMgZGUgdW0gYmFyYWxobyBuYXMgcXVhaXMgYSB0ZW1vcyB0csOqcyBjYXJ0YXMgY29tIG5haXBlIGVzcGFkYXMuIFF1YWwgw6kgYSBwcm9iYWJpbGlkYWRlIGRlIHF1ZSB0YWwgZXZlbnRvIG9jb3JyYT8gIA==