Modelo probabilístico: descrição quantitativa de enventos incertos do mundo real.
Definição de um modelo probabilístico:
Descreva os possíveis resultados do experimento (especifique o *espaço amostral).
Especifique a lei probabilística que atribui probabilidades aos resultados.
Interpretação frequentista de probabilidade: proporções de eventos resultantes da repetição de um experimento.
Evento: é um resultado de uma medição ou observação de um fenômeno probabilístico.
Carregamos as bibliotecas:
library(tidyverse)
library(gtools)
Definiremos um baralho:
naipes <- c("Ouros", "Corações", "Paus", "Espadas")
numeros <- c("As", "Dois", "Três", "Quatro", "Cinco", "Seis", "Sete", "Oito", "Nove", "Dez", "Valete", "Rainha", "Rei")
Definimos uma mesa de cartas:
mesa <- expand.grid(naipe=naipes, numero=numeros)
mesa2 <-paste(mesa$numero, mesa$naipe)
mesa2
[1] "As Ouros" "As Corações" "As Paus" "As Espadas" "Dois Ouros" "Dois Corações"
[7] "Dois Paus" "Dois Espadas" "Três Ouros" "Três Corações" "Três Paus" "Três Espadas"
[13] "Quatro Ouros" "Quatro Corações" "Quatro Paus" "Quatro Espadas" "Cinco Ouros" "Cinco Corações"
[19] "Cinco Paus" "Cinco Espadas" "Seis Ouros" "Seis Corações" "Seis Paus" "Seis Espadas"
[25] "Sete Ouros" "Sete Corações" "Sete Paus" "Sete Espadas" "Oito Ouros" "Oito Corações"
[31] "Oito Paus" "Oito Espadas" "Nove Ouros" "Nove Corações" "Nove Paus" "Nove Espadas"
[37] "Dez Ouros" "Dez Corações" "Dez Paus" "Dez Espadas" "Valete Ouros" "Valete Corações"
[43] "Valete Paus" "Valete Espadas" "Rainha Ouros" "Rainha Corações" "Rainha Paus" "Rainha Espadas"
[49] "Rei Ouros" "Rei Corações" "Rei Paus" "Rei Espadas"
Retiremos cartas do baralho: por exemplo, qual é a probabilidade de retirarmos um rei?
4/52
[1] 0.07692308
Vamos reobter este resultado a partir das cartas do baralho. Determinemos as cartas “Rei”:
reis <-paste("Rei",naipes)
reis
[1] "Rei Ouros" "Rei Corações" "Rei Paus" "Rei Espadas"
Examinemos todo a baralho e verifiquemos quantas cartas são “Rei”:
mesa2 %in% reis
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[22] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[43] FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE
Podemos obter a proporção de cartas “Rei” no baralho, calculando a sua proporção:
mean(mesa2 %in% reis)
[1] 0.07692308
que é o resultado esperado, 4/52=1/13.
Suponhamos que queremos selecionar 2 elementos de um grupo de 5 elementos. Os possíveis modos são dados por
permutations(5,2)
[,1] [,2]
[1,] 1 2
[2,] 1 3
[3,] 1 4
[4,] 1 5
[5,] 2 1
[6,] 2 3
[7,] 2 4
[8,] 2 5
[9,] 3 1
[10,] 3 2
[11,] 3 4
[12,] 3 5
[13,] 4 1
[14,] 4 2
[15,] 4 3
[16,] 4 5
[17,] 5 1
[18,] 5 2
[19,] 5 3
[20,] 5 4
Note que a ordem importa e números repetidos não ocorrem.
Façamos uma permutação (arranjo) de 4 números, 3,4,5,6 e grupos de 3 elementos. De um modo mais concreto, se temos uma caixa com 4 bolas marcadas com números, quais são os possíveis resultados se selecionarmos 3 bolas aleatoriamente?
m <- permutations(4,3,c(3,4,5,6))
m
[,1] [,2] [,3]
[1,] 3 4 5
[2,] 3 4 6
[3,] 3 5 4
[4,] 3 5 6
[5,] 3 6 4
[6,] 3 6 5
[7,] 4 3 5
[8,] 4 3 6
[9,] 4 5 3
[10,] 4 5 6
[11,] 4 6 3
[12,] 4 6 5
[13,] 5 3 4
[14,] 5 3 6
[15,] 5 4 3
[16,] 5 4 6
[17,] 5 6 3
[18,] 5 6 4
[19,] 6 3 4
[20,] 6 3 5
[21,] 6 4 3
[22,] 6 4 5
[23,] 6 5 3
[24,] 6 5 4
Portanto, o número de modos é 24, o que podemos obter contando o número de linhas de \(m\):
n <-nrow(m)
n
[1] 24
Se quisermos selecionar linhas específicas de \(m\) (digamos 12, 13 e 14), procedemos do seguinte modo:
m[12:14,]
[,1] [,2] [,3]
[1,] 4 6 5
[2,] 5 3 4
[3,] 5 3 6
A ausência de número após a vírgula significa que queremos todas as colunas de \(m\).
Façamos a simulação de 6 escolhas aleatórias de 3 bolas (amostragem):
indice <-sample(n, 6)
indice
[1] 14 2 20 19 22 17
Ou seja, as bolas selecionadas são as seguintes:
m[indice,]
[,1] [,2] [,3]
[1,] 5 3 6
[2,] 3 4 6
[3,] 6 3 5
[4,] 6 3 4
[5,] 6 4 5
[6,] 5 6 3
Simule a seleção aleatória de 5 números de 7 dígitos.
Inicialmente contamos o número total de possibilidades (espaço amostral):
numeros <- permutations(10,7,c(0:9))
head(numeros)
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 0 1 2 3 4 5 6
[2,] 0 1 2 3 4 5 7
[3,] 0 1 2 3 4 5 8
[4,] 0 1 2 3 4 5 9
[5,] 0 1 2 3 4 6 5
[6,] 0 1 2 3 4 6 7
n <- nrow(numeros)
n
[1] 604800
Dentre estas 604500 possibilidades (linhas) selecionemos 5 números:
indice <- sample(n,5)
indice
[1] 310783 533691 405112 145273 171761
Os números correspondentes a estas linhas são:
numeros[indice,]
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 5 1 2 9 8 0 6
[2,] 8 7 3 2 4 5 6
[3,] 6 7 2 1 9 4 8
[4,] 2 4 6 9 5 7 0
[5,] 2 8 5 4 3 0 1
Calculemos a probabilidade de que a segunda carta selecionada do baralho seja “Rei”, dado que a primeira carta selecionada tenha sido “Rei”. Sabemos que o resultado é
3/51
[1] 0.05882353
No entanto, o procedimento ilustrará o procedimento a ser utilizado em casos mais complicados.
Computemos todos os possíveis modo de se selecionar duas cartas, quando a ordem é relevante:
maos <-permutations(52,2, mesa2)
head(maos)
[,1] [,2]
[1,] "As Corações" "As Espadas"
[2,] "As Corações" "As Ouros"
[3,] "As Corações" "As Paus"
[4,] "As Corações" "Cinco Corações"
[5,] "As Corações" "Cinco Espadas"
[6,] "As Corações" "Cinco Ouros"
O número total de mãos é:
nrow(maos)
[1] 2652
Por exemplo, a primeira carta selecionada é
primeira_carta <- maos[,1]
A segunda carta selecionada é
segunda_carta <- maos[,2]
Vejamos em quantos casos, a carta é “Rei”:
k <-sum(primeira_carta %in% reis)
k
[1] 204
Devemos agora determinar, entre estes 204 casos, qual é a proporção de carta “Rei” na segunda carta.
sum(primeira_carta %in% reis & segunda_carta %in% reis)/sum(primeira_carta %in% reis)
[1] 0.05882353
Notemos que este resultado pode ser obtido calculando médias:
mean(primeira_carta %in% reis & segunda_carta %in% reis)/mean(primeira_carta %in% reis)
[1] 0.05882353
Estas relações são representações da relação fundamental para probabilidades condicionais:
\[ Pr(B|A)= \frac{Pr(A \cap B)}{Pr(A)}\,. \]