require(gtools)
require(tidyverse)
require(ggforce)  
options(kableExtra.latex.load_packages = TRUE)
require(kableExtra)
require(mosaicCalc)
require(gridExtra)
require(numDeriv)
require(DT)
#Para numerar tabelas e figuras:
require(captioner)
fig_nums <- captioner(prefix = "Figura")
table_nums <- captioner(prefix = "Tabela")
quadro_nums<- captioner(prefix="Quadro")

Introdução

Encontramos na natureza dois tipos de fenômenos: determinísticos e aleatórios.

  • Os fenômenos determinísticos são aqueles em que os resultados são sempre os mesmos, qualquer que seja o número de ocorrências verificadas. Como exemplo,
    • os quadrados de inteiros ímpares são sempre ímpares;
    • a água ferve a 100°C;
  • Nos fenômenos aleatórios, os resultados não serão previsíveis, mesmo que haja um grande número de repetições do mesmo fenômeno.

Referências:

  • Milone, G., Estatística Geral e Aplicada. Ed. Cengage Learning.

Fenômeno Aleatório

No nosso dia-a-dia, em maior ou menor grau, nos deparamos com o acaso. Por exemplo, da afirmação “é provável que meu time ganhe a partida hoje” pode resultar em:

  • que, apesar do favoritismo, ele perca;
  • que, como pensamos, ele ganhe;
  • que empate.

Como vimos, o resultado final depende do acaso. Fenômenos como esse são chamados fenômenos aleatórios ou experimentos aleatórios.

Definição: Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.

Referências:

  • Morettin, L.G., Estatística Básica - Probabilidade e Inferência. Ed. Pearson.

Exemplos de experimentos aleatórios: Lançamento de uma moeda honesta; lançamento de um dado; retirada de uma carta de um baralho completo de 52 cartas (jogos de azar); determinação da vida útil de um componente eletrônico.

Exemplo 1: Lançamento de uma moeda. Descrição do espaço amostral com duas possibilidades:
Figura  1: Moeda

Figura 1: Moeda

Fonte: Foto de Plínio Pierry

Vamos jogar? Eu Lancei uma moeda e o resultado foi “cara” (face com o rosto de Juscelino Kubitschek), através da função sample do R:

moeda=c("cara","coroa")
sample(moeda,size=1)
## [1] "cara"

Exemplo 2: Lançamento de um dado:

Figura  2: Dado

Figura 2: Dado

Fonte da Figura

Vamos jogar? Eu Lancei um dado e o resultado foi “2”, através da função sample do R. Mas quando você lançar o resultado pode ser diferente!

dado=1:6
sample(dado,size=1)
## [1] 2

Exemplo 3: Criando uma rifa com 55 números:

rifa=1:55
rifa
##  [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
## [26] 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
## [51] 51 52 53 54 55

Resultado da rifa com dois ganhadores - o sorteio é sem reposição!

sample(rifa,2,replace=FALSE)
## [1] 42 29

Sorteio da rifa com semente única - vai dar sempre o mesmo resultado!

set.seed(24062021) # SEED => SEMENTE EM INGLES
sample(rifa,2,replace=FALSE)
## [1] 26 34

Espaço Amostral

é o conjunto de todos os resultados possíveis de um experimento aleatório. É representado pela letra grega Ω (lê-se “ômega”).

Eventos

Aos subconjuntos do espaço amostral denominamos eventos. Os eventos contém elementos ou pontos amostrais do espaço amostral \(\Omega\). Sempre que um experimento for realizado, supõe-se que ocorrerá um e somente um evento. Eventos são representados pelas letras latinas maiúsculas A,B,C,…. Um evento pode ser um resultado ou subconjunto de resultados de um experimento.

Exemplo 4 Utilizando linguagem de conjuntos: \[ \small \begin{array}{| l l l |} \hline &\square \mbox{ Lançamento de uma moeda; } \\ &\mbox{Resultados possíveis: } \\ &\left\{ \begin{array}{cl} \mbox{cara (ca)}\\ \mbox{coroa (co)} \end{array} \right. \Rightarrow \Omega = \{\mbox{ca}, \mbox{co} \}\\ \hline \end{array} \begin{array}{| l l l |} \hline \square \mbox{ Lançamento de um dado}\\ \mbox{Resultados possíveis:}\\ 1, 2, 3, 4, 5, 6\\ \Rightarrow \Omega = \left\{1, 2, 3, 4, 5, 6\right\}\\ \mbox{ evento "face voltada para cima é par":}\\ B = \left\{2,4,6\right\} \\ \hline \end{array} \]

Operações com Eventos Aleatórios

União

A união de dois eventos \(A\) e \(B\) representa a ocorrência de pelo menos um dos eventos \(A\) ou \(B\). O evento resultante é \(A \cup B\). Logo:
\(A\cup B\): lê-se “\(A\) união \(B\). Na Figura abaixo, a União é representada pela junção dos dois círculos.

Intersecção

A intersecção de dois eventos \(A\) e \(B\) corresponde a ocorrência simultânea de \(A\) e \(B\) (ver Figura \(\ref{venn3}\)). Seguindo a notação da teoria de conjuntos, a intersecção de dois eventos será representada por \(A\cap B\): Na Figura abaixo, a intersecção é representada pela área do meio, onde os dois círculos se sobrepoem.

Note que: \(x \in A\cap B \Longleftrightarrow x\in A\) e \(x \in B\). Lê-se: “x pertence a A intersecção B se e somente se x pertence a A e x pertence a B.”

df.venn <- data.frame(x = c(0.866, -0.866),
                      y = c(-0.5, -0.5),
                      labels = c('A', 'B'))
ggplot(df.venn, aes(x0 = x, y0 = y, r = 1.5, fill = labels)) +
    geom_circle(alpha = .3, size = 1, colour = 'grey') +
      coord_fixed() +
        theme_void()

Figura 3: União & Intersecção de eventos

Exemplo 5: Considere a Figura abaixo. Expresse, em notação de conjuntos, os eventos definidos por cada uma das áreas numeradas.

data = data.frame(x = c(0, 1, -1),
                   y = c(-0.5, 1, 1),
                   tx = c(0, 1.5, -1.5),
                   ty = c(-1, 1.3, 1.3),
                   cat = c('7', '2', 
                           '1'))
ggplot(data, aes(x0 = x , y0 = y, r = 1.5, fill = cat)) + 
  geom_rect(aes(xmin = -Inf, xmax = Inf, ymin = -Inf, ymax = 3), fill = "palegreen", alpha = 0.2) +
        geom_circle(alpha = 0.25, size = 1, color = "black",show.legend = FALSE) + 
        geom_text(aes(x = tx , y = ty, label = cat), size = 7) +
        annotate(geom="text", x=0, y=1.5, label="3",color="purple", size = 5) +
        annotate(geom="text", x=-0.9, y=0, label="5",color="darkorange", size = 5) +
        annotate(geom="text", x=0.9, y=0, label="6",color="darkgreen", size = 5) +
        annotate(geom="text", x=0, y=,.5, label="4",color="blue", size = 5) +
  annotate(geom="text", x=-1.2, y=2.8, label="A", size = 5) +
  annotate(geom="text", x=1.2, y=2.8, label="B", size = 5) +
  annotate(geom="text", x=1.2, y=-1.8, label="C", size = 5) +
  annotate(geom="text", x=2.9, y=-1.8, label=expression(Omega), size = 5) +
  annotate(geom="text", x=-2.9, y=-1.8, label="8", size = 5) +
        theme_void() 
Figura  4: Diagrama de Venn

Figura 4: Diagrama de Venn

Solução: \[ \small \begin{array}{|llll|} \hline \mbox{Area 1:} && A \cap B^c \cap C^c\\ \mbox{Area 2:} && A^c \cap B \cap C^c\\ \mbox{Area 3:} && A \cap B \cap C^c\\ \mbox{Area 4:} && A \cap B \cap C\\ \hline \end{array} \begin{array}{|llll|} \hline \mbox{Area 5:} && A \cap B^c \cap C\\ \mbox{Area 6:} && A^c \cap B\cap C\\ \mbox{Area 7:} && A^c \cap B^c \cap C\\ \mbox{Area 8:} && (A \cup B \cup C)^c \mbox{ ou seja,} (A^c \cap B^c \cap C^c)\\ \hline \end{array} \]

Exemplo 6: A probabilidade de um gato estar vivo daqui a 5 anos é \(\frac{3}{5}\). A probabilidade de um cão estar vivo daqui a 5 anos é \(\frac{4}{5}\). Considerando os eventos independentes, a probabilidade de:

    1. somente o cão estar vivo daqui a 5 anos.
    1. o cão estar vivo e o gato estar vivo. \[ \small \begin{array}{|llll|} \hline \mbox{ Sejam os eventos: } \left\{ \begin{array}{ll} \mbox{G}: \mbox{ O gato estar vivo daqui a 5 anos}\\ \mbox{C}: \mbox{ O cão estar vivo daqui a 5 anos} \end{array} \right.\\ \begin{array}{ll} & a) & P(\mbox{G}^c \cap \mbox{C}) = P(\mbox{C}) - P(\mbox{G} \cap \mbox{C}) = \frac{4}{5}-\frac{3.4}{5.5}=\frac{20-12}{25}=\frac{8}{25}\\ & b) & P(\mbox{G} \cap \mbox{C}) = \frac{3.4}{5.5}=\frac{12}{25} \end{array}\\ \hline \end{array} \]

Diagrama de Venn:

df.venn <- data.frame(x = c(0.866, -0.866),
                      y = c(-0.5, -0.5),
                      labels = c('Gato', 'Cão'))
ggplot(df.venn, aes(x0 = x, y0 = y, r = 1.5, fill = labels)) +
  geom_rect(aes(xmin = -Inf, xmax = Inf, ymin = -Inf, ymax =1.2), fill = "palegreen", alpha = 0.2) +
    geom_circle(alpha = .3, size = 1, colour = 'grey') +
      coord_fixed() +
        theme_void()+
  annotate(geom="text", x=-1.2, y=0.5, label="8/25", size = 5) +
  annotate(geom="text", x=0, y=0, label="12/25", size = 5) +
  annotate(geom="text", x=1.2, y=0.5, label="3/25", size = 5) +
  annotate(geom="text", x=2.9, y=-1.8, label=expression(Omega), size = 5) +
    annotate(geom="text", x=-2.9, y=-1.8, label="2/25", size = 5) +
        theme_void() 

Figura 5: Diagrama de Venn

Exemplo 7: Em uma cidade, existem 3 jornais: A, B e C. A porcentagem de indivíduos que leem esses jornais são as seguintes:

jornais=c("A","B","C","A e B", "B e C","C e A","A, B e C")
porcentagem=c("10%","30%","5%","8%","4%","2%","1%")
dados=cbind(jornais,porcentagem)
datatable(dados,caption=table_nums("tab1","Resultados da Pesquisa"),options = list(columnDefs=list(list(class="dt-center",targets=list(1,2)),
                                    list(width = '20%', targets = list(1,2)))))

Obtenha a probabilidade de que um morador da cidade selecionado ao acaso:

    1. Leia só o jornal C.
    1. Leia apenas um jornal.
    1. Leia pelo menos dois jornais.
    1. Não leia nenhum jornal.

Diagrama de Venn:

df.venn = data.frame(x = c(0, 1, -1),
                   y = c(-0.5, 1, 1),
                   tx = c(0, 1.5, -1.5),
                   ty = c(-1, 1.3, 1.3),
                   cat = c('0%', '19%', 
                           '1%'),
                      labels = c('Jornal C', 'Jornal B','Jornal A'))
ggplot(df.venn, aes(x0 = x, y0 = y, r = 1.5, fill = labels)) +
  geom_rect(aes(xmin = -Inf, xmax = Inf, ymin = -Inf, ymax =3), fill = "palegreen", alpha = 0.2) +
    geom_circle(alpha = .3, size = 1, colour = 'grey') +
      coord_fixed() +
   geom_text(aes(x = tx , y = ty, label = cat), size = 7) +
       annotate(geom="text", x=0, y=1.5, label="7%",color="purple", size = 5) +
        annotate(geom="text", x=-0.9, y=0, label="1%",color="darkorange", size = 5) +
        annotate(geom="text", x=0.9, y=0, label="3%",color="darkgreen", size = 5) +
        annotate(geom="text", x=0, y=,.5, label="1%",color="blue", size = 5) +
    annotate(geom="text", x=-2.9, y=-1.8, label="68%", size = 5) +
        theme_void() 

Figura 6: Diagrama de Venn para os jornais

\[ \small \begin{array}{|lcl|} \hline &a) & P(C\cap A^c\cap B^c)=0\%\\ &b) & P(A\cap B^c\cap C^c)+P(A^c \cap B \cap C^c)+P(A^c \cap B^c \cap C)=1\%+19\%+0\%=20\%\\ &c) & P(A\cap B)+P(A \cap B^c \cap C)+P(A^c \cap B \cap C)=8\%+1\%+3\%=12\%\\ &d) & P(A\cup B \cup C)^c=68\%\\ \hline \end{array} \]

Exercício 1: Considere um espaço amostral formado pelos resultados possíveis de um baralho de cartas, com números variando de 1 até 10, o evento A representa a ocorrência de números ímpares, e o evento B representa a ocorrência de números primos (maiores do que 1). Represente os eventos no diagrama de Venn e também em linguagem de conjuntos, utilizando as operações união, intersecção e complementar. Sugestão: utilize esta lição do geogebra: https://www.geogebra.org/m/UPTcEmRU

  1. Os eventos A e B ocorrem simultaneamente;
  2. O evento A ocorre, mas o evento B não ocorre;
  3. Pelo menos um dos eventos A ou B ocorrem;
  4. O evento B ocorre, mas o evento A não ocorre;
  5. Ocorre no máximo um evento;
  6. O evento A não ocorre;
  7. Nenhum dos eventos ocorrem;
  8. O evento B não ocorre.

Exercício 2: (adaptado da PM ES – AOCP) Foram oferecidos cursos para um grupo de soldados: Combate a Incêndio (I), Busca e Salvamento (S) ou Atendimento Pré-hospitalar (H). Os resultados foram os seguintes:

dados=data.frame(
  soldados=c("I","S","H","I e S","S e H","H e I", "I, S e H","não se inscreveram"),
  quantidade=c(59,56,33,50,23,25,20,2)
)
dados
##             soldados quantidade
## 1                  I         59
## 2                  S         56
## 3                  H         33
## 4              I e S         50
## 5              S e H         23
## 6              H e I         25
## 7           I, S e H         20
## 8 não se inscreveram          2

Sugestão: utilize esta lição do geogebra https://www.geogebra.org/m/XUH9erSR

  1. Construa o diagrama de Venn para este problema;
  2. Determine o número de soldados deste problema;
  3. Determine o número de soldados que só optaram pelo curso I;
  4. Determine o número de soldados que não optaram pelo curso I nem pelo curso H;
  5. Determine o número de soldados que optaram por no mínimo dois cursos;
  6. Determine o número de soldados que optaram por no máximo dois cursos.