Instruções: Resolva todos os exercícios, justificando cada passo. Exercícios marcados com 🟢 são básicos, 🟡 intermediários e 🔴 avançados. Os exercícios em verde exigem código R; os em amarelo usam dados da Copa 2026.


Bloco 1 — Espaço Amostral e Eventos

Exercício 1 🟢

Um sistema computacional monitora o estado de um servidor. O servidor pode estar em um dos seguintes estados: operacional (O), degradado (D) ou offline (F).

(a) Defina o espaço amostral \(\Omega\) desse experimento.

(b) Defina os seguintes eventos e calcule \(|A|\), \(|B|\) e \(|C|\):

  • \(A\) = “o servidor está disponível para usuários” (operacional ou degradado)
  • \(B\) = “o servidor não está operacional”
  • \(C\) = “o servidor está completamente fora do ar”

(c) Verifique se \(B = C^c\). Justifique.

(d) Calcule \(A \cap B\) e interprete o resultado.

Exercício 2 🟢

Um sistema tem dois servidores independentes, A e B. Cada um pode estar operacional (O) ou com falha (F).

(a) Liste todos os elementos do espaço amostral \(\Omega\) usando pares ordenados \((estado_A,\; estado_B)\).

(b) Defina os eventos:

  • \(E_1\) = “o servidor A está operacional”
  • \(E_2\) = “pelo menos um servidor está com falha”
  • \(E_3\) = “o sistema está completamente inoperante” (ambos com falha)

(c) Liste os elementos de \(E_1 \cup E_2\), \(E_1 \cap E_2\) e \(E_3^c\).

(d) \(E_1\) e \(E_3\) são mutuamente exclusivos? Justifique.

Exercício 3 🟡

Uma fábrica produz microchips. Um inspetor retira três peças ao acaso e classifica cada uma como conforme (C) ou defeituosa (D).

(a) Quantos elementos tem \(\Omega\)? Liste-os.

(b) Defina o evento \(A\) = “exatamente uma peça defeituosa”. Liste seus elementos.

(c) Defina o evento \(B\) = “a primeira peça é conforme”. Liste seus elementos.

(d) Calcule \(A \cap B\), \(A \cup B\) e \(A^c\). Descreva esses eventos em linguagem natural.

(e) \(A\) e \(B\) são mutuamente exclusivos? São complementares? Explique.

Exercício 4 🟡

Uma empresa de TI registra os tempos de resposta (em milissegundos) de suas requisições. O servidor é classificado como: rápido (< 100 ms), aceitável (100–300 ms) ou lento (> 300 ms).

Duas requisições consecutivas são monitoradas.

(a) Defina \(\Omega\).

(b) Descreva e liste os elementos de: - \(A\) = “ambas as requisições são rápidas” - \(B\) = “ao menos uma requisição é lenta” - \(C\) = “as duas requisições têm o mesmo nível de desempenho”

(c) \(B\) e \(C\) podem ocorrer simultaneamente? Calcule \(B \cap C\).

(d) Verifique que \(A\), “ambas aceitáveis” e “demais casos” formam uma partição de \(\Omega\).


Bloco 2 — Probabilidade Clássica

Exercício 5 🟢

Em um time de desenvolvimento de software com 12 programadores (7 homens e 5 mulheres), um colaborador é escolhido aleatoriamente para apresentar o projeto.

(a) Qual a probabilidade de escolher uma mulher?

(b) Qual a probabilidade de não escolher o programador mais sênior do time?

(c) Se o sorteio for feito entre 3 finalistas previamente selecionados (2 homens e 1 mulher), como a probabilidade do item (a) muda?

Exercício 6 🟢

No lançamento de dois dados honestos de seis faces:

(a) Qual é \(|\Omega|\)?

(b) Calcule a probabilidade de: - A soma dos valores ser igual a 7. - A soma ser maior ou igual a 10. - Os dois dados mostrarem o mesmo valor. - A soma ser um número primo.

(c) Os eventos “soma = 7” e “soma ≥ 10” são mutuamente exclusivos? Verifique pela regra da adição.

Exercício 7 🟡

Um sistema de autenticação gera senhas automáticas de 4 dígitos (0–9), com repetição permitida.

(a) Quantas senhas distintas existem?

(b) Calcule a probabilidade de uma senha sorteada ao acaso: - Começar com o dígito 0. - Ter todos os dígitos iguais. - Ter todos os dígitos diferentes. - Ser um número par (terminar em dígito par).

(c) Verifique se os eventos “começa com 0” e “todos os dígitos iguais” são mutuamente exclusivos.

Exercício 8 🟢 ⚽ (Copa do Mundo 2026)

A Copa de 2026 contará com 48 seleções distribuídas por confederação: UEFA (16), CAF (9), AFC (8), CONCACAF (6), CONMEBOL (6), OFC (1), Repescagem (2).

Usando o modelo clássico (equiprobabilidade):

(a) Calcule a probabilidade de cada confederação ser campeã.

(b) Verifique o Axioma 2 somando todas as probabilidades.

(c) Calcule \(P(\text{seleção das Américas vencer}) = P(\text{CONMEBOL} \cup \text{CONCACAF})\).

(d) Qual a probabilidade de o campeão não ser europeu?

(e) Um aluno afirma: “Como há 48 seleções, todas têm exatamente 2,08% de chance.” Essa afirmação é correta dentro do modelo clássico? Ela é realista? Explique.


Bloco 3 — Probabilidade Frequentista

Exercício 9 🟡 ⚽ (Copa do Mundo — dados históricos)

Nas 22 edições da Copa do Mundo (1930–2022), os campeões foram:

País Títulos País Títulos
Brasil 5 França 2
Alemanha 4 Uruguai 2
Itália 4 Inglaterra 1
Argentina 3 Espanha 1

(a) Calcule \(P_{\text{freq}}\) de cada país vencer a próxima Copa, assumindo que o histórico é representativo.

(b) Calcule \(P_{\text{freq}}(\text{CONMEBOL vencer})\) e compare com \(P_{\text{clássico}} = 6/48\).

(c) O modelo frequentista atribui \(P = 0\) a CAF, AFC e outras confederações. Isso significa que é impossível uma seleção dessas confederações vencer? Quais são as limitações desse resultado?

(d) Usando o modelo frequentista, calcule: \[P(\text{seleção europeia vencer} \mid \text{última campeã foi sul-americana})\] Sugestão: filtre as edições em que o campeão anterior era da CONMEBOL e veja quantas delas foram seguidas de título europeu.

Exercício 10 🟡 💻 (Exercício com R — Frequentista e LGN)

Execute o código a seguir e responda às perguntas:

set.seed(3719)
n     <- 5000
dados <- sample(1:6, size = n, replace = TRUE)

# Frequência relativa acumulada de "sair 6"
freq_acum <- cumsum(dados == 6) / seq_len(n)

ggplot(data.frame(i = 1:n, freq = freq_acum), aes(x = i, y = freq)) +
  geom_line(color = "#0072B2") +
  geom_hline(yintercept = 1/6, linetype = "dashed", color = "#D73027") +
  labs(x = "Número de lançamentos", y = "Freq. relativa de '6'") +
  ylim(0, 0.5) + theme_minimal()

(a) Qual o valor teórico de \(P(\text{sair 6})\) para um dado justo? Onde ele aparece no gráfico?

(b) Descreva o comportamento da frequência relativa à medida que \(n\) cresce. Que resultado teórico esse comportamento ilustra?

(c) Modifique o código para calcular a frequência relativa acumulada de “sair número par”. O gráfico converge para o valor esperado?

(d) Aumente n para 50.000. O que acontece com as oscilações? Por quê?


Bloco 4 — Axiomas e Propriedades

Exercício 11 🟢

Para cada conjunto de valores abaixo, verifique se pode representar uma distribuição de probabilidade válida (isto é, satisfaz os axiomas de Kolmogorov). Justifique.

Caso \(P(A)\) \(P(B)\) \(P(C)\) \(A, B, C\) formam partição?
(a) 0,40 0,35 0,25 Sim
(b) 0,50 0,60 −0,10 Sim
(c) 0,30 0,30 0,30 Sim
(d) 0,70 0,20 0,10 Sim
(e) 1,00 0,50 0,00 Não

Exercício 12 🟡

Para eventos \(A\) e \(B\) com \(P(A) = 0{,}45\), \(P(B) = 0{,}30\) e \(P(A \cap B) = 0{,}15\):

(a) Calcule \(P(A \cup B)\).

(b) Calcule \(P(A^c)\), \(P(B^c)\) e \(P(A^c \cap B^c)\).

(c) \(A\) e \(B\) são mutuamente exclusivos? São independentes? Verifique formalmente.

(d) Calcule \(P(A \cup B^c)\).

(e) Verifique que \(P(A^c \cap B^c) = 1 - P(A \cup B)\) (Lei de De Morgan).

Exercício 13 🟡

Em uma rede de sensores industriais, sabe-se que:

  • \(P(\text{sensor A falha em 24h}) = 0{,}05\)
  • \(P(\text{sensor B falha em 24h}) = 0{,}08\)
  • \(P(\text{ambos falham em 24h}) = 0{,}004\)

(a) Calcule \(P(\text{ao menos um sensor falha em 24h})\).

(b) Calcule \(P(\text{nenhum sensor falha em 24h})\).

(c) Os eventos “A falha” e “B falha” são independentes? Justifique numericamente.

(d) Se houvesse um terceiro sensor C, também com \(P = 0{,}05\) e independente de A e B, qual seria a probabilidade de nenhum dos três falhar em 24h?


Bloco 5 — Probabilidade Condicional e Independência

Exercício 14 🟢

Em um sistema de monitoramento, 40% das requisições vêm de dispositivos móveis (M) e 60% de desktops (D). A probabilidade de erro é:

  • \(P(\text{erro} \mid M) = 0{,}06\)
  • \(P(\text{erro} \mid D) = 0{,}02\)

(a) Calcule \(P(\text{erro} \cap M)\) e \(P(\text{erro} \cap D)\).

(b) Calcule \(P(\text{erro})\) pela fórmula da probabilidade total.

(c) Dado que ocorreu um erro, qual a probabilidade de ter sido uma requisição mobile? Use o Teorema de Bayes.

(d) Interprete o resultado de (c): o erro é mais provável em mobile do que o esperado? Por quê?

Exercício 15 🟡

Uma empresa de software realiza testes em dois ambientes: Produção (P) e Homologação (H). 70% dos bugs são detectados em H e 30% chegam a P. Dos bugs que chegam a P, 80% são críticos. Dos bugs detectados em H, apenas 15% são críticos.

Seja \(C\) = “bug crítico” e \(H\), \(P\) os ambientes onde foi detectado.

(a) Calcule \(P(C)\) pela fórmula da probabilidade total.

(b) Dado que um bug é crítico, qual a probabilidade de ter passado pelo ambiente de produção?

(c) Um gerente afirma: “Se um bug crítico aparece, quase certamente passou direto para produção.” O resultado de (b) sustenta ou refuta essa afirmação?

Exercício 16 🟡

Num sistema de detecção de intrusão (IDS), sabe-se que:

  • 2% das conexões são ataques reais
  • O IDS detecta um ataque real com probabilidade 0,95 (sensibilidade)
  • O IDS gera um falso positivo (alarme sem ataque) com probabilidade 0,03

(a) Defina os eventos e calcule \(P(\text{alarme})\) pela probabilidade total.

(b) Dado que o IDS disparou um alarme, qual a probabilidade de ser um ataque real? Use o Teorema de Bayes.

(c) O resultado de (b) surpreende você? Discuta por que a prevalência baixa do ataque (2%) tem tanto impacto.

(d) Se a prevalência de ataques subir para 10% (e as demais probabilidades ficarem iguais), como \(P(\text{ataque real} \mid \text{alarme})\) muda? Calcule e compare.

Exercício 17 🟡 ⚽ (Copa do Mundo — probabilidade condicional)

Na Copa 2026, considere que as 4 semifinalistas serão escolhidas ao longo do torneio. Para fins deste exercício, suponha que as 4 vagas nas semifinais são preenchidas com probabilidades proporcionais às vagas de cada confederação.

(a) Sem nenhuma informação adicional, \(P(\text{CONMEBOL vence a Copa}) = 6/48\). Se soubermos que uma seleção da CONMEBOL chegou à semifinal, o espaço amostral muda. Discuta conceitualmente como \(P(\text{CONMEBOL vence} \mid \text{CONMEBOL na semifinal})\) se relaciona com \(P(\text{CONMEBOL vence})\).

(b) Pelos dados históricos (22 edições), a CONMEBOL chegou à final em 10 ocasiões. Nas 10 finais com a CONMEBOL, ela venceu em todas (pois foram títulos). Calcule \(P_{\text{freq}}(\text{título} \mid \text{final})\) para a CONMEBOL.

(c) Compare \(P_{\text{freq}}(\text{CONMEBOL título}) = 10/22\) com \(P_{\text{freq}}(\text{CONMEBOL título} \mid \text{CONMEBOL na final}) = 10/10\). O que essa diferença revela sobre o poder da informação condicional?


Bloco 6 — Probabilidade Total e Teorema de Bayes

Exercício 18 🟡

Uma empresa fabrica peças em três linhas de produção:

Linha Proporção da produção \(P(\text{defeito})\)
L1 50% 2%
L2 30% 5%
L3 20% 8%

(a) Calcule a probabilidade de uma peça sorteada ao acaso ser defeituosa.

(b) Dado que uma peça é defeituosa, qual a probabilidade de ter sido fabricada na Linha 3?

(c) Um inspetor sorteia uma peça defeituosa. Ele afirma: “Como a Linha 3 tem a maior taxa de defeitos, é mais provável que venha de lá.” Esse raciocínio está correto? Explique usando os resultados de (b).

Exercício 19 🔴 (Desafio)

Um classificador de spam por e-mail foi treinado com os seguintes dados históricos:

  • 25% dos e-mails recebidos são spam
  • O classificador identifica spam corretamente com probabilidade 0,92
  • O classificador classifica erroneamente um e-mail legítimo como spam com probabilidade 0,05

(a) Calcule \(P(\text{classificado como spam})\).

(b) Calcule \(P(\text{é spam} \mid \text{classificado como spam})\) — a precisão do classificador.

(c) Calcule \(P(\text{não é spam} \mid \text{classificado como legítimo})\) — o valor preditivo negativo.

(d) Se a proporção de spam aumentar para 60% (situação de ataque), recalcule (b) e (c). O classificador se torna mais ou menos confiável? Explique.

(e) (Extensão) Um engenheiro propõe reduzir a taxa de falso positivo para 0,01 (ao custo de reduzir a sensibilidade para 0,85). Com 25% de spam, essa mudança melhora a precisão? Vale a pena? Justifique numericamente.


Bloco 7 — Exercícios com R

Exercício 20 🟡 💻

O código abaixo simula o Teorema de Bayes numericamente para o problema do IDS (Exercício 16).

set.seed(5831)
n_conexoes <- 100000

# Gera conexões: 1 = ataque, 0 = normal
ataque <- rbinom(n_conexoes, 1, prob = 0.02)

# IDS: detecta ataque com P=0.95; falso positivo com P=0.03
alarme <- ifelse(
  ataque == 1,
  rbinom(n_conexoes, 1, 0.95),   # verdadeiro positivo
  rbinom(n_conexoes, 1, 0.03)    # falso positivo
)

# Tabela de contingência
tab <- table(Ataque = ataque, Alarme = alarme)
prop.table(tab)

# P(ataque real | alarme disparado) — empírica
alarme_real <- sum(ataque == 1 & alarme == 1)
total_alarme <- sum(alarme == 1)
cat("P(ataque | alarme) empírico:", round(alarme_real / total_alarme, 4))

(a) Execute o código. O valor empírico de \(P(\text{ataque} \mid \text{alarme})\) é próximo do calculado analiticamente no Exercício 16?

(b) Modifique prob = 0.02 para prob = 0.10 e execute novamente. Como \(P(\text{ataque} \mid \text{alarme})\) muda? Está de acordo com o que você calculou em 16(d)?

(c) Construa um gráfico de barras com ggplot2 mostrando a composição dos alarmes disparados: quantos foram verdadeiros positivos e quantos foram falsos positivos.

(d) (Reflexão) Com base na simulação, escreva em 3–5 linhas o que o Teorema de Bayes revela sobre sistemas de detecção de ameaças em contextos de baixa prevalência.

Exercício 21 🔴 💻 (Desafio com R — Copa do Mundo)

# Dados históricos
historico <- data.frame(
  ano     = c(1930,1934,1938,1950,1954,1958,1962,1966,1970,1974,
              1978,1982,1986,1990,1994,1998,2002,2006,2010,2014,2018,2022),
  campeao = c("Uruguai","Itália","Itália","Uruguai","Alemanha","Brasil",
              "Brasil","Inglaterra","Brasil","Alemanha","Argentina","Itália",
              "Argentina","Alemanha","Brasil","França","Brasil","Itália",
              "Espanha","Alemanha","França","Argentina"),
  conf    = c("CONMEBOL","UEFA","UEFA","CONMEBOL","UEFA","CONMEBOL",
              "CONMEBOL","UEFA","CONMEBOL","UEFA","CONMEBOL","UEFA",
              "CONMEBOL","UEFA","CONMEBOL","UEFA","CONMEBOL","UEFA",
              "UEFA","UEFA","UEFA","CONMEBOL")
)

(a) Calcule e apresente em um data.frame a probabilidade frequentista de cada país vencer, com base nas 22 edições. Ordene do maior para o menor.

(b) Calcule a probabilidade frequentista de cada confederação vencer. Crie um gráfico de barras comparando com a probabilidade clássica (vagas/48).

(c) Calcule a probabilidade de alternância: dado que o campeão de uma edição é da CONMEBOL, qual a probabilidade frequentista de o próximo ser da UEFA? Use os pares consecutivos de campeões.

(d) Usando apenas os dados históricos, construa a “distribuição preditiva” para a Copa 2026: um gráfico de barras mostrando a probabilidade frequentista de cada país vencer. Adicione uma linha horizontal mostrando a probabilidade clássica (\(1/48\)) para comparação. Comente a visualização.


Bloco 8 — Questões Conceituais

Exercício 22 🟢

Classifique cada afirmativa como Verdadeira ou Falsa e justifique:

(a) “Se \(P(A) = 0\), então \(A = \emptyset\).”

(b) “Se \(A\) e \(B\) são mutuamente exclusivos, então são independentes.”

(c) “Se \(P(A \mid B) = P(A)\), então \(A\) e \(B\) são independentes.”

(d) “A probabilidade frequentista sempre converge para a probabilidade clássica quando \(n \to \infty\).”

(e) “O Teorema de Bayes só é válido para eventos com probabilidade positiva.”

(f) “Se \(A \subset B\), então \(P(A \mid B) = P(A) / P(B)\).”

Exercício 23 🔴 (Questão aberta)

A Copa do Mundo 2026 será sediada por EUA, Canadá e México. O fator sede historicamente influencia o desempenho: seleções da América do Norte (CONCACAF) podem se beneficiar do apoio da torcida.

(a) Como você incorporaria o “fator sede” em um modelo probabilístico para prever o vencedor? Descreva matematicamente usando probabilidade condicional.

(b) No modelo clássico, \(P(\text{CONCACAF vence}) = 6/48 \approx 12{,}5\%\). No modelo frequentista, \(P_{\text{freq}}(\text{CONCACAF vence}) = 0/22 = 0\%\). Proponha um terceiro valor razoável considerando o fator sede, e explique como você chegou a ele (não precisa ser exato — o raciocínio importa).

(c) Esse problema ilustra uma limitação fundamental do modelo frequentista: dados raros ou ausentes não implicam impossibilidade. Que abordagem probabilística — mencionada nas aulas — lida melhor com esse tipo de problema? Explique em 5–8 linhas.


Bloco 9 — Integração: Sistema de Apostas e Probabilidade

Exercício 24 🔴 (Desafio integrador)

Casas de apostas usam odds (cotações) para precificar eventos. A relação entre odd decimal e probabilidade implícita é:

\[P_{\text{mercado}}(A) = \frac{1}{\text{odd}_A}\]

Suponha que, antes da Copa 2026, as odds decimais para alguns países são:

País Odd decimal
França 6,5
Brasil 7,5
Argentina 8,0
Espanha 9,0
Inglaterra 11,0
Alemanha 12,0
Demais 42 (vários)

(a) Calcule \(P_{\text{mercado}}\) para cada país listado. A soma ultrapassa 1? Por quê? (Dica: casas de apostas incluem uma margem — a “vigorish” ou “vig”.)

(b) Compare \(P_{\text{mercado}}(\text{Brasil})\) com: - \(P_{\text{clássico}}(\text{Brasil}) = 1/48\) - \(P_{\text{freq}}(\text{Brasil}) = 5/22\)

Qual modelo está mais próximo do mercado? O que isso sugere sobre as informações usadas pelo mercado?

(c) Usando o Teorema de Bayes como analogia: - Considere \(P_{\text{freq}}\) como a probabilidade a priori - As odds de mercado como evidência do “desempenho recente” das seleções - Proponha uma fórmula intuitiva para combinar os dois modelos e obter uma “probabilidade a posteriori” para o Brasil.

(d) Essa abordagem tem um nome na literatura. Qual é? Pesquise e escreva 3–5 linhas.


Resumo dos Conceitos Cobertos

Bloco Conceito Exercícios
1 Espaço amostral e eventos 1, 2, 3, 4
2 Probabilidade clássica 5, 6, 7, 8
3 Probabilidade frequentista 9, 10
4 Axiomas e propriedades 11, 12, 13
5 Probabilidade condicional 14, 15, 16, 17
6 Probabilidade total e Bayes 18, 19
7 Exercícios com R 20, 21
8 Questões conceituais 22, 23
9 Integração 24

Lista elaborada com base nas Aulas 1 e 1a — ITC020/ITA059, UFAM/ICET.
Dúvidas: