class: center, middle, inverse, title-slide .title[ # Intervalos de Confiança ] .subtitle[ ## Engenharia de Software · Sistemas de Informação ] .author[ ### Estatística Aplicada ] .date[ ### 30/06/2026 ] --- class: inverse, center, middle # Intervalos de Confiança ### Engenharia de Software · Sistemas de Informação ### Cobre as 4 estatísticas: **μ (Z)**, **μ (t)**, **proporção (p)** e **desvio padrão (σ)** --- ## Roteiro da aula · Sumário Cada bloco usa o mesmo padrão de **5 etapas**: 1. **Situação-problema** contextualizada 2. **Perguntas** a responder 3. **Teoria enxuta** — por que aquela distribuição 4. **Resolução** passo a passo (com R) 5. **Reflexão** + pergunta para casa | # | Estatística | Distribuição | Caso | |---|---|---|---| | 1 | Média (σ conhecido) | **Z** | API de pagamento | | 2 | Média (σ desconhecido) | **t** | App novo (login) | | 3 | Proporção | **Z** (aprox.) | Taxa de sucesso HTTP 2xx | | 4 | Desvio padrão | **χ²** | Jitter da API | --- class: inverse, center, middle # Aula 1 · IC para μ com σ conhecido ### API em produção: a média real está dentro do SLA? ### (σ histórico conhecido → usar **Z**) --- ## 1.1 Situação-problema Você é **engenheiro(a) de software** responsável por uma API crítica de pagamento. O time tem **σ histórico** da latência: **σ = 15 ms** (vindo de meses de monitoramento). Em uma nova campanha de teste de carga, você coletou **`n = 36`** requisições: - Média amostral: **x̄ = 142 ms** > O **SLA** contratual diz: tempo médio de resposta deve ser **≤ 150 ms**. > Reportar "x̄ = 142 ms" é uma fotografia. A pergunta honesta é: **qual a faixa plausível para o verdadeiro μ?** --- ## 1.2 Perguntas a responder 1. Qual o **IC 95%** para a média real μ da latência da API? 2. Esse IC é **compatível** com o SLA de 150 ms? --- ## 1.3 Teoria — por que Z (e não t)? - **σ é conhecido** (histórico de meses). Não precisamos estimar — **usamos direto**. - A distribuição da média amostral `x̄` é **exatamente Normal** quando a população é Normal: `$$x̄ \sim N\!\left(\mu,\ \frac{\sigma^2}{n}\right)$$` - Padronizando: `Z = (x̄ − μ) / (σ/√n) ~ N(0,1)`. - **Por que não t?** t compensa a **incerteza de estimar σ** com `s`. Aqui **não há essa incerteza** — Z é mais **informativo** (IC mais estreito). - **Premissa:** Normalidade da população (ou n grande pelo TCL). Aqui n = 36 já dá boa robustez. --- ## 1.3 Teoria — fórmula do IC `$$\text{IC}_{1-\alpha}(\mu) = \left(\bar{x} - z_{1-\alpha/2}\cdot\frac{\sigma}{\sqrt{n}};\ \bar{x} + z_{1-\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}\right)$$` - **Erro padrão:** `σ/√n`. - **Margem:** `z · σ/√n`. - **Interpretação:** se repetíssemos o procedimento infinitas vezes, ~95% dos intervalos conteriam o verdadeiro μ. - **Erro comum:** usar **t** quando σ é conhecido — é defensável, mas gera IC **mais largo** (desperdiça informação). --- ## 1.4 Resolução — passo a passo ``` ## x̄ = 142.0 ms | σ = 15.0 ms (histórico) | n = 36 | 1−α = 0.95 ``` ``` ## z_{0.975} = 1.960 ``` ``` ## Erro padrão (σ/√n) = 15.0 / √36 = 2.5000 ms ``` ``` ## Margem = 1.960 × 2.5000 = 4.8999 ms ``` ``` ## ## IC 95% para μ = (137.10 ; 146.90) ms ``` --- ## 1.4 Resolução — visualizando o IC ``` ## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0. ## ℹ Please use `linewidth` instead. ## This warning is displayed once per session. ## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was ## generated. ``` <!-- --> > A área central cobre 95% da distribuição amostral. O **SLA de 150 ms** está **fora** do IC (acima do limite superior). --- ## 1.5 Reflexão + para casa - O IC **inteiro** abaixo de 150 ms: a API está performando **dentro** do SLA. Boa notícia. - O **erro padrão** (2,5 ms) é pequeno porque **n = 36** é grande. Se n caísse para 9, o erro padrão **triplicaria** (5,0 ms) e a margem dobraria. - **Erro comum:** usar o `s` calculado da amostra (ex.: 12,8) **no lugar** do `σ = 15`. Aqui σ é **decisão de modelagem** — vem do histórico de meses. - **Quando desconfiar do σ histórico?** Se o sistema mudou (deploy, migração), o σ histórico pode não representar mais a realidade. > **Para casa:** Imagine que o σ histórico foi **subestimado** (era 10 ms, não 15 ms). Refaça o IC. O IC **abre**? O que isso implica para a confiança no SLA? --- class: inverse, center, middle # Aula 2 · IC para μ com σ desconhecido ### App novo: o tempo médio de login está dentro do aceitável? ### (σ desconhecido → usar **t de Student**) --- ## 2.1 Situação-problema Você é **engenheiro(a) de software** e precisa estimar o **tempo médio de login** em um **app novo** (sem histórico de performance). Você coletou **`n = 15`** logins e obteve: - Média amostral: **x̄ = 320 ms** - Desvio padrão amostral: **s = 18 ms** > O time definiu como aceitável: tempo médio de login **≤ 350 ms**. > Reportar "x̄ = 320 ms" não basta — a estimativa de σ da própria amostra **cria incerteza extra**. Como ela entra no IC? --- ## 2.2 Perguntas a responder 1. Qual o **IC 95%** para a média real μ do tempo de login? 2. O limite de 350 ms está dentro ou fora do IC? --- ## 2.3 Teoria — por que t (e não Z)? - **σ é desconhecido** — não temos histórico. Estimamos de `s = 18`. - Ao substituir σ por `s`, surge **erro adicional** de estimação. - A distribuição de `(x̄ − μ)/(s/√n)` **não** é mais Normal padrão — é **t de Student** com `gl = n − 1`. - **t tem caudas mais pesadas** que Z (mais probabilidade nos extremos). Para `gl → ∞`, t → Z. | gl | t_{0,975} | Z_{0,975} | |---|---|---| | 14 | **2,145** | 1,960 | | 30 | 2,042 | 1,960 | | ∞ | 1,960 | 1,960 | > Para n ≥ 30, t ≈ Z na prática. Para n pequeno, a diferença importa. --- ## 2.3 Teoria — fórmula do IC `$$\text{IC}_{1-\alpha}(\mu) = \left(\bar{x} - t_{1-\alpha/2,\ gl}\cdot\frac{s}{\sqrt{n}};\ \bar{x} + t_{1-\alpha/2,\ gl}\cdot\frac{s}{\sqrt{n}}\right)$$` - **Erro padrão estimado:** `s/√n`. - **Margem:** `t · s/√n` (com t > Z para n pequeno). - **Premissa:** Normalidade da população. Para n pequeno, verificar histograma/QQ-plot. - **Interpretação:** mesma frequentista — se repetíssemos infinitas vezes, ~95% conteriam μ. - **Erro comum:** usar Z quando σ é estimado de `s` — gera IC **falso-otimista** (margem pequena demais). --- ## 2.4 Resolução — passo a passo ``` ## x̄ = 320.0 ms | s = 18.0 ms | n = 15 | gl = 14 | 1−α = 0.95 ``` ``` ## t_{0.975; 14} = 2.145 ``` ``` ## Erro padrão estimado (s/√n) = 18.0 / √15 = 4.6476 ms ``` ``` ## Margem = 2.145 × 4.6476 = 9.9681 ms ``` ``` ## ## IC 95% para μ = (310.03 ; 329.97) ms ``` --- ## 2.4 Resolução — comparando com Z ``` ## Se usássemos Z (incorretamente): ``` ``` ## Margem Z = 1.960 × 4.6476 = 9.1091 ms ``` ``` ## IC 95% (Z) = (310.89 ; 329.11) ms ← IC mais estreito, FALSO-OTIMISTA ``` ``` ## ## Usando t (correto): ``` ``` ## IC 95% (t) = (310.03 ; 329.97) ms ← IC mais largo, HONESTO ``` ``` ## ## Diferença de margem: 9.9681 − 9.1091 = 0.8590 ms (9.4% a mais) ``` > A diferença é de ~9,4% na margem. Para n pequeno, **não é desprezível**. --- ## 2.5 Reflexão + para casa - Comparando com o caso σ conhecido (Z): aqui `s = 18` vem de apenas **15 observações** — há **mais incerteza** sobre o erro padrão. O t **compensa** com caudas mais pesadas. - t_{0,975; 14} = **2,145** vs Z = 1,960. Margem **9,4% maior**. - Com **n = 30**, t ≈ Z. O efeito **diminui** com amostras grandes. - **Erro comum:** usar Z quando σ é desconhecido. Subestima a margem e gera IC **falso-otimista**. - **Premissa crítica:** Normalidade. Para n = 15, é importante verificar histograma/QQ-plot — se a distribuição for muito assimétrica (caudas longas, comum em latências), o IC com t pode estar distorcido. > **Para casa:** Simule em R uma amostra de tamanho **n = 30** (em vez de 15) com a mesma média e desvio. Quanto o IC **encolhe**? Se você tivesse acesso a mais 15 logins, vale a pena coletar? --- class: inverse, center, middle # Aula 3 · IC para proporção (p) ### Monitorando API: a **taxa de sucesso** (HTTP 2xx) está acima do SLO? ### (proporção → aproximação Normal com **Z**) --- ## 3.1 Situação-problema Você é **engenheiro(a) de SRE** monitorando uma API em produção. Você precisa estimar a **taxa de sucesso** (HTTP 2xx) — uma **proporção**. Em uma janela de monitoramento, você observou **`n = 900`** chamadas: - **x = 842** respostas HTTP 2xx - **Proporção amostral:** `p̂ = 842/900 = 0,9356` > O **SLO** de confiabilidade é **93%**. A pergunta: **a taxa real está acima de 93%?** --- ## 3.2 Perguntas a responder 1. Qual o **IC 95%** para a proporção real p de sucesso? 2. O SLO de 93% está dentro ou fora do IC? --- ## 3.3 Teoria — proporção e aproximação Normal - Variável **binária** (sucesso/falha, 2xx/não-2xx, sim/não). - **Estimador:** `p̂ = x/n` (proporção amostral). - Pelo **TCL para proporções**, `p̂` é aproximadamente Normal quando: - `n · p̂ ≥ 5` **e** - `n · (1 − p̂) ≥ 5` > Se violada → usar **método exato de Clopper-Pearson**. - **Erro padrão:** `√(p̂·(1−p̂)/n)`. - **Fórmula do IC:** `$$\text{IC}_{1-\alpha}(p) = \left(\hat{p} - z_{1-\alpha/2}\cdot\sqrt{\frac{\hat{p}(1-\hat{p})}{n}};\ \hat{p} + z_{1-\alpha/2}\cdot\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right)$$` - **Erro comum:** usar `p̂ = 0,5` no erro padrão (fórmula **superconservadora**). Sempre use o p̂ **observado**. --- ## 3.4 Resolução — passo a passo ``` ## x = 842 sucessos | n = 900 | p̂ = 0.9356 (93.56%) ``` ``` ## z_{0.975} = 1.960 ``` ``` ## Premissa: n·p̂ = 842.0 ≥ 5 ✓ | n·(1−p̂) = 58.0 ≥ 5 ✓ ``` ``` ## Erro padrão = √(0.9356·0.0644/900) = √0.0000670 = 0.00818 ``` ``` ## Margem = 1.960 × 0.00818 = 0.01604 ``` ``` ## ## IC 95% para p = (0.9195 ; 0.9516) ``` ``` ## IC 95% para p = (91.95% ; 95.16%) ``` --- ## 3.4 Resolução — visualizando o IC <!-- --> > O SLO de **93%** está **dentro** do IC. Decisão **inconclusiva**. --- ## 3.5 Reflexão + para casa - O IC 95% para p é **(0,9196 ; 0,9516)** = **(91,96% ; 95,16%)**. O SLO de **93%** está **dentro** do IC. - A **margem é pequena** (1,6 pp) porque **n = 900** é grande. Com **n = 100**, a margem **triplicaria** (4,8 pp) — IC muito largo. - O limite **inferior** (91,96%) está **perto** do SLO. **Cuidado operacional**: se a taxa cair um pouco, o SLO rompe. - **Premissa verificada:** `n·p̂ = 842 ≥ 5` ✓ e `n·(1−p̂) = 58 ≥ 5` ✓ — aproximação Normal válida. - **Erro comum:** usar `p̂ = 0,5` no erro padrão — fórmula **superconservadora**, gera IC muito largo. Sempre use o p̂ observado. - **Quando o método falha?** Se `p̂` for muito próximo de 0 ou 1 (poucos sucessos/poucos fracassos), a aproximação Normal **não vale** — usar Clopper-Pearson ou Wilson. > **Para casa:** Se o SLO fosse **95%** em vez de 93%, o IC conteria 95? Quanto de margem você precisaria para decidir (qual `n` daria IC inteiro acima de 95%)? --- class: inverse, center, middle # Aula 4 · IC para o desvio padrão (σ) ### API em produção: a latência é **estável** o bastante? ### (χ² de Pearson — IC assimétrico) --- ## 4.1 Situação-problema Você é **engenheiro(a) de software** e precisa definir um **SLO de variabilidade** (jitter) para uma API crítica de pagamento. - `n = 21` requisições amostradas em teste de carga - Desvio padrão amostral observado: **s = 10,4 ms** - **SLO proposto pelo time:** desvio padrão ≤ 8 ms > Reportar "s = 10,4 ms" é uma fotografia pontual. A pergunta honesta é: **qual a faixa plausível para o verdadeiro σ?** --- ## 4.2 Perguntas a responder 1. Qual o **IC 95%** para o desvio padrão real σ da latência? 2. Esse IC é **compatível** com o limite de SLO de 8 ms? --- ## 4.3 Teoria — por que estimar σ? - A **média** diz o valor típico. O **desvio padrão** diz o quanto o sistema **oscila**. - SLOs modernos (latência, qualidade, processo) são definidos em termos de **dispersão** — P95, P99, jitter, variabilidade. - A distribuição amostral de `(n−1)·s²/σ²` segue **qui-quadrado (χ²)** com `gl = n − 1`. - A χ² é **assimétrica** ⇒ o IC para σ **não** fica centrado em `s`. --- ## 4.3 Teoria — fórmula do IC para σ `$$\text{IC}_{1-\alpha}(\sigma) = \left(\sqrt{\frac{(n-1)\,s^2}{\chi^2_{\alpha/2,\ gl}}};\;\sqrt{\frac{(n-1)\,s^2}{\chi^2_{1-\alpha/2,\ gl}}}\right)$$` - **Numerador:** soma de quadrados corrigida (`(n−1)·s²`). - **Denominador:** quantis da χ² que cortam **as caudas** (α/2 e 1−α/2). - **Por que essa ordem invertida?** O limite **inferior** do IC usa o quantil **maior** (χ²_{α/2}), porque ele está no denominador — divide mais, dá menor. - **Interpretação:** se repetíssemos o procedimento infinitas vezes, ~95% dos intervalos conteriam o verdadeiro σ. --- ## 4.4 Resolução — passo a passo ``` ## n = 21 | s = 10.40 ms | gl = 20 | 1−α = 0.95 ``` ``` ## χ²_{0.975; 20} = 34.170 (denominador da cauda superior) ``` ``` ## χ²_{0.025; 20} = 9.591 (denominador da cauda inferior) ``` ``` ## (n−1)·s² = 20 × 108.160 = 2163.20 ``` ``` ## σ²_inf = 2163.20 / 34.170 = 63.308 → σ_inf = 7.957 ms ``` ``` ## σ²_sup = 2163.20 / 9.591 = 225.550 → σ_sup = 15.018 ms ``` ``` ## ## IC 95% para σ = (7.96 ; 15.02) ms ``` --- ## 4.4 Resolução — visualizando o IC <!-- --> > A área central em azul cobre 95%. Os cortes vermelhos delimitam o IC para **σ²**. Tire a raiz quadrada para ter o IC para **σ**. --- ## 4.5 Reflexão + para casa - O IC 95% para σ é **(7,96 ; 15,02) ms**. O **limite de SLO** proposto era **8 ms**. - O limite inferior (7,96) **encosta** no limite de 8 ms. **Decisão apertada.** - A **assimetria** do IC reflete a assimetria da χ²: `s = 10,4` está mais perto do limite superior. - **Erro comum a evitar:** calcular o IC para σ como `s ± 1,96·s/√(2n)` (aproximação Normal). Para n pequeno, **não funciona**. - A interpretação do IC para σ² e para σ é a **mesma lógica frequentista** do IC para μ. > **Para casa:** Colete (ou simule em R) 25 tempos de resposta de uma API de sua escolha. Construa o IC 95% para σ. **O limite inferior do IC é menor que o SLO que você gostaria de prometer?** O que isso diz sobre o tamanho da amostra que você precisaria? --- class: inverse, center, middle # Tabela de consulta · qual teste para qual estatística | Parâmetro | IC | TH (2 grupos) | Premissa | |---|---|---|---| | μ (σ conhecido) | Z | Z | σ histórico | | μ (σ desc.) | **t** ← Aulas 1, 2 | **t Welch** | Normalidade | | p (proporção) | **Z** ← Aula 3 | **Z duas prop.** | n·p̂ ≥ 5 | | σ | **χ²** ← Aula 4 | **F** | Normalidade | --- class: inverse, center, middle # Dúvidas?