Intervalos de Confiança

.title[
# Intervalos de Confiança
]
.subtitle[
## Engenharia de Software · Sistemas de Informação
]
.author[
### Estatística Aplicada
]
.date[
### 30/06/2026
]

---

# Intervalos de Confiança

### Engenharia de Software · Sistemas de Informação

### Cobre as 4 estatísticas: **μ (Z)**, **μ (t)**, **proporção (p)** e **desvio padrão (σ)**

---

## Roteiro da aula · Sumário

Cada bloco usa o mesmo padrão de **5 etapas**:

1. **Situação-problema** contextualizada
2. **Perguntas** a responder
3. **Teoria enxuta** — por que aquela distribuição
4. **Resolução** passo a passo (com R)
5. **Reflexão** + pergunta para casa

| # | Estatística | Distribuição | Caso |
|---|---|---|---|
| 1 | Média (σ conhecido) | **Z** | API de pagamento |
| 2 | Média (σ desconhecido) | **t** | App novo (login) |
| 3 | Proporção | **Z** (aprox.) | Taxa de sucesso HTTP 2xx |
| 4 | Desvio padrão | **χ²** | Jitter da API |

---
class: inverse, center, middle

# Aula 1 · IC para μ com σ conhecido

### API em produção: a média real está dentro do SLA?

### (σ histórico conhecido → usar **Z**)

---

## 1.1 Situação-problema

Você é **engenheiro(a) de software** responsável por uma API crítica de pagamento. O time tem **σ histórico** da latência: **σ = 15 ms** (vindo de meses de monitoramento).

Em uma nova campanha de teste de carga, você coletou **`n = 36`** requisições:

- Média amostral: **x̄ = 142 ms**

> O **SLA** contratual diz: tempo médio de resposta deve ser **≤ 150 ms**.
> Reportar "x̄ = 142 ms" é uma fotografia. A pergunta honesta é: **qual a faixa plausível para o verdadeiro μ?**

---

## 1.2 Perguntas a responder

1. Qual o **IC 95%** para a média real μ da latência da API?
2. Esse IC é **compatível** com o SLA de 150 ms?

---

## 1.3 Teoria — por que Z (e não t)?

- **σ é conhecido** (histórico de meses). Não precisamos estimar — **usamos direto**.
- A distribuição da média amostral `x̄` é **exatamente Normal** quando a população é Normal:

`$$x̄ \sim N\!\left(\mu,\ \frac{\sigma^2}{n}\right)$$`

- Padronizando: `Z = (x̄ − μ) / (σ/√n) ~ N(0,1)`.
- **Por que não t?** t compensa a **incerteza de estimar σ** com `s`. Aqui **não há essa incerteza** — Z é mais **informativo** (IC mais estreito).
- **Premissa:** Normalidade da população (ou n grande pelo TCL). Aqui n = 36 já dá boa robustez.

---

## 1.3 Teoria — fórmula do IC

`$$\text{IC}_{1-\alpha}(\mu) = \left(\bar{x} - z_{1-\alpha/2}\cdot\frac{\sigma}{\sqrt{n}};\ \bar{x} + z_{1-\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}\right)$$`

- **Erro padrão:** `σ/√n`.
- **Margem:** `z · σ/√n`.
- **Interpretação:** se repetíssemos o procedimento infinitas vezes, ~95% dos intervalos conteriam o verdadeiro μ.
- **Erro comum:** usar **t** quando σ é conhecido — é defensável, mas gera IC **mais largo** (desperdiça informação).

---

## 1.4 Resolução — passo a passo

```
## x̄ = 142.0 ms | σ = 15.0 ms (histórico) | n = 36 | 1−α = 0.95
```

```
## z_{0.975} = 1.960
```

```
## Erro padrão (σ/√n) = 15.0 / √36 = 2.5000 ms
```

```
## Margem = 1.960 × 2.5000 = 4.8999 ms
```

```
## 
## IC 95% para μ = (137.10 ; 146.90) ms
```

---

## 1.4 Resolução — visualizando o IC

```
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
```

![](IC_Engenharia_Software_files/figure-html/unnamed-chunk-2-1.png)

> A área central cobre 95% da distribuição amostral. O **SLA de 150 ms** está **fora** do IC (acima do limite superior).

---

## 1.5 Reflexão + para casa

- O IC **inteiro** abaixo de 150 ms: a API está performando **dentro** do SLA. Boa notícia.
- O **erro padrão** (2,5 ms) é pequeno porque **n = 36** é grande. Se n caísse para 9, o erro padrão **triplicaria** (5,0 ms) e a margem dobraria.
- **Erro comum:** usar o `s` calculado da amostra (ex.: 12,8) **no lugar** do `σ = 15`. Aqui σ é **decisão de modelagem** — vem do histórico de meses.
- **Quando desconfiar do σ histórico?** Se o sistema mudou (deploy, migração), o σ histórico pode não representar mais a realidade.

> **Para casa:** Imagine que o σ histórico foi **subestimado** (era 10 ms, não 15 ms). Refaça o IC. O IC **abre**? O que isso implica para a confiança no SLA?

---
class: inverse, center, middle

# Aula 2 · IC para μ com σ desconhecido

### App novo: o tempo médio de login está dentro do aceitável?

### (σ desconhecido → usar **t de Student**)

---

## 2.1 Situação-problema

Você é **engenheiro(a) de software** e precisa estimar o **tempo médio de login** em um **app novo** (sem histórico de performance).

Você coletou **`n = 15`** logins e obteve:

- Média amostral: **x̄ = 320 ms**
- Desvio padrão amostral: **s = 18 ms**

> O time definiu como aceitável: tempo médio de login **≤ 350 ms**.
> Reportar "x̄ = 320 ms" não basta — a estimativa de σ da própria amostra **cria incerteza extra**. Como ela entra no IC?

---

## 2.2 Perguntas a responder

1. Qual o **IC 95%** para a média real μ do tempo de login?
2. O limite de 350 ms está dentro ou fora do IC?

---

## 2.3 Teoria — por que t (e não Z)?

- **σ é desconhecido** — não temos histórico. Estimamos de `s = 18`.
- Ao substituir σ por `s`, surge **erro adicional** de estimação.
- A distribuição de `(x̄ − μ)/(s/√n)` **não** é mais Normal padrão — é **t de Student** com `gl = n − 1`.
- **t tem caudas mais pesadas** que Z (mais probabilidade nos extremos). Para `gl → ∞`, t → Z.

| gl | t_{0,975} | Z_{0,975} |
|---|---|---|
| 14 | **2,145** | 1,960 |
| 30 | 2,042 | 1,960 |
| ∞ | 1,960 | 1,960 |

> Para n ≥ 30, t ≈ Z na prática. Para n pequeno, a diferença importa.

---

## 2.3 Teoria — fórmula do IC

`$$\text{IC}_{1-\alpha}(\mu) = \left(\bar{x} - t_{1-\alpha/2,\ gl}\cdot\frac{s}{\sqrt{n}};\ \bar{x} + t_{1-\alpha/2,\ gl}\cdot\frac{s}{\sqrt{n}}\right)$$`

- **Erro padrão estimado:** `s/√n`.
- **Margem:** `t · s/√n` (com t > Z para n pequeno).
- **Premissa:** Normalidade da população. Para n pequeno, verificar histograma/QQ-plot.
- **Interpretação:** mesma frequentista — se repetíssemos infinitas vezes, ~95% conteriam μ.
- **Erro comum:** usar Z quando σ é estimado de `s` — gera IC **falso-otimista** (margem pequena demais).

---

## 2.4 Resolução — passo a passo

```
## x̄ = 320.0 ms | s = 18.0 ms | n = 15 | gl = 14 | 1−α = 0.95
```

```
## t_{0.975; 14} = 2.145
```

```
## Erro padrão estimado (s/√n) = 18.0 / √15 = 4.6476 ms
```

```
## Margem = 2.145 × 4.6476 = 9.9681 ms
```

```
## 
## IC 95% para μ = (310.03 ; 329.97) ms
```

---

## 2.4 Resolução — comparando com Z

```
## Se usássemos Z (incorretamente):
```

```
##   Margem Z = 1.960 × 4.6476 = 9.1091 ms
```

```
##   IC 95% (Z) = (310.89 ; 329.11) ms  ← IC mais estreito, FALSO-OTIMISTA
```

```
## 
## Usando t (correto):
```

```
##   IC 95% (t) = (310.03 ; 329.97) ms  ← IC mais largo, HONESTO
```

```
## 
## Diferença de margem: 9.9681 − 9.1091 = 0.8590 ms (9.4% a mais)
```

> A diferença é de ~9,4% na margem. Para n pequeno, **não é desprezível**.

---

## 2.5 Reflexão + para casa

- Comparando com o caso σ conhecido (Z): aqui `s = 18` vem de apenas **15 observações** — há **mais incerteza** sobre o erro padrão. O t **compensa** com caudas mais pesadas.
- t_{0,975; 14} = **2,145** vs Z = 1,960. Margem **9,4% maior**.
- Com **n = 30**, t ≈ Z. O efeito **diminui** com amostras grandes.
- **Erro comum:** usar Z quando σ é desconhecido. Subestima a margem e gera IC **falso-otimista**.
- **Premissa crítica:** Normalidade. Para n = 15, é importante verificar histograma/QQ-plot — se a distribuição for muito assimétrica (caudas longas, comum em latências), o IC com t pode estar distorcido.

> **Para casa:** Simule em R uma amostra de tamanho **n = 30** (em vez de 15) com a mesma média e desvio. Quanto o IC **encolhe**? Se você tivesse acesso a mais 15 logins, vale a pena coletar?

---
class: inverse, center, middle

# Aula 3 · IC para proporção (p)

### Monitorando API: a **taxa de sucesso** (HTTP 2xx) está acima do SLO?

### (proporção → aproximação Normal com **Z**)

---

## 3.1 Situação-problema

Você é **engenheiro(a) de SRE** monitorando uma API em produção. Você precisa estimar a **taxa de sucesso** (HTTP 2xx) — uma **proporção**.

Em uma janela de monitoramento, você observou **`n = 900`** chamadas:

- **x = 842** respostas HTTP 2xx
- **Proporção amostral:** `p̂ = 842/900 = 0,9356`

> O **SLO** de confiabilidade é **93%**. A pergunta: **a taxa real está acima de 93%?**

---

## 3.2 Perguntas a responder

1. Qual o **IC 95%** para a proporção real p de sucesso?
2. O SLO de 93% está dentro ou fora do IC?

---

## 3.3 Teoria — proporção e aproximação Normal

- Variável **binária** (sucesso/falha, 2xx/não-2xx, sim/não).
- **Estimador:** `p̂ = x/n` (proporção amostral).
- Pelo **TCL para proporções**, `p̂` é aproximadamente Normal quando:
  - `n · p̂ ≥ 5` **e**
  - `n · (1 − p̂) ≥ 5`

> Se violada → usar **método exato de Clopper-Pearson**.

- **Erro padrão:** `√(p̂·(1−p̂)/n)`.
- **Fórmula do IC:**

`$$\text{IC}_{1-\alpha}(p) = \left(\hat{p} - z_{1-\alpha/2}\cdot\sqrt{\frac{\hat{p}(1-\hat{p})}{n}};\ \hat{p} + z_{1-\alpha/2}\cdot\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right)$$`

- **Erro comum:** usar `p̂ = 0,5` no erro padrão (fórmula **superconservadora**). Sempre use o p̂ **observado**.

---

## 3.4 Resolução — passo a passo

```
## x = 842 sucessos | n = 900 | p̂ = 0.9356 (93.56%)
```

```
## z_{0.975} = 1.960
```

```
## Premissa: n·p̂ = 842.0 ≥ 5 ✓ | n·(1−p̂) = 58.0 ≥ 5 ✓
```

```
## Erro padrão = √(0.9356·0.0644/900) = √0.0000670 = 0.00818
```

```
## Margem = 1.960 × 0.00818 = 0.01604
```

```
## 
## IC 95% para p = (0.9195 ; 0.9516)
```

```
## IC 95% para p = (91.95% ; 95.16%)
```

---

## 3.4 Resolução — visualizando o IC

![](IC_Engenharia_Software_files/figure-html/unnamed-chunk-6-1.png)

> O SLO de **93%** está **dentro** do IC. Decisão **inconclusiva**.

---

## 3.5 Reflexão + para casa

- O IC 95% para p é **(0,9196 ; 0,9516)** = **(91,96% ; 95,16%)**. O SLO de **93%** está **dentro** do IC.
- A **margem é pequena** (1,6 pp) porque **n = 900** é grande. Com **n = 100**, a margem **triplicaria** (4,8 pp) — IC muito largo.
- O limite **inferior** (91,96%) está **perto** do SLO. **Cuidado operacional**: se a taxa cair um pouco, o SLO rompe.
- **Premissa verificada:** `n·p̂ = 842 ≥ 5` ✓ e `n·(1−p̂) = 58 ≥ 5` ✓ — aproximação Normal válida.
- **Erro comum:** usar `p̂ = 0,5` no erro padrão — fórmula **superconservadora**, gera IC muito largo. Sempre use o p̂ observado.
- **Quando o método falha?** Se `p̂` for muito próximo de 0 ou 1 (poucos sucessos/poucos fracassos), a aproximação Normal **não vale** — usar Clopper-Pearson ou Wilson.

> **Para casa:** Se o SLO fosse **95%** em vez de 93%, o IC conteria 95? Quanto de margem você precisaria para decidir (qual `n` daria IC inteiro acima de 95%)?

---
class: inverse, center, middle

# Aula 4 · IC para o desvio padrão (σ)

### API em produção: a latência é **estável** o bastante?

### (χ² de Pearson — IC assimétrico)

---

## 4.1 Situação-problema

Você é **engenheiro(a) de software** e precisa definir um **SLO de variabilidade** (jitter) para uma API crítica de pagamento.

- `n = 21` requisições amostradas em teste de carga
- Desvio padrão amostral observado: **s = 10,4 ms**
- **SLO proposto pelo time:** desvio padrão ≤ 8 ms

> Reportar "s = 10,4 ms" é uma fotografia pontual. A pergunta honesta é: **qual a faixa plausível para o verdadeiro σ?**

---

## 4.2 Perguntas a responder

1. Qual o **IC 95%** para o desvio padrão real σ da latência?
2. Esse IC é **compatível** com o limite de SLO de 8 ms?

---

## 4.3 Teoria — por que estimar σ?

- A **média** diz o valor típico. O **desvio padrão** diz o quanto o sistema **oscila**.
- SLOs modernos (latência, qualidade, processo) são definidos em termos de **dispersão** — P95, P99, jitter, variabilidade.
- A distribuição amostral de `(n−1)·s²/σ²` segue **qui-quadrado (χ²)** com `gl = n − 1`.
- A χ² é **assimétrica** ⇒ o IC para σ **não** fica centrado em `s`.

---

## 4.3 Teoria — fórmula do IC para σ

`$$\text{IC}_{1-\alpha}(\sigma) = \left(\sqrt{\frac{(n-1)\,s^2}{\chi^2_{\alpha/2,\ gl}}};\;\sqrt{\frac{(n-1)\,s^2}{\chi^2_{1-\alpha/2,\ gl}}}\right)$$`

- **Numerador:** soma de quadrados corrigida (`(n−1)·s²`).
- **Denominador:** quantis da χ² que cortam **as caudas** (α/2 e 1−α/2).
- **Por que essa ordem invertida?** O limite **inferior** do IC usa o quantil **maior** (χ²_{α/2}), porque ele está no denominador — divide mais, dá menor.
- **Interpretação:** se repetíssemos o procedimento infinitas vezes, ~95% dos intervalos conteriam o verdadeiro σ.

---

## 4.4 Resolução — passo a passo

```
## n = 21 | s = 10.40 ms | gl = 20 | 1−α = 0.95
```

```
## χ²_{0.975; 20} = 34.170  (denominador da cauda superior)
```

```
## χ²_{0.025; 20} = 9.591  (denominador da cauda inferior)
```

```
## (n−1)·s² = 20 × 108.160 = 2163.20
```

```
## σ²_inf = 2163.20 / 34.170 = 63.308 → σ_inf = 7.957 ms
```

```
## σ²_sup = 2163.20 / 9.591 = 225.550 → σ_sup = 15.018 ms
```

```
## 
## IC 95% para σ = (7.96 ; 15.02) ms
```

---

## 4.4 Resolução — visualizando o IC

![](IC_Engenharia_Software_files/figure-html/unnamed-chunk-8-1.png)

> A área central em azul cobre 95%. Os cortes vermelhos delimitam o IC para **σ²**. Tire a raiz quadrada para ter o IC para **σ**.

---

## 4.5 Reflexão + para casa

- O IC 95% para σ é **(7,96 ; 15,02) ms**. O **limite de SLO** proposto era **8 ms**.
- O limite inferior (7,96) **encosta** no limite de 8 ms. **Decisão apertada.**
- A **assimetria** do IC reflete a assimetria da χ²: `s = 10,4` está mais perto do limite superior.
- **Erro comum a evitar:** calcular o IC para σ como `s ± 1,96·s/√(2n)` (aproximação Normal). Para n pequeno, **não funciona**.
- A interpretação do IC para σ² e para σ é a **mesma lógica frequentista** do IC para μ.

> **Para casa:** Colete (ou simule em R) 25 tempos de resposta de uma API de sua escolha. Construa o IC 95% para σ. **O limite inferior do IC é menor que o SLO que você gostaria de prometer?** O que isso diz sobre o tamanho da amostra que você precisaria?

---
class: inverse, center, middle

# Tabela de consulta · qual teste para qual estatística

| Parâmetro | IC | TH (2 grupos) | Premissa |
|---|---|---|---|
| μ (σ conhecido) | Z | Z | σ histórico |
| μ (σ desc.) | **t** ← Aulas 1, 2 | **t Welch** | Normalidade |
| p (proporção) | **Z** ← Aula 3 | **Z duas prop.** | n·p̂ ≥ 5 |
| σ | **χ²** ← Aula 4 | **F** | Normalidade |

---

# Dúvidas?