PROJETO INTEGRADOR — PROBABILIDADE E ESTATÍSTICA

Sistema de Informação

PARTE 1 — ENUNCIADO GERAL DO PROJETO INTEGRADOR

1. Identificação

Disciplina: Probabilidade e Estatística
Curso: Sistema de Informação
Modalidade: Projeto Integrador (PI) em equipe (máximo de 4 integrantes)
Carga horária do PI: Atividade final (10 pontos — peso 2)
Prazo único: 1 semana para execução, entrega e apresentação

2. Objetivo Geral

Aplicar os conceitos de Estatística Descritiva, Probabilidade, Variáveis Aleatórias e Distribuições, Intervalo de Confiança e Teste de Hipóteses para uma única amostra na análise de um problema real (ou simulado com base realista) de Tecnologia da Informação e Sistemas de Informação — cobrindo qualidade de software, suporte, infraestrutura, dados, segurança, DevOps e BI.

3. Objetivos Específicos

Compreender um processo de TI (qualidade de software, help desk, banco de dados, segurança, DevOps, BI) a partir de dados.
Organizar, descrever e interpretar conjuntos de dados por meio de medidas de tendência central, dispersão e representação gráfica adequada.
Calcular probabilidades e modelar o comportamento de variáveis aleatórias relevantes ao problema (latência, tempo de atendimento, contagem de incidentes, proporção de defeitos).
Construir e interpretar intervalos de confiança para a média, proporção ou variância populacional.
Formular, executar e interpretar testes de hipóteses para uma única amostra, com diferentes níveis de informação sobre o desvio padrão (σ conhecido ou desconhecido).
Comunicar tecnicamente as conclusões, com respeito aos limites da análise e à ética no uso de dados.

4. Estrutura da Equipe

Equipes com máximo de 4 integrantes, definidas pelos próprios alunos.
Cada equipe recebe um cenário distinto, conforme a Parte 2 deste documento.
A composição deve priorizar diversidade de perfis (desenvolvimento, infraestrutura, dados, gestão) e equilíbrio de responsabilidades.
É vedada a troca de cenário entre equipes sem autorização do docente.

5. Guia de Resolução do Problema (substitui o cronograma semanal)

O PI é executado em 1 semana. A equipe deve seguir o guia abaixo, passo a passo, e registrar a evidência de cada passo no relatório.

Passo 1 — Imersão no problema

Ler o cenário atribuído em profundidade.
Identificar a variável de interesse, o parâmetro populacional-alvo (média, proporção, variância, λ, p) e a pergunta de decisão.
Listar, no relatório, as suposições admitidas e os limites do estudo.

Passo 2 — Construção e organização da base de dados

Reproduzir a tabela do cenário em planilha (Excel, Google Sheets ou LibreOffice Calc).
Conferir unidades, contagens e identificadores.
Calcular as medidas-resumo e os gráficos dos Passos 3 e 4 na própria planilha, com fórmulas auditáveis.

Passo 3 — Análise descritiva

Calcular média, mediana, desvio padrão, mínimo, máximo, amplitude e, quando aplicável, coeficiente de variação.
Construir pelo menos um gráfico adequado (histograma, boxplot, gráfico de barras, gráfico de linhas temporal, Pareto).
Interpretar o padrão observado (simetria, dispersão, presença de outliers) antes de qualquer teste.

Passo 4 — Análise probabilística

Identificar a distribuição teórica plausível para o fenômeno (Binomial, Poisson, Hipergeométrica, Geométrica, Binomial Negativa, Exponencial ou Normal), com justificativa.
Calcular pelo menos uma probabilidade no contexto do problema (por exemplo: “P(observar mais de X ocorrências) sob a distribuição adotada”).

Passo 5 — Inferência estatística (intervalo de confiança)

Construir o IC 95 % (ou outro nível, com justificativa) para o parâmetro-alvo.
Interpretar o IC em linguagem de TI/SI, sem afirmar “probabilidade de que o parâmetro esteja no intervalo” (interpretação frequentista).

Passo 6 — Teste de hipótese para uma única amostra

Definir H₀, H₁, nível de significância α (com justificativa) e tipo de teste (unilateral ou bilateral).
Escolher a estatística de teste adequada (Z, t, χ²), informando se σ é conhecido ou estimado.
Calcular a estatística de teste, o valor-p e a regra de decisão.
Decidir rejeitar ou não rejeitar H₀ e interpretar a decisão em linguagem de TI/SI.

Passo 7 — Conclusão técnica e limites

Articular o resultado estatístico com a decisão de TI/SI (manter o processo, investigar causa-raiz, revisar meta, ajustar configuração, refatorar consulta, etc.).
Declarar limites: tamanho da amostra, escopo, possíveis vieses, generalização.
Listar recomendações fundamentadas nos dados.

Passo 8 — Comunicação e apresentação

Relatório escrito em PDF ou DOCX, com capa, sumário, seções numeradas, tabelas, gráficos, fórmulas, comandos utilizados e referências (ABNT ou APA).
Seminário de 10 a 15 minutos por equipe, com 5 minutos de arguição.

Sugestão de divisão de tarefas para 4 alunos

Aluno	Responsabilidade principal
A	Imersão, organização da base, descritiva (Passos 1–3)
B	Probabilidade, modelo teórico, probabilidades calculadas (Passo 4)
C	IC, teste de hipótese, valor-p (Passos 5–6)
D	Conclusão, limites, relatório escrito, ensaio da apresentação (Passos 7–8)

6. Entregáveis Obrigatórios

Relatório técnico (PDF ou DOCX) contendo:
- Capa com identificação da equipe, cenário, disciplina e professor.
- Contextualização do problema.
- Base de dados completa, em tabela.
- Estatísticas descritivas (com interpretação).
- Gráfico(s) com legendas, títulos e fonte.
- Modelo probabilístico adotado, com justificativa e cálculo de probabilidades.
- Intervalo de confiança (nível justificado).
- Teste de hipótese (H₀, H₁, α, estatística de teste, valor-p, decisão).
- Conclusão técnica, recomendações e limites da análise.
- Referências bibliográficas (ABNT ou APA).
Seminário de apresentação (10 a 15 minutos por equipe, com 5 minutos para arguição).

7. Requisitos Técnicos Mínimos

Toda apresentação deve conter, no mínimo: - Descrição dos dados (média, mediana, variância, desvio padrão, mínimo, máximo — quando aplicável). - Pelo menos um gráfico adequado ao tipo de variável e ao objetivo (histograma, boxplot, barras, Pareto, linhas temporal). Não é permitido o uso de análise de correlação como foco do trabalho. - Cálculo e interpretação de pelo menos uma probabilidade no contexto do problema, com modelo teórico explícito. - Construção e interpretação de um intervalo de confiança (95 %, 90 % ou 99 %, com justificativa). - Execução e interpretação de um teste de hipótese para uma única amostra, com nível de significância α definido e justificado. - Conclusão técnica com discussão sobre os limites da análise (tamanho da amostra, possíveis vieses, escopo, generalização).

8. Condutas Esperadas

Autoria e honestidade acadêmica: todos os cálculos, gráficos e interpretações devem ser de produção da equipe. Plágio total ou parcial implica nota zero e encaminhamento à coordenação. O uso de IA generativa é permitido como apoio, mas não substitui a produção da equipe; todo trecho gerado por IA deve ser revisado, validado e explicitamente creditado.
Coerência metodológica: as análises estatísticas devem estar alinhadas ao tipo de variável, à distribuição admitida e à pergunta do problema.
Comunicação técnica: uso correto da terminologia estatística, com clareza, organização e referência a fontes.
Ética no uso de dados: mesmo em dados sintéticos, as equipes devem tratar a análise com o mesmo rigor que aplicariam a dados reais. Em dados reais, deve-se observar a Lei Geral de Proteção de Dados (LGPD), anonimizando identificadores quando necessário.

9. Observação Final do Enunciado Geral

Este enunciado é único. As especificidades — contexto, empresa, base de dados, perguntas, indicador de processo, modelo probabilístico e teste inferencial — variam de acordo com o cenário atribuído a cada equipe e estão detalhadas na Parte 2 deste documento.

PARTE 2 — CENÁRIOS POR EQUIPE

A seguir, são apresentados 10 cenários distintos, ordenados por progressão didática (do mais simples ao mais completo). Cada equipe recebe apenas o cenário correspondente à sua numeração, previamente divulgado pelo docente.

A alocação garante: - 5 modelos probabilísticos diferentes (Binomial, Poisson, Hipergeométrica, Geométrica, Binomial Negativa) alocados em contextos variados de Sistemas de Informação, com progressão didática; Exponencial e Normal aparecem em papéis complementares. - 4 tipos de teste inferencial (Z com σ conhecido para média, Z para proporção, t de Student com σ desconhecido, qui-quadrado para variância). - Mix de resultados: cenários em que H₀ não é rejeitada, cenários em que H₀ é rejeitada e cenários borderline (valor-p próximo de α), exigindo interpretação crítica. - Contextos variados: qualidade de software, help desk, banco de dados, segurança, DevOps, BI.

EQUIPE 1 — DEFÉITOS CRÍTICOS EM RELEASE DE SOFTWARE (BINOMIAL)

1.1 Contexto

A DevLog Sistemas S.A. mantém um sistema ERP corporativo. A política de qualidade de software admite que a proporção de defeitos (bugs) críticos por release não ultrapasse 6 % dos itens entregues. A engenharia de QA acredita que o processo esteja dentro da meta.

1.2 Problema de Sistemas de Informação

Verificar se a proporção de bugs críticos por release é superior a 6 %, com base em 30 releases de 2025.

1.3 Base de Dados

Tabela 1 — Itens entregues e bugs críticos por release (30 releases, 2025).

Release	Itens	Bugs	Release	Itens	Bugs	Release	Itens	Bugs
1	200	9	11	200	11	21	200	10
2	200	12	12	200	8	22	200	13
3	200	10	13	200	14	23	200	9
4	200	11	14	200	9	24	200	12
5	200	13	15	200	12	25	200	8
6	200	8	16	200	10	26	200	11
7	200	12	17	200	9	27	200	10
8	200	10	18	200	11	28	200	13
9	200	9	19	200	12	29	200	9
10	200	11	20	200	10	30	200	8

1.4 Perguntas

Pergunta principal: A proporção de bugs críticos é superior a 6 % (política interna)?
Pergunta secundária 1: Qual a probabilidade aproximada de um release sorteado aleatoriamente apresentar mais de 14 bugs críticos?
Pergunta secundária 2: Construir um IC 95 % para a verdadeira proporção de bugs críticos.

1.5 Análise Estatística Esperada

Estatística descritiva: proporção média ≈ 0,053, desvio padrão, histograma.
Modelo probabilístico: Binomial com n = 200 e p̂ amostral.
Probabilidade: P(X > 14) com p̂ ≈ 0,053.
Inferência: IC 95 % para a proporção (Wilson ou Normal com correção).
Teste de hipótese: Z unilateral à direita para proporção (H₀: p = 0,06 contra H₁: p > 0,06), α = 0,05. Resultado esperado: não rejeitar H₀.
Gráfico sugerido: barras com a proporção de bugs por release e linha do limite de 6 %.

1.6 Orientação para Interpretação e Conclusão

Reportar: “ao nível de 5 %, não há evidências estatísticas de violação da política”.
Recomendar manter o controle, com monitoria via DORA change failure rate.
Limites: amostra de 30 releases, ausência de estratificação por squad e por tipo de item.

EQUIPE 2 — CHAMADOS CRÍTICOS DE HELPDESK POR DIA (POISSON)

2.1 Contexto

A HelpDesk Ágil S.A. presta suporte técnico de primeiro nível. A gestão de operações considera que uma média superior a 4 chamados críticos por dia indica degradação da base instalada. A coordenação suspeita que a média esteja acima do limite.

2.2 Problema de Sistemas de Informação

Verificar se a média diária de chamados críticos é superior a 4, com base em 30 dias úteis.

2.3 Base de Dados

Tabela 1 — Chamados críticos por dia (30 dias, outubro/2025).

Dia	Chamados	Dia	Chamados	Dia	Chamados
1	4	11	6	21	4
2	5	12	4	22	5
3	3	13	7	23	8
4	6	14	5	24	6
5	4	15	6	25	5
6	7	16	4	26	7
7	5	17	5	27	6
8	4	18	8	28	5
9	6	19	4	29	4
10	5	20	6	30	6

2.4 Perguntas

Pergunta principal: A média diária de chamados críticos é superior a 4?
Pergunta secundária 1: A variável pode ser razoavelmente modelada por Poisson? (verificar razão variância/média).
Pergunta secundária 2: Construir um IC 95 % para a média diária.

2.5 Análise Estatística Esperada

Estatística descritiva: média ≈ 5,3, variância, histograma.
Modelo probabilístico: Poisson com λ̂ = média amostral.
Probabilidade: P(X ≥ 7) sob Poisson(5,3).
Inferência: IC 95 % para λ via qui-quadrado.
Teste de hipótese: t unilateral à direita (H₀: μ = 4 contra H₁: μ > 4), α = 0,05. Resultado esperado: rejeitar H₀.
Gráfico sugerido: histograma com a curva Poisson sobreposta (λ = 5,3).

2.6 Orientação para Interpretação e Conclusão

Reportar: “há evidências estatísticas de que a média diária é superior a 4”.
Recomendar ações (revisão do runbook de incidentes, FAQ dinâmico, base de conhecimento, autoatendimento).
Limites: amostra de 30 dias, ausência de estratificação por tipo de cliente e por severidade.

EQUIPE 3 — INSPEÇÃO DE COMPONENTES CRÍTICOS SEM REPOSIÇÃO (HIPERGEOMÉTRICA, BORDERLINE)

3.1 Contexto

A PlenoSys Hardware S.A. importa lotes de 500 módulos eletrônicos. A norma de aceitação exige que a proporção de módulos defeituosos no lote não ultrapasse 4 %. Para cada lote, uma amostra de 25 módulos é inspecionada sem reposição. O controle de qualidade vem registrando proporções próximas do limite.

3.2 Problema de Sistemas de Informação

Verificar se a proporção de defeituosos no lote é superior a 4 %, a partir de 30 amostras de 25 módulos.

3.3 Base de Dados

Tabela 1 — Módulos defeituosos encontrados em amostras de 25, em 30 lotes.

Lote	Defeituosos	Lote	Defeituosos	Lote	Defeituosos
1	1	11	2	21	0
2	0	12	1	22	1
3	1	13	0	23	2
4	2	14	1	24	1
5	1	15	2	25	0
6	0	16	1	26	1
7	1	17	0	27	2
8	2	18	1	28	1
9	0	19	2	29	0
10	1	20	1	30	1

3.4 Perguntas

Pergunta principal: A proporção de defeituosos no lote é superior a 4 % (norma interna)?
Pergunta secundária 1: Por que a Binomial é inadequada e a Hipergeométrica é indicada?
Pergunta secundária 2: Calcule a probabilidade de, em uma amostra de 25 módulos de um lote com 20 defeituosos (4 %), encontrar 2 ou mais defeituosos.

3.5 Análise Estatística Esperada

Estatística descritiva: proporção amostral média ≈ 0,04, histograma.
Modelo probabilístico: Hipergeométrica (N = 500, n = 25, K = número de defeituosos no lote).
Probabilidade: P(X ≥ 2 | N = 500, n = 25, K = 20) pela Hipergeométrica.
Inferência: IC 95 % para a proporção (Haldane-Anscombe ou Wilson).
Teste de hipótese: Z unilateral à direita para proporção (H₀: p = 0,04 contra H₁: p > 0,04), α = 0,05. Resultado esperado: borderline (p̂ ≈ 0,040; valor-p próximo de 0,5).
Gráfico sugerido: histograma do número de defeituosos por amostra, com a Hipergeométrica sobreposta.

3.6 Orientação para Interpretação e Conclusão

O valor-p próximo de 0,5 exige interpretação crítica: a estatística, isoladamente, não resolve.
Recomendar combinar o resultado estatístico com evidências qualitativas (reclamações de campo, histórico do fornecedor) antes de bloquear lotes.
Limites: amostra de 30 lotes, K desconhecido na população (estimado por p̂).

EQUIPE 4 — NÚMERO DE BUILDS ATÉ A PRIMEIRA FALHA (GEOMÉTRICA)

4.1 Contexto

A PipelineForge DevOps S.A. opera um sistema de integração contínua. Conta-se o número de builds executados até a primeira falha (pipeline interrompido por erro de teste, lint ou compilação). O SRE espera que a média de builds entre falhas seja de pelo menos 80. A operação tem apresentado falhas mais cedo do que o esperado.

4.2 Problema de Sistemas de Informação

Verificar se a média de builds até a primeira falha é inferior a 80, com base em 30 sequências de operação.

4.3 Base de Dados

Tabela 1 — Número de builds até a primeira falha (30 sequências, 2025).

Sequência	Builds	Sequência	Builds	Sequência	Builds
1	62	11	70	21	58
2	75	12	65	22	72
3	55	13	80	23	60
4	68	14	58	24	75
5	72	15	62	25	65
6	60	16	78	26	55
7	82	17	60	27	78
8	58	18	70	28	62
9	65	19	55	29	68
10	75	20	72	30	70

4.4 Perguntas

Pergunta principal: A média de builds até a primeira falha é inferior a 80?
Pergunta secundária 1: Qual a probabilidade de a primeira falha ocorrer antes do build de número 50, admitindo Geométrica com p̂ = 1/67?
Pergunta secundária 2: Construir um IC 95 % para a média da distribuição.

4.5 Análise Estatística Esperada

Estatística descritiva: média ≈ 66,7, desvio padrão, histograma.
Modelo probabilístico: Geométrica (nº de tentativas até o 1º sucesso = falha).
Probabilidade: P(X < 50) com p̂ = 1/67.
Inferência: IC 95 % para μ = 1/p.
Teste de hipótese: t unilateral à esquerda (H₀: μ = 80 contra H₁: μ < 80), α = 0,05. Resultado esperado: rejeitar H₀.
Gráfico sugerido: histograma com a curva Geométrica sobreposta (p̂ = 1/67).

4.6 Orientação para Interpretação e Conclusão

Reportar: “há evidências estatísticas de que a média de builds até a primeira falha é inferior a 80”.
Recomendar revisão da suíte de testes, hardening do pipeline, pré-validação de dependências, gates de qualidade.
Limites: 30 sequências, possível não estacionariedade do pipeline ao longo do ano.

EQUIPE 5 — TEMPO ENTRE INCIDENTES DE SRE (EXPONENCIAL)

5.1 Contexto

A SREWatch Operações S.A. monitora a infraestrutura de uma plataforma SaaS. O plano de continuidade estabelece que o tempo médio entre incidentes (MTBI) deve ser de pelo menos 200 horas. A equipe suspeita que o MTBI esteja abaixo da meta, especialmente após mudanças recentes no deploy.

5.2 Problema de Sistemas de Informação

Verificar se o MTBI é inferior a 200 horas, com base em 30 registros de incidentes.

5.3 Base de Dados

Tabela 1 — Tempo entre incidentes (em horas) — 30 registros (2024–2025).

Registro	Tempo (h)	Registro	Tempo (h)	Registro	Tempo (h)
1	150	11	190	21	160
2	220	12	130	22	210
3	140	13	250	23	145
4	180	14	170	24	195
5	165	15	200	25	175
6	240	16	155	26	220
7	135	17	185	27	130
8	260	18	210	28	200
9	145	19	170	29	180
10	175	20	165	30	155

5.4 Perguntas

Pergunta principal: O MTBI é inferior a 200 horas?
Pergunta secundária 1: A variável pode ser razoavelmente modelada por uma Exponencial? Justifique.
Pergunta secundária 2: Construir um IC 95 % para o MTBI.

5.5 Análise Estatística Esperada

Estatística descritiva: média ≈ 179, desvio padrão, histograma.
Modelo probabilístico: Exponencial com média amostral.
Probabilidade: P(X < 100) = 1 − exp(−100/179).
Inferência: IC 95 % para a média da Exponencial via qui-quadrado.
Teste de hipótese: t unilateral à esquerda (H₀: μ = 200 contra H₁: μ < 200), α = 0,05. Resultado esperado: borderline a rejeitar (t ≈ −2,65; valor-p ≈ 0,007). Equipe deve discutir a potência e a proximidade com o limite.
Gráfico sugerido: histograma com a curva Exponencial sobreposta (μ̂ = 179).

5.6 Orientação para Interpretação e Conclusão

Reportar com cautela: a média está abaixo da meta, mas a evidência estatística depende do teste escolhido.
Recomendar combinar o resultado com o impacto operacional dos incidentes antes de decidir por mudanças estruturais.
Limites: amostra de 30 registros, possível mistura de tipos de incidente (rede, aplicação, banco).

EQUIPE 6 — REPROCESSOS POR SPRINT COM SUPERDISPERSÃO (BINOMIAL NEGATIVA)

6.1 Contexto

A SprintForge Tecnologia S.A. mede o número de itens reabertos por sprint (reprocessos) em um squad. A média histórica aceitável é de até 3 reaberturas por sprint. O controle de processo tem registrado superdispersão: algumas sprints apresentam muitos reprocessos, enquanto outras têm quase nenhum.

6.2 Problema de Sistemas de Informação

Verificar se a média de reprocessos por sprint é superior a 3, com base em 30 sprints.

6.3 Base de Dados

Tabela 1 — Reprocessos por sprint (30 sprints, 2025).

Sprint	Reprocessos	Sprint	Reprocessos	Sprint	Reprocessos
1	4	11	5	21	6
2	2	12	3	22	4
3	6	13	7	23	5
4	3	14	4	24	3
5	5	15	8	25	7
6	8	16	5	26	4
7	3	17	3	27	6
8	4	18	7	28	5
9	6	19	4	29	3
10	2	20	6	30	4

6.4 Perguntas

Pergunta principal: A média de reprocessos por sprint é superior a 3?
Pergunta secundária 1: Por que a Poisson é inadequada e a Binomial Negativa é mais indicada?
Pergunta secundária 2: Ajuste uma Binomial Negativa e estime seus parâmetros.

6.5 Análise Estatística Esperada

Estatística descritiva: média ≈ 4,6, variância ≈ 2,5 (superdispersão), histograma.
Modelo probabilístico: Binomial Negativa com parâmetros estimados.
Probabilidade: P(X ≥ 6) sob Binomial Negativa ajustada.
Inferência: IC 95 % para a média (via t-Student).
Teste de hipótese: t unilateral à direita (H₀: μ = 3 contra H₁: μ > 3), α = 0,05. Resultado esperado: rejeitar H₀.
Gráfico sugerido: histograma com Binomial Negativa e Poisson sobrepostas.

6.6 Orientação para Interpretação e Conclusão

Reportar: “há evidências estatísticas de que a média é superior a 3, com variabilidade superior à prevista por uma Poisson”.
Recomendar investigar causas especiais de variabilidade (dívida técnica, mudança de requisito, dependências entre squads).
Limites: amostra de 30 sprints, Binomial Negativa com r estimado tem maior incerteza que a Poisson.

EQUIPE 7 — ACESSOS INVÁLIDOS POR DIA EM API (POISSON)

7.1 Contexto

A ShieldWare Security S.A. monitora tentativas de acesso inválido em uma API pública. A política de segurança admite no máximo 8 acessos inválidos por dia em regime normal. A equipe de SOC suspeita que a média esteja acima do limite, possivelmente indicando tentativa de ataque.

7.2 Problema de Sistemas de Informação

Verificar se a média diária de acessos inválidos é superior a 8, com base em 30 dias.

7.3 Base de Dados

Tabela 1 — Acessos inválidos por dia (30 dias, outubro/2025).

Dia	Acessos	Dia	Acessos	Dia	Acessos
1	9	11	12	21	10
2	11	12	10	22	13
3	8	13	14	23	9
4	13	14	10	24	12
5	10	15	11	25	11
6	14	16	9	26	14
7	11	17	13	27	10
8	10	18	12	28	12
9	15	19	9	29	11
10	12	20	11	30	13

7.4 Perguntas

Pergunta principal: A média diária de acessos inválidos é superior a 8?
Pergunta secundária 1: A variável pode ser razoavelmente modelada por Poisson?
Pergunta secundária 2: Construir um IC 95 % para a média diária.

7.5 Análise Estatística Esperada

Estatística descritiva: média ≈ 11,2, variância, histograma.
Modelo probabilístico: Poisson com λ̂ = média amostral.
Probabilidade: P(X ≥ 14) sob Poisson(11,2).
Inferência: IC 95 % para λ via qui-quadrado.
Teste de hipótese: t unilateral à direita (H₀: μ = 8 contra H₁: μ > 8), α = 0,05. Resultado esperado: rejeitar H₀.
Gráfico sugerido: histograma com a curva Poisson sobreposta (λ = 11,2).

7.6 Orientação para Interpretação e Conclusão

Reportar: “há evidências estatísticas de que a média diária é superior a 8”.
Recomendar ações (revisão de rate limit, ativação de CAPTCHA, bloqueio de IP, MFA em endpoints sensíveis).
Limites: amostra de 30 dias, ausência de estratificação por endpoint e por tipo de falha.

EQUIPE 8 — VARIABILIDADE DA LATÊNCIA EM API (QUI-QUADRADO PARA VARIÂNCIA)

8.1 Contexto

A APIxpress Gateway S.A. opera uma API REST pública. O SLA de UX exige que o desvio padrão da latência não ultrapasse 30 ms, para garantir uma experiência P95 consistente. A engenharia de SRE acredita que a variabilidade esteja dentro do limite.

8.2 Problema de Sistemas de Informação

Verificar se o desvio padrão da latência é superior a 30 ms, com base em 30 medições.

8.3 Base de Dados

Tabela 1 — Latência (em ms) de 30 requisições (amostra de produção, outubro/2025).

Amostra	Latência	Amostra	Latência	Amostra	Latência
1	180	11	195	21	175
2	210	12	200	22	220
3	195	13	215	23	185
4	220	14	180	24	205
5	200	15	210	25	195
6	215	16	200	26	215
7	185	17	220	27	190
8	205	18	195	28	210
9	200	19	200	29	200
10	190	20	185	30	205

8.4 Perguntas

Pergunta principal: O desvio padrão da latência é superior a 30 ms?
Pergunta secundária 1: Construir um IC 95 % para a variância σ².
Pergunta secundária 2: Calcule o P95 empírico e compare com o limite de UX.

8.5 Análise Estatística Esperada

Estatística descritiva: média ≈ 201,3, desvio padrão ≈ 13,2, histograma, boxplot.
Modelo probabilístico: Normal (latência é contínua).
Inferência: IC 95 % para σ²: ((n−1)·s²/χ²ₐ/₂, (n−1)·s²/χ²₁₋ₐ/₂).
Teste de hipótese: qui-quadrado unilateral à direita (H₀: σ² = 30² contra H₁: σ² > 30²), α = 0,05. Resultado esperado: não rejeitar H₀.
Gráfico sugerido: histograma com a curva Normal sobreposta; boxplot.

8.6 Orientação para Interpretação e Conclusão

Reportar: “ao nível de 5 %, não há evidências estatísticas de que σ seja superior a 30 ms”.
Recomendar manter o controle, com monitoria contínua de P95 e P99.
Limites: amostra de 30 requisições, normalidade presumida.

EQUIPE 9 — CONVERSÃO DE CHECKOUT EM E-COMMERCE (BINOMIAL COM σ HISTÓRICO)

9.1 Contexto

A UXtrack Analytics S.A. monitora a taxa de conversão de checkout de um e-commerce. A referência de mercado é de 65 % de conversão. O desvio padrão histórico do percentual de conversão, controlado por CEP nos últimos 12 meses, é σ = 4 %. O time de produto quer testar se a taxa atual está abaixo da referência, usando a referência histórica de variabilidade.

9.2 Problema de Sistemas de Informação

Verificar se a taxa de conversão de checkout é inferior a 65 %, com base em 30 semanas e σ histórico conhecido.

9.3 Base de Dados

Tabela 1 — Taxa de conversão de checkout (%) em 30 semanas (janeiro/2024 a junho/2025).

Semana	Conversão (%)	Semana	Conversão (%)	Semana	Conversão (%)
1	60	11	63	21	61
2	62	12	60	22	64
3	58	13	65	23	60
4	61	14	62	24	63
5	64	15	59	25	58
6	59	16	61	26	62
7	63	17	64	27	60
8	60	18	60	28	61
9	62	19	63	29	59
10	58	20	61	30	60

Resumo: p̂ = 0,611 (média), σ histórico = 0,04.

9.4 Perguntas

Pergunta principal: A taxa de conversão é inferior a 65 % (referência)?
Pergunta secundária 1: Construir um IC 95 % para a taxa de conversão usando o σ histórico.
Pergunta secundária 2: Por que, neste cenário, o teste Z com σ conhecido é mais adequado que o teste Z com p̂ estimado?

9.5 Análise Estatística Esperada

Estatística descritiva: proporção amostral, valor de σ histórico.
Modelo probabilístico: aproximação Normal para a proporção.
Inferência: IC 95 % para p usando σ conhecido: p̂ ± z_{α/2} · σ.
Teste de hipótese: Z unilateral à esquerda para proporção (H₀: p = 0,65 contra H₁: p < 0,65), α = 0,05, com σ = 0,04. Resultado esperado: rejeitar H₀ (Z = (0,611 − 0,65)/0,04 = −0,98; valor-p ≈ 0,16 — borderline). Equipe deve discutir o impacto do σ no resultado.
Gráfico sugerido: gráfico de linhas temporal da conversão com a linha de referência de 65 %.

9.6 Orientação para Interpretação e Conclusão

Reportar com clareza sobre o σ usado: o resultado depende criticamente do σ histórico adotado.
Recomendar ações (testes A/B no checkout, simplificação do formulário, múltiplas formas de pagamento, redução de campos obrigatórios).
Limites: σ histórico pode não representar a variabilidade atual; verificar estabilidade do processo por carta de controle.

EQUIPE 10 — LATÊNCIA EM CONSULTAS SQL (Z PARA MÉDIA, σ CONHECIDO, NÃO REJEITA)

10.1 Contexto

A DataPulse Sistemas S.A. monitora a latência de consultas SQL em um data warehouse. A meta de SLA é de 200 ms. O desvio padrão histórico do processo, controlado por CEP nos últimos 24 meses, é σ = 15 ms. O time de banco de dados quer testar se a latência média atual está acima da meta, usando a referência histórica.

10.2 Problema de Sistemas de Informação

Verificar se a latência média é superior a 200 ms, com base em 30 medições e σ histórico conhecido.

10.3 Base de Dados

Tabela 1 — Latência (em ms) de 30 consultas (outubro/2025).

Consulta	Latência	Consulta	Latência	Consulta	Latência
1	195	11	200	21	192
2	205	12	198	22	210
3	198	13	210	23	195
4	210	14	195	24	200
5	200	15	205	25	198
6	215	16	200	26	210
7	195	17	215	27	192
8	205	18	200	28	205
9	200	19	198	29	200
10	198	20	205	30	195

Resumo: x̄ = 202,0 ms, σ histórico = 15 ms.

10.4 Perguntas

Pergunta principal: A latência média é superior a 200 ms (meta), considerando σ histórico conhecido?
Pergunta secundária 1: Construir um IC 95 % para a média usando o σ histórico.
Pergunta secundária 2: Compare o resultado deste teste com o que seria obtido pelo teste t. Em que situação eles coincidem?

10.5 Análise Estatística Esperada

Estatística descritiva: média amostral, desvio padrão amostral, histograma.
Modelo probabilístico: Normal (σ conhecido por CEP).
Inferência: IC 95 % para μ com σ conhecido: x̄ ± z_{α/2} · σ/√n.
Teste de hipótese: Z unilateral à direita (H₀: μ = 200 contra H₁: μ > 200), α = 0,05, com σ = 15. Resultado esperado: não rejeitar H₀ (x̄ = 202; Z = 0,73; valor-p ≈ 0,23).
Gráfico sugerido: histograma com a curva Normal sobreposta e a linha da meta.

10.6 Orientação para Interpretação e Conclusão

Reportar: “ao nível de 5 %, não há evidências estatísticas de que a latência média esteja acima da meta”.
Recomendar manter o processo, com monitoria contínua por APM.
Limites: σ histórico assume estabilidade do processo; se houver mudança de esquema, índice ou versão do banco, σ deve ser reestimado.

PARTE 3 — RUBRICA DE AVALIAÇÃO DO PROJETO INTEGRADOR

A avaliação do PI é feita por equipe, em escala de 0 a 10 pontos, distribuídos em cinco critérios ponderados.

Critério	Descrição	Pontuação Máxima
1. Clareza do problema e aderência ao contexto	Capacidade da equipe de apresentar o problema de Sistemas de Informação/TI com clareza, situando o cenário, o processo em análise e a relevância da questão para a tomada de decisão.	2,0
2. Organização e qualidade dos dados	Apresentação completa da base de dados em tabela, identificação correta das variáveis e das escalas de medição, consistência e integridade dos dados, registro das fontes ou do processo de geração.	2,0
3. Aplicação correta dos conceitos estatísticos	Uso correto das técnicas estatísticas: estatística descritiva, probabilidade com modelo teórico adequado, intervalo de confiança e teste de hipótese para uma única amostra. Coerência entre a técnica escolhida, o tipo de variável e a pergunta do problema.	3,0
4. Interpretação, conclusão e limites da análise	Interpretação correta dos resultados em linguagem técnica, articulação com o problema de TI/SI, recomendações fundamentadas e discussão explícita dos limites da análise (amostra, escopo, possíveis vieses, generalização).	2,0
5. Comunicação técnica e apresentação	Qualidade do relatório escrito, correção gramatical, uso adequado de tabelas e gráficos com títulos, legendas e fontes, domínio do tempo no seminário, clareza na exposição oral, postura e resposta à arguição.	1,0
Total		10,0

3.1 Critérios de Desempate e Observações Complementares

Trabalhos entregues fora do prazo sofrerão desconto de 0,5 ponto por dia útil de atraso, até o limite de 2,0 pontos.
Caso duas ou mais equipes terminem empatadas, será considerado, como critério de desempate, o domínio técnico demonstrado na arguição oral.
Relatórios entregues sem a base de dados em tabela serão penalizados em 1,0 ponto no critério 2.
Gráficos sem título, sem legenda de eixos ou sem fonte serão penalizados em 0,5 ponto por gráfico no critério 5.
A simples apresentação de fórmulas ou resultados numéricos, sem interpretação no contexto do problema, implica nota zero no critério 4.
O uso de modelo probabilístico inadequado ao tipo de variável (por exemplo, Normal para contagens sem justificativa) implica penalização de até 1,0 ponto no critério 3.
Em cenários com dados reais, o descumprimento da LGPD (anonimização, minimização) implica penalização de até 1,0 ponto no critério 4.
O uso de IA generativa (ChatGPT, Copilot, etc.) deve ser explicitamente creditado; trechos não creditados serão tratados como produção da equipe e verificados na arguição.

3.2 Escala Qualitativa de Referência (para devolutiva)

Faixa	Conceito	Descrição Sintética
9,0 a 10,0	Excelente	Domínio pleno, com interpretação crítica e recomendações fundamentadas.
7,0 a 8,9	Bom	Domínio consistente, com pequenas lacunas de interpretação.
5,0 a 6,9	Regular	Aplicação correta das técnicas, mas com interpretação superficial.
3,0 a 4,9	Insuficiente	Erros conceituais relevantes ou ausência de itens obrigatórios.
0,0 a 2,9	Insatisfatório	Trabalho não atende aos requisitos mínimos do PI.

PARTE 4 — OBSERVAÇÕES FINAIS AOS ALUNOS

4.1 Limites da Análise Estatística

Os resultados obtidos refletem apenas a amostra coletada e as condições registradas no período de análise. Generalizações devem ser feitas com cautela.
Toda conclusão estatística está associada a uma margem de erro e a um nível de confiança. Não confundir “ausência de evidência” com “evidência de ausência”.
O tamanho da amostra influencia a precisão do intervalo de confiança e a potência do teste de hipótese. Amostras pequenas podem não detectar desvios relevantes.
A normalidade dos dados é um pressuposto para o teste t e Z. Em amostras pequenas, recomenda-se avaliar a forma do histograma e, se possível, realizar testes de normalidade. Desvios acentuados devem ser reportados.
Para o teste de proporção, o produto n·p e n·(1 − p) deve ser maior ou igual a 5 para que a aproximação pela Normal seja adequada.
A modelagem por Binomial, Poisson, Hipergeométrica, Geométrica, Binomial Negativa e Exponencial deve ser avaliada quanto à sua aderência ao fenômeno, e não assumida como verdade. Em particular: Poisson exige variância ≈ média; Hipergeométrica exige amostragem sem reposição em população finita; Binomial Negativa é indicada quando há superdispersão (variância > média); Geométrica é adequada para “número de tentativas até o 1º sucesso”.
O uso de σ histórico no teste Z é aceitável apenas se o processo estiver estável (sem mudança de arquitetura, deploy, fornecedor de nuvem ou método de coleta). Caso contrário, σ deve ser estimado da própria amostra e usa-se o teste t.

4.2 Ética, Proteção de Dados e Autoria

Os dados deste PI são fictícios e foram elaborados com fins didáticos, mas devem ser tratados com o mesmo rigor que dados reais exigem.
É vedada a manipulação intencional de dados para obter resultados favoráveis. Se necessário, os dados podem ser depurados, com registro explícito do critério utilizado.
Em cenários com dados reais, deve-se observar a Lei Geral de Proteção de Dados (LGPD), anonimizando identificadores pessoais e minimizando a coleta ao necessário.
O uso de IA generativa é permitido como apoio, mas a equipe é integralmente responsável pela veracidade dos cálculos e pela coerência das interpretações. Todo trecho gerado por IA deve ser explicitamente creditado no relatório.
Citações a fontes externas devem seguir as normas da ABNT ou APA, conforme orientação do docente.
A autoria do trabalho é da equipe. Cópias, ainda que parciais, serão tratadas como plágio.

4.3 Coerência e Comunicação Técnica

O texto deve usar terminologia estatística precisa (por exemplo, “evidências estatísticas de que…”, “ao nível de 5 % de significância, rejeita-se H₀”), evitando afirmações categóricas como “comprovou-se que…”.
O gráfico deve ter título claro, rótulos nos eixos, legenda (quando necessário) e fonte. Cores devem ter função, não apenas efeito estético.
As conclusões devem articular o resultado estatístico com a decisão de TI/SI, indicando a ação recomendada e os limites da recomendação.
Em cenários com resultado borderline (valor-p próximo de α), a equipe deve explicitar a incerteza e discutir o que isso significa para a decisão, em vez de “forçar” uma conclusão.
A apresentação oral deve respeitar o tempo e priorizar a síntese: problema, método, resultado principal, conclusão e recomendação. Cálculos detalhados ficam no relatório escrito.

4.4 Sugestões de Boas Práticas

Construir a base de dados em planilha eletrônica desde o início, registrando unidades de medida, timestamps e data de coleta.
Usar, quando possível, ferramentas de observabilidade (Grafana, Datadog, New Relic, Kibana) para extrair amostras do mundo real, mesmo que o PI utilize dados sintéticos.
Conferir se as perguntas do cenário estão todas respondidas no relatório, com a técnica estatística adequada a cada uma.
Revisar o relatório com atenção à coerência entre as perguntas, a análise, a conclusão e as referências.
Ensaiar a apresentação oral, cronometrando o tempo e definindo quem apresenta cada parte.
Ao utilizar software (Excel, Google Sheets, LibreOffice Calc, R, Python, Minitab, Jupyter), registrar no relatório as fórmulas ou comandos utilizados, para garantir rastreabilidade e transparência.
Ao ajustar modelos (Binomial Negativa, Exponencial, Geométrica), comparar visualmente a curva ajustada com o histograma e reportar a qualidade do ajuste.

FIM DO PROJETO INTEGRADOR — PROBABILIDADE E ESTATÍSTICA (SISTEMA DE INFORMAÇÃO)

Release	Itens	Bugs	Release	Itens	Bugs	Release	Itens	Bugs
1	200	9	11	200	11	21	200	10
2	200	12	12	200	8	22	200	13
3	200	10	13	200	14	23	200	9
4	200	11	14	200	9	24	200	12
5	200	13	15	200	12	25	200	8
6	200	8	16	200	10	26	200	11
7	200	12	17	200	9	27	200	10
8	200	10	18	200	11	28	200	13
9	200	9	19	200	12	29	200	9
10	200	11	20	200	10	30	200	8

Dia	Chamados	Dia	Chamados	Dia	Chamados
1	4	11	6	21	4
2	5	12	4	22	5
3	3	13	7	23	8
4	6	14	5	24	6
5	4	15	6	25	5
6	7	16	4	26	7
7	5	17	5	27	6
8	4	18	8	28	5
9	6	19	4	29	4
10	5	20	6	30	6

Lote	Defeituosos	Lote	Defeituosos	Lote	Defeituosos
1	1	11	2	21	0
2	0	12	1	22	1
3	1	13	0	23	2
4	2	14	1	24	1
5	1	15	2	25	0
6	0	16	1	26	1
7	1	17	0	27	2
8	2	18	1	28	1
9	0	19	2	29	0
10	1	20	1	30	1

Sequência	Builds	Sequência	Builds	Sequência	Builds
1	62	11	70	21	58
2	75	12	65	22	72
3	55	13	80	23	60
4	68	14	58	24	75
5	72	15	62	25	65
6	60	16	78	26	55
7	82	17	60	27	78
8	58	18	70	28	62
9	65	19	55	29	68
10	75	20	72	30	70

Registro	Tempo (h)	Registro	Tempo (h)	Registro	Tempo (h)
1	150	11	190	21	160
2	220	12	130	22	210
3	140	13	250	23	145
4	180	14	170	24	195
5	165	15	200	25	175
6	240	16	155	26	220
7	135	17	185	27	130
8	260	18	210	28	200
9	145	19	170	29	180
10	175	20	165	30	155

Sprint	Reprocessos	Sprint	Reprocessos	Sprint	Reprocessos
1	4	11	5	21	6
2	2	12	3	22	4
3	6	13	7	23	5
4	3	14	4	24	3
5	5	15	8	25	7
6	8	16	5	26	4
7	3	17	3	27	6
8	4	18	7	28	5
9	6	19	4	29	3
10	2	20	6	30	4

Dia	Acessos	Dia	Acessos	Dia	Acessos
1	9	11	12	21	10
2	11	12	10	22	13
3	8	13	14	23	9
4	13	14	10	24	12
5	10	15	11	25	11
6	14	16	9	26	14
7	11	17	13	27	10
8	10	18	12	28	12
9	15	19	9	29	11
10	12	20	11	30	13

Amostra	Latência	Amostra	Latência	Amostra	Latência
1	180	11	195	21	175
2	210	12	200	22	220
3	195	13	215	23	185
4	220	14	180	24	205
5	200	15	210	25	195
6	215	16	200	26	215
7	185	17	220	27	190
8	205	18	195	28	210
9	200	19	200	29	200
10	190	20	185	30	205

Semana	Conversão (%)	Semana	Conversão (%)	Semana	Conversão (%)
1	60	11	63	21	61
2	62	12	60	22	64
3	58	13	65	23	60
4	61	14	62	24	63
5	64	15	59	25	58
6	59	16	61	26	62
7	63	17	64	27	60
8	60	18	60	28	61
9	62	19	63	29	59
10	58	20	61	30	60

Consulta	Latência	Consulta	Latência	Consulta	Latência
1	195	11	200	21	192
2	205	12	198	22	210
3	198	13	210	23	195
4	210	14	195	24	200
5	200	15	205	25	198
6	215	16	200	26	210
7	195	17	215	27	192
8	205	18	200	28	205
9	200	19	198	29	200
10	198	20	205	30	195

Release	Itens	Bugs	Release	Itens	Bugs	Release	Itens	Bugs
1	200	9	11	200	11	21	200	10
2	200	12	12	200	8	22	200	13
3	200	10	13	200	14	23	200	9
4	200	11	14	200	9	24	200	12
5	200	13	15	200	12	25	200	8
6	200	8	16	200	10	26	200	11
7	200	12	17	200	9	27	200	10
8	200	10	18	200	11	28	200	13
9	200	9	19	200	12	29	200	9
10	200	11	20	200	10	30	200	8

Dia	Chamados	Dia	Chamados	Dia	Chamados
1	4	11	6	21	4
2	5	12	4	22	5
3	3	13	7	23	8
4	6	14	5	24	6
5	4	15	6	25	5
6	7	16	4	26	7
7	5	17	5	27	6
8	4	18	8	28	5
9	6	19	4	29	4
10	5	20	6	30	6

Lote	Defeituosos	Lote	Defeituosos	Lote	Defeituosos
1	1	11	2	21	0
2	0	12	1	22	1
3	1	13	0	23	2
4	2	14	1	24	1
5	1	15	2	25	0
6	0	16	1	26	1
7	1	17	0	27	2
8	2	18	1	28	1
9	0	19	2	29	0
10	1	20	1	30	1

Sequência	Builds	Sequência	Builds	Sequência	Builds
1	62	11	70	21	58
2	75	12	65	22	72
3	55	13	80	23	60
4	68	14	58	24	75
5	72	15	62	25	65
6	60	16	78	26	55
7	82	17	60	27	78
8	58	18	70	28	62
9	65	19	55	29	68
10	75	20	72	30	70

Registro	Tempo (h)	Registro	Tempo (h)	Registro	Tempo (h)
1	150	11	190	21	160
2	220	12	130	22	210
3	140	13	250	23	145
4	180	14	170	24	195
5	165	15	200	25	175
6	240	16	155	26	220
7	135	17	185	27	130
8	260	18	210	28	200
9	145	19	170	29	180
10	175	20	165	30	155

Sprint	Reprocessos	Sprint	Reprocessos	Sprint	Reprocessos
1	4	11	5	21	6
2	2	12	3	22	4
3	6	13	7	23	5
4	3	14	4	24	3
5	5	15	8	25	7
6	8	16	5	26	4
7	3	17	3	27	6
8	4	18	7	28	5
9	6	19	4	29	3
10	2	20	6	30	4

Dia	Acessos	Dia	Acessos	Dia	Acessos
1	9	11	12	21	10
2	11	12	10	22	13
3	8	13	14	23	9
4	13	14	10	24	12
5	10	15	11	25	11
6	14	16	9	26	14
7	11	17	13	27	10
8	10	18	12	28	12
9	15	19	9	29	11
10	12	20	11	30	13

Amostra	Latência	Amostra	Latência	Amostra	Latência
1	180	11	195	21	175
2	210	12	200	22	220
3	195	13	215	23	185
4	220	14	180	24	205
5	200	15	210	25	195
6	215	16	200	26	215
7	185	17	220	27	190
8	205	18	195	28	210
9	200	19	200	29	200
10	190	20	185	30	205

Semana	Conversão (%)	Semana	Conversão (%)	Semana	Conversão (%)
1	60	11	63	21	61
2	62	12	60	22	64
3	58	13	65	23	60
4	61	14	62	24	63
5	64	15	59	25	58
6	59	16	61	26	62
7	63	17	64	27	60
8	60	18	60	28	61
9	62	19	63	29	59
10	58	20	61	30	60

Consulta	Latência	Consulta	Latência	Consulta	Latência
1	195	11	200	21	192
2	205	12	198	22	210
3	198	13	210	23	195
4	210	14	195	24	200
5	200	15	205	25	198
6	215	16	200	26	210
7	195	17	215	27	192
8	205	18	200	28	205
9	200	19	198	29	200
10	198	20	205	30	195