PROJETO INTEGRADOR — PROBABILIDADE E ESTATÍSTICA
Sistema de Informação
PARTE 1 — ENUNCIADO GERAL DO PROJETO INTEGRADOR
1. Identificação
- Disciplina: Probabilidade e Estatística
- Curso: Sistema de Informação
- Modalidade: Projeto Integrador (PI) em equipe
(máximo de 4 integrantes)
- Carga horária do PI: Atividade final (10 pontos —
peso 2)
- Prazo único: 1 semana para execução, entrega e
apresentação
2. Objetivo Geral
Aplicar os conceitos de Estatística Descritiva, Probabilidade,
Variáveis Aleatórias e Distribuições, Intervalo de Confiança e Teste de
Hipóteses para uma única amostra na análise de um problema real (ou
simulado com base realista) de Tecnologia da Informação e Sistemas de
Informação — cobrindo qualidade de software, suporte, infraestrutura,
dados, segurança, DevOps e BI.
3. Objetivos Específicos
- Compreender um processo de TI (qualidade de software, help desk,
banco de dados, segurança, DevOps, BI) a partir de dados.
- Organizar, descrever e interpretar conjuntos de dados por meio de
medidas de tendência central, dispersão e representação gráfica
adequada.
- Calcular probabilidades e modelar o comportamento de variáveis
aleatórias relevantes ao problema (latência, tempo de atendimento,
contagem de incidentes, proporção de defeitos).
- Construir e interpretar intervalos de confiança para a média,
proporção ou variância populacional.
- Formular, executar e interpretar testes de hipóteses para uma única
amostra, com diferentes níveis de informação sobre o desvio padrão (σ
conhecido ou desconhecido).
- Comunicar tecnicamente as conclusões, com respeito aos limites da
análise e à ética no uso de dados.
4. Estrutura da Equipe
- Equipes com máximo de 4 integrantes, definidas
pelos próprios alunos.
- Cada equipe recebe um cenário distinto, conforme a
Parte 2 deste documento.
- A composição deve priorizar diversidade de perfis (desenvolvimento,
infraestrutura, dados, gestão) e equilíbrio de responsabilidades.
- É vedada a troca de cenário entre equipes sem
autorização do docente.
5. Guia de Resolução do Problema (substitui o cronograma
semanal)
O PI é executado em 1 semana. A equipe deve seguir o
guia abaixo, passo a passo, e registrar a evidência de cada passo no
relatório.
Passo 1 — Imersão no problema
- Ler o cenário atribuído em profundidade.
- Identificar a variável de interesse, o parâmetro populacional-alvo
(média, proporção, variância, λ, p) e a pergunta de decisão.
- Listar, no relatório, as suposições admitidas e os limites do
estudo.
Passo 2 — Construção e organização da base de dados
- Reproduzir a tabela do cenário em planilha (Excel, Google Sheets ou
LibreOffice Calc).
- Conferir unidades, contagens e identificadores.
- Calcular as medidas-resumo e os gráficos dos Passos 3 e 4 na
própria planilha, com fórmulas auditáveis.
Passo 3 — Análise descritiva
- Calcular média, mediana, desvio padrão, mínimo, máximo, amplitude e,
quando aplicável, coeficiente de variação.
- Construir pelo menos um gráfico adequado
(histograma, boxplot, gráfico de barras, gráfico de linhas temporal,
Pareto).
- Interpretar o padrão observado (simetria, dispersão, presença de
outliers) antes de qualquer teste.
Passo 4 — Análise probabilística
- Identificar a distribuição teórica plausível para o
fenômeno (Binomial, Poisson, Hipergeométrica, Geométrica, Binomial
Negativa, Exponencial ou Normal), com justificativa.
- Calcular pelo menos uma probabilidade no contexto
do problema (por exemplo: “P(observar mais de X ocorrências) sob a
distribuição adotada”).
Passo 5 — Inferência estatística (intervalo de confiança)
- Construir o IC 95 % (ou outro nível, com
justificativa) para o parâmetro-alvo.
- Interpretar o IC em linguagem de TI/SI, sem afirmar
“probabilidade de que o parâmetro esteja no intervalo” (interpretação
frequentista).
Passo 6 — Teste de hipótese para uma única amostra
- Definir H₀, H₁, nível de significância α (com justificativa) e tipo
de teste (unilateral ou bilateral).
- Escolher a estatística de teste adequada (Z, t, χ²), informando se σ
é conhecido ou estimado.
- Calcular a estatística de teste, o valor-p e a regra de
decisão.
- Decidir rejeitar ou não rejeitar H₀ e interpretar a
decisão em linguagem de TI/SI.
Passo 7 — Conclusão técnica e limites
- Articular o resultado estatístico com a decisão de
TI/SI (manter o processo, investigar causa-raiz, revisar meta,
ajustar configuração, refatorar consulta, etc.).
- Declarar limites: tamanho da amostra, escopo,
possíveis vieses, generalização.
- Listar recomendações fundamentadas nos dados.
Passo 8 — Comunicação e apresentação
- Relatório escrito em PDF ou DOCX, com capa, sumário, seções
numeradas, tabelas, gráficos, fórmulas, comandos utilizados e
referências (ABNT ou APA).
- Seminário de 10 a 15 minutos por equipe, com
5 minutos de arguição.
Sugestão de divisão de tarefas para 4 alunos
| A |
Imersão, organização da base, descritiva (Passos 1–3) |
| B |
Probabilidade, modelo teórico, probabilidades calculadas (Passo
4) |
| C |
IC, teste de hipótese, valor-p (Passos 5–6) |
| D |
Conclusão, limites, relatório escrito, ensaio da apresentação
(Passos 7–8) |
Check-list de autoavaliação antes da entrega
6. Entregáveis Obrigatórios
- Relatório técnico (PDF ou DOCX) contendo:
- Capa com identificação da equipe, cenário, disciplina e
professor.
- Contextualização do problema.
- Base de dados completa, em tabela.
- Estatísticas descritivas (com interpretação).
- Gráfico(s) com legendas, títulos e fonte.
- Modelo probabilístico adotado, com justificativa e cálculo de
probabilidades.
- Intervalo de confiança (nível justificado).
- Teste de hipótese (H₀, H₁, α, estatística de teste, valor-p,
decisão).
- Conclusão técnica, recomendações e limites da análise.
- Referências bibliográficas (ABNT ou APA).
- Seminário de apresentação (10 a 15 minutos por
equipe, com 5 minutos para arguição).
7. Requisitos Técnicos Mínimos
Toda apresentação deve conter, no mínimo: - Descrição dos dados
(média, mediana, variância, desvio padrão, mínimo, máximo — quando
aplicável). - Pelo menos um gráfico adequado ao tipo de variável e ao
objetivo (histograma, boxplot, barras, Pareto, linhas temporal).
Não é permitido o uso de análise de correlação como
foco do trabalho. - Cálculo e interpretação de pelo menos uma
probabilidade no contexto do problema, com modelo teórico explícito. -
Construção e interpretação de um intervalo de confiança (95 %, 90 % ou
99 %, com justificativa). - Execução e interpretação de um teste de
hipótese para uma única amostra, com nível de significância α definido e
justificado. - Conclusão técnica com discussão sobre os limites da
análise (tamanho da amostra, possíveis vieses, escopo,
generalização).
8. Condutas Esperadas
- Autoria e honestidade acadêmica: todos os cálculos,
gráficos e interpretações devem ser de produção da equipe. Plágio total
ou parcial implica nota zero e encaminhamento à coordenação. O uso de IA
generativa é permitido como apoio, mas não substitui a
produção da equipe; todo trecho gerado por IA deve ser revisado,
validado e explicitamente creditado.
- Coerência metodológica: as análises estatísticas
devem estar alinhadas ao tipo de variável, à distribuição admitida e à
pergunta do problema.
- Comunicação técnica: uso correto da terminologia
estatística, com clareza, organização e referência a fontes.
- Ética no uso de dados: mesmo em dados sintéticos,
as equipes devem tratar a análise com o mesmo rigor que aplicariam a
dados reais. Em dados reais, deve-se observar a Lei Geral de
Proteção de Dados (LGPD), anonimizando identificadores quando
necessário.
9. Observação Final do Enunciado Geral
Este enunciado é único. As especificidades — contexto, empresa, base
de dados, perguntas, indicador de processo, modelo probabilístico e
teste inferencial — variam de acordo com o cenário atribuído a cada
equipe e estão detalhadas na Parte 2 deste documento.
PARTE 2 — CENÁRIOS POR EQUIPE
A seguir, são apresentados 10 cenários distintos,
ordenados por progressão didática (do mais simples ao mais completo).
Cada equipe recebe apenas o cenário correspondente à
sua numeração, previamente divulgado pelo docente.
A alocação garante: - 5 modelos probabilísticos diferentes (Binomial,
Poisson, Hipergeométrica, Geométrica, Binomial Negativa) alocados em
contextos variados de Sistemas de Informação, com progressão didática;
Exponencial e Normal aparecem em papéis complementares. - 4 tipos de
teste inferencial (Z com σ conhecido para média, Z para proporção, t de
Student com σ desconhecido, qui-quadrado para variância). - Mix de
resultados: cenários em que H₀ não é rejeitada,
cenários em que H₀ é rejeitada e cenários
borderline (valor-p próximo de α), exigindo
interpretação crítica. - Contextos variados: qualidade de software, help
desk, banco de dados, segurança, DevOps, BI.
EQUIPE 1 — DEFÉITOS CRÍTICOS EM RELEASE DE SOFTWARE (BINOMIAL)
1.1 Contexto
A DevLog Sistemas S.A. mantém um sistema ERP
corporativo. A política de qualidade de software admite
que a proporção de defeitos (bugs) críticos por release não
ultrapasse 6 % dos itens entregues. A engenharia de QA acredita
que o processo esteja dentro da meta.
1.3 Base de Dados
Tabela 1 — Itens entregues e bugs críticos por release (30 releases,
2025).
| 1 |
200 |
9 |
11 |
200 |
11 |
21 |
200 |
10 |
| 2 |
200 |
12 |
12 |
200 |
8 |
22 |
200 |
13 |
| 3 |
200 |
10 |
13 |
200 |
14 |
23 |
200 |
9 |
| 4 |
200 |
11 |
14 |
200 |
9 |
24 |
200 |
12 |
| 5 |
200 |
13 |
15 |
200 |
12 |
25 |
200 |
8 |
| 6 |
200 |
8 |
16 |
200 |
10 |
26 |
200 |
11 |
| 7 |
200 |
12 |
17 |
200 |
9 |
27 |
200 |
10 |
| 8 |
200 |
10 |
18 |
200 |
11 |
28 |
200 |
13 |
| 9 |
200 |
9 |
19 |
200 |
12 |
29 |
200 |
9 |
| 10 |
200 |
11 |
20 |
200 |
10 |
30 |
200 |
8 |
1.4 Perguntas
- Pergunta principal: A proporção de bugs críticos é
superior a 6 % (política interna)?
- Pergunta secundária 1: Qual a probabilidade
aproximada de um release sorteado aleatoriamente apresentar mais de 14
bugs críticos?
- Pergunta secundária 2: Construir um IC 95 % para a
verdadeira proporção de bugs críticos.
1.5 Análise Estatística Esperada
- Estatística descritiva: proporção média ≈ 0,053,
desvio padrão, histograma.
- Modelo probabilístico: Binomial
com n = 200 e p̂ amostral.
- Probabilidade: P(X > 14) com p̂ ≈ 0,053.
- Inferência: IC 95 % para a proporção (Wilson ou
Normal com correção).
- Teste de hipótese: Z unilateral à direita
para proporção (H₀: p = 0,06 contra H₁: p > 0,06), α = 0,05.
Resultado esperado: não rejeitar H₀.
- Gráfico sugerido: barras com a proporção de bugs
por release e linha do limite de 6 %.
1.6 Orientação para Interpretação e Conclusão
- Reportar: “ao nível de 5 %, não há evidências estatísticas de
violação da política”.
- Recomendar manter o controle, com monitoria via DORA change failure
rate.
- Limites: amostra de 30 releases, ausência de estratificação por
squad e por tipo de item.
EQUIPE 2 — CHAMADOS CRÍTICOS DE HELPDESK POR DIA (POISSON)
2.1 Contexto
A HelpDesk Ágil S.A. presta suporte técnico de
primeiro nível. A gestão de operações considera que uma
média superior a 4 chamados críticos por dia indica
degradação da base instalada. A coordenação suspeita que a média esteja
acima do limite.
2.3 Base de Dados
Tabela 1 — Chamados críticos por dia (30 dias, outubro/2025).
| 1 |
4 |
11 |
6 |
21 |
4 |
| 2 |
5 |
12 |
4 |
22 |
5 |
| 3 |
3 |
13 |
7 |
23 |
8 |
| 4 |
6 |
14 |
5 |
24 |
6 |
| 5 |
4 |
15 |
6 |
25 |
5 |
| 6 |
7 |
16 |
4 |
26 |
7 |
| 7 |
5 |
17 |
5 |
27 |
6 |
| 8 |
4 |
18 |
8 |
28 |
5 |
| 9 |
6 |
19 |
4 |
29 |
4 |
| 10 |
5 |
20 |
6 |
30 |
6 |
2.4 Perguntas
- Pergunta principal: A média diária de chamados
críticos é superior a 4?
- Pergunta secundária 1: A variável pode ser
razoavelmente modelada por Poisson? (verificar razão
variância/média).
- Pergunta secundária 2: Construir um IC 95 % para a
média diária.
2.5 Análise Estatística Esperada
- Estatística descritiva: média ≈ 5,3, variância,
histograma.
- Modelo probabilístico: Poisson com
λ̂ = média amostral.
- Probabilidade: P(X ≥ 7) sob Poisson(5,3).
- Inferência: IC 95 % para λ via qui-quadrado.
- Teste de hipótese: t unilateral à
direita (H₀: μ = 4 contra H₁: μ > 4), α = 0,05. Resultado
esperado: rejeitar H₀.
- Gráfico sugerido: histograma com a curva Poisson
sobreposta (λ = 5,3).
2.6 Orientação para Interpretação e Conclusão
- Reportar: “há evidências estatísticas de que a média diária é
superior a 4”.
- Recomendar ações (revisão do runbook de incidentes, FAQ dinâmico,
base de conhecimento, autoatendimento).
- Limites: amostra de 30 dias, ausência de estratificação por tipo de
cliente e por severidade.
EQUIPE 3 — INSPEÇÃO DE COMPONENTES CRÍTICOS SEM REPOSIÇÃO
(HIPERGEOMÉTRICA, BORDERLINE)
3.1 Contexto
A PlenoSys Hardware S.A. importa lotes de 500
módulos eletrônicos. A norma de aceitação exige que a
proporção de módulos defeituosos no lote não ultrapasse 4
%. Para cada lote, uma amostra de 25 módulos é
inspecionada sem reposição. O controle de qualidade vem
registrando proporções próximas do limite.
3.3 Base de Dados
Tabela 1 — Módulos defeituosos encontrados em amostras de 25, em 30
lotes.
| 1 |
1 |
11 |
2 |
21 |
0 |
| 2 |
0 |
12 |
1 |
22 |
1 |
| 3 |
1 |
13 |
0 |
23 |
2 |
| 4 |
2 |
14 |
1 |
24 |
1 |
| 5 |
1 |
15 |
2 |
25 |
0 |
| 6 |
0 |
16 |
1 |
26 |
1 |
| 7 |
1 |
17 |
0 |
27 |
2 |
| 8 |
2 |
18 |
1 |
28 |
1 |
| 9 |
0 |
19 |
2 |
29 |
0 |
| 10 |
1 |
20 |
1 |
30 |
1 |
3.4 Perguntas
- Pergunta principal: A proporção de defeituosos no
lote é superior a 4 % (norma interna)?
- Pergunta secundária 1: Por que a Binomial é
inadequada e a Hipergeométrica é indicada?
- Pergunta secundária 2: Calcule a probabilidade de,
em uma amostra de 25 módulos de um lote com 20 defeituosos (4 %),
encontrar 2 ou mais defeituosos.
3.5 Análise Estatística Esperada
- Estatística descritiva: proporção amostral média ≈
0,04, histograma.
- Modelo probabilístico:
Hipergeométrica (N = 500, n = 25, K = número de
defeituosos no lote).
- Probabilidade: P(X ≥ 2 | N = 500, n = 25, K = 20)
pela Hipergeométrica.
- Inferência: IC 95 % para a proporção
(Haldane-Anscombe ou Wilson).
- Teste de hipótese: Z unilateral à direita
para proporção (H₀: p = 0,04 contra H₁: p > 0,04), α = 0,05.
Resultado esperado: borderline (p̂ ≈ 0,040; valor-p
próximo de 0,5).
- Gráfico sugerido: histograma do número de
defeituosos por amostra, com a Hipergeométrica sobreposta.
3.6 Orientação para Interpretação e Conclusão
- O valor-p próximo de 0,5 exige interpretação
crítica: a estatística, isoladamente, não resolve.
- Recomendar combinar o resultado estatístico com evidências
qualitativas (reclamações de campo, histórico do fornecedor)
antes de bloquear lotes.
- Limites: amostra de 30 lotes, K desconhecido na população (estimado
por p̂).
EQUIPE 4 — NÚMERO DE BUILDS ATÉ A PRIMEIRA FALHA (GEOMÉTRICA)
4.1 Contexto
A PipelineForge DevOps S.A. opera um sistema de
integração contínua. Conta-se o número de builds executados até
a primeira falha (pipeline interrompido por erro de teste, lint
ou compilação). O SRE espera que a média de
builds entre falhas seja de pelo menos 80. A operação tem
apresentado falhas mais cedo do que o esperado.
4.3 Base de Dados
Tabela 1 — Número de builds até a primeira falha (30 sequências,
2025).
| 1 |
62 |
11 |
70 |
21 |
58 |
| 2 |
75 |
12 |
65 |
22 |
72 |
| 3 |
55 |
13 |
80 |
23 |
60 |
| 4 |
68 |
14 |
58 |
24 |
75 |
| 5 |
72 |
15 |
62 |
25 |
65 |
| 6 |
60 |
16 |
78 |
26 |
55 |
| 7 |
82 |
17 |
60 |
27 |
78 |
| 8 |
58 |
18 |
70 |
28 |
62 |
| 9 |
65 |
19 |
55 |
29 |
68 |
| 10 |
75 |
20 |
72 |
30 |
70 |
4.4 Perguntas
- Pergunta principal: A média de builds até a
primeira falha é inferior a 80?
- Pergunta secundária 1: Qual a probabilidade de a
primeira falha ocorrer antes do build de número 50, admitindo Geométrica
com p̂ = 1/67?
- Pergunta secundária 2: Construir um IC 95 % para a
média da distribuição.
4.5 Análise Estatística Esperada
- Estatística descritiva: média ≈ 66,7, desvio
padrão, histograma.
- Modelo probabilístico: Geométrica
(nº de tentativas até o 1º sucesso = falha).
- Probabilidade: P(X < 50) com p̂ = 1/67.
- Inferência: IC 95 % para μ = 1/p.
- Teste de hipótese: t unilateral à
esquerda (H₀: μ = 80 contra H₁: μ < 80), α = 0,05. Resultado
esperado: rejeitar H₀.
- Gráfico sugerido: histograma com a curva Geométrica
sobreposta (p̂ = 1/67).
4.6 Orientação para Interpretação e Conclusão
- Reportar: “há evidências estatísticas de que a média de builds até a
primeira falha é inferior a 80”.
- Recomendar revisão da suíte de testes, hardening do pipeline,
pré-validação de dependências, gates de qualidade.
- Limites: 30 sequências, possível não estacionariedade do pipeline ao
longo do ano.
EQUIPE 5 — TEMPO ENTRE INCIDENTES DE SRE (EXPONENCIAL)
5.1 Contexto
A SREWatch Operações S.A. monitora a infraestrutura
de uma plataforma SaaS. O plano de continuidade
estabelece que o tempo médio entre incidentes (MTBI) deve ser de
pelo menos 200 horas. A equipe suspeita que o MTBI esteja
abaixo da meta, especialmente após mudanças recentes no deploy.
5.3 Base de Dados
Tabela 1 — Tempo entre incidentes (em horas) — 30 registros
(2024–2025).
| 1 |
150 |
11 |
190 |
21 |
160 |
| 2 |
220 |
12 |
130 |
22 |
210 |
| 3 |
140 |
13 |
250 |
23 |
145 |
| 4 |
180 |
14 |
170 |
24 |
195 |
| 5 |
165 |
15 |
200 |
25 |
175 |
| 6 |
240 |
16 |
155 |
26 |
220 |
| 7 |
135 |
17 |
185 |
27 |
130 |
| 8 |
260 |
18 |
210 |
28 |
200 |
| 9 |
145 |
19 |
170 |
29 |
180 |
| 10 |
175 |
20 |
165 |
30 |
155 |
5.4 Perguntas
- Pergunta principal: O MTBI é inferior a 200
horas?
- Pergunta secundária 1: A variável pode ser
razoavelmente modelada por uma Exponencial? Justifique.
- Pergunta secundária 2: Construir um IC 95 % para o
MTBI.
5.5 Análise Estatística Esperada
- Estatística descritiva: média ≈ 179, desvio padrão,
histograma.
- Modelo probabilístico: Exponencial
com média amostral.
- Probabilidade: P(X < 100) = 1 −
exp(−100/179).
- Inferência: IC 95 % para a média da Exponencial via
qui-quadrado.
- Teste de hipótese: t unilateral à
esquerda (H₀: μ = 200 contra H₁: μ < 200), α = 0,05.
Resultado esperado: borderline a rejeitar (t ≈ −2,65;
valor-p ≈ 0,007). Equipe deve discutir a potência e a proximidade com o
limite.
- Gráfico sugerido: histograma com a curva
Exponencial sobreposta (μ̂ = 179).
5.6 Orientação para Interpretação e Conclusão
- Reportar com cautela: a média está abaixo da meta, mas a evidência
estatística depende do teste escolhido.
- Recomendar combinar o resultado com o impacto
operacional dos incidentes antes de decidir por mudanças
estruturais.
- Limites: amostra de 30 registros, possível mistura de tipos de
incidente (rede, aplicação, banco).
EQUIPE 7 — ACESSOS INVÁLIDOS POR DIA EM API (POISSON)
7.1 Contexto
A ShieldWare Security S.A. monitora tentativas de
acesso inválido em uma API pública. A política de
segurança admite no máximo 8 acessos inválidos por
dia em regime normal. A equipe de SOC suspeita que a média
esteja acima do limite, possivelmente indicando tentativa de ataque.
7.3 Base de Dados
Tabela 1 — Acessos inválidos por dia (30 dias, outubro/2025).
| 1 |
9 |
11 |
12 |
21 |
10 |
| 2 |
11 |
12 |
10 |
22 |
13 |
| 3 |
8 |
13 |
14 |
23 |
9 |
| 4 |
13 |
14 |
10 |
24 |
12 |
| 5 |
10 |
15 |
11 |
25 |
11 |
| 6 |
14 |
16 |
9 |
26 |
14 |
| 7 |
11 |
17 |
13 |
27 |
10 |
| 8 |
10 |
18 |
12 |
28 |
12 |
| 9 |
15 |
19 |
9 |
29 |
11 |
| 10 |
12 |
20 |
11 |
30 |
13 |
7.4 Perguntas
- Pergunta principal: A média diária de acessos
inválidos é superior a 8?
- Pergunta secundária 1: A variável pode ser
razoavelmente modelada por Poisson?
- Pergunta secundária 2: Construir um IC 95 % para a
média diária.
7.5 Análise Estatística Esperada
- Estatística descritiva: média ≈ 11,2, variância,
histograma.
- Modelo probabilístico: Poisson com
λ̂ = média amostral.
- Probabilidade: P(X ≥ 14) sob Poisson(11,2).
- Inferência: IC 95 % para λ via qui-quadrado.
- Teste de hipótese: t unilateral à
direita (H₀: μ = 8 contra H₁: μ > 8), α = 0,05. Resultado
esperado: rejeitar H₀.
- Gráfico sugerido: histograma com a curva Poisson
sobreposta (λ = 11,2).
7.6 Orientação para Interpretação e Conclusão
- Reportar: “há evidências estatísticas de que a média diária é
superior a 8”.
- Recomendar ações (revisão de rate limit, ativação de CAPTCHA,
bloqueio de IP, MFA em endpoints sensíveis).
- Limites: amostra de 30 dias, ausência de estratificação por endpoint
e por tipo de falha.
EQUIPE 8 — VARIABILIDADE DA LATÊNCIA EM API (QUI-QUADRADO PARA
VARIÂNCIA)
8.1 Contexto
A APIxpress Gateway S.A. opera uma API REST pública.
O SLA de UX exige que o desvio padrão da
latência não ultrapasse 30 ms, para garantir
uma experiência P95 consistente. A engenharia de SRE acredita que a
variabilidade esteja dentro do limite.
8.3 Base de Dados
Tabela 1 — Latência (em ms) de 30 requisições (amostra de produção,
outubro/2025).
| 1 |
180 |
11 |
195 |
21 |
175 |
| 2 |
210 |
12 |
200 |
22 |
220 |
| 3 |
195 |
13 |
215 |
23 |
185 |
| 4 |
220 |
14 |
180 |
24 |
205 |
| 5 |
200 |
15 |
210 |
25 |
195 |
| 6 |
215 |
16 |
200 |
26 |
215 |
| 7 |
185 |
17 |
220 |
27 |
190 |
| 8 |
205 |
18 |
195 |
28 |
210 |
| 9 |
200 |
19 |
200 |
29 |
200 |
| 10 |
190 |
20 |
185 |
30 |
205 |
8.4 Perguntas
- Pergunta principal: O desvio padrão da latência é
superior a 30 ms?
- Pergunta secundária 1: Construir um IC 95 % para a
variância σ².
- Pergunta secundária 2: Calcule o P95 empírico e
compare com o limite de UX.
8.5 Análise Estatística Esperada
- Estatística descritiva: média ≈ 201,3, desvio
padrão ≈ 13,2, histograma, boxplot.
- Modelo probabilístico: Normal
(latência é contínua).
- Inferência: IC 95 % para σ²: ((n−1)·s²/χ²ₐ/₂,
(n−1)·s²/χ²₁₋ₐ/₂).
- Teste de hipótese: qui-quadrado unilateral
à direita (H₀: σ² = 30² contra H₁: σ² > 30²), α = 0,05.
Resultado esperado: não rejeitar H₀.
- Gráfico sugerido: histograma com a curva Normal
sobreposta; boxplot.
8.6 Orientação para Interpretação e Conclusão
- Reportar: “ao nível de 5 %, não há evidências estatísticas de que σ
seja superior a 30 ms”.
- Recomendar manter o controle, com monitoria contínua de P95 e
P99.
- Limites: amostra de 30 requisições, normalidade presumida.
EQUIPE 10 — LATÊNCIA EM CONSULTAS SQL (Z PARA MÉDIA, σ CONHECIDO,
NÃO REJEITA)
10.1 Contexto
A DataPulse Sistemas S.A. monitora a
latência de consultas SQL em um data warehouse. A
meta de SLA é de 200 ms. O
desvio padrão histórico do processo, controlado por CEP
nos últimos 24 meses, é σ = 15 ms. O time de banco de dados quer testar
se a latência média atual está acima da meta, usando a
referência histórica.
10.3 Base de Dados
Tabela 1 — Latência (em ms) de 30 consultas (outubro/2025).
| 1 |
195 |
11 |
200 |
21 |
192 |
| 2 |
205 |
12 |
198 |
22 |
210 |
| 3 |
198 |
13 |
210 |
23 |
195 |
| 4 |
210 |
14 |
195 |
24 |
200 |
| 5 |
200 |
15 |
205 |
25 |
198 |
| 6 |
215 |
16 |
200 |
26 |
210 |
| 7 |
195 |
17 |
215 |
27 |
192 |
| 8 |
205 |
18 |
200 |
28 |
205 |
| 9 |
200 |
19 |
198 |
29 |
200 |
| 10 |
198 |
20 |
205 |
30 |
195 |
Resumo: x̄ = 202,0 ms, σ histórico = 15 ms.
10.4 Perguntas
- Pergunta principal: A latência média é superior a
200 ms (meta), considerando σ histórico conhecido?
- Pergunta secundária 1: Construir um IC 95 % para a
média usando o σ histórico.
- Pergunta secundária 2: Compare o resultado deste
teste com o que seria obtido pelo teste t. Em que situação eles
coincidem?
10.5 Análise Estatística Esperada
- Estatística descritiva: média amostral, desvio
padrão amostral, histograma.
- Modelo probabilístico: Normal (σ conhecido por
CEP).
- Inferência: IC 95 % para μ com σ conhecido: x̄ ±
z_{α/2} · σ/√n.
- Teste de hipótese: Z unilateral à
direita (H₀: μ = 200 contra H₁: μ > 200), α = 0,05, com σ =
15. Resultado esperado: não rejeitar H₀ (x̄ = 202; Z =
0,73; valor-p ≈ 0,23).
- Gráfico sugerido: histograma com a curva Normal
sobreposta e a linha da meta.
10.6 Orientação para Interpretação e Conclusão
- Reportar: “ao nível de 5 %, não há evidências estatísticas de que a
latência média esteja acima da meta”.
- Recomendar manter o processo, com monitoria contínua por APM.
- Limites: σ histórico assume estabilidade do processo; se houver
mudança de esquema, índice ou versão do banco, σ deve ser
reestimado.
PARTE 3 — RUBRICA DE AVALIAÇÃO DO PROJETO INTEGRADOR
A avaliação do PI é feita por equipe, em escala de 0 a 10
pontos, distribuídos em cinco critérios ponderados.
| 1. Clareza do problema e aderência ao contexto |
Capacidade da equipe de apresentar o problema de Sistemas de
Informação/TI com clareza, situando o cenário, o processo em análise e a
relevância da questão para a tomada de decisão. |
2,0 |
| 2. Organização e qualidade dos dados |
Apresentação completa da base de dados em tabela, identificação
correta das variáveis e das escalas de medição, consistência e
integridade dos dados, registro das fontes ou do processo de
geração. |
2,0 |
| 3. Aplicação correta dos conceitos estatísticos |
Uso correto das técnicas estatísticas: estatística descritiva,
probabilidade com modelo teórico adequado, intervalo de confiança e
teste de hipótese para uma única amostra. Coerência entre a técnica
escolhida, o tipo de variável e a pergunta do problema. |
3,0 |
| 4. Interpretação, conclusão e limites da análise |
Interpretação correta dos resultados em linguagem técnica,
articulação com o problema de TI/SI, recomendações fundamentadas e
discussão explícita dos limites da análise (amostra, escopo, possíveis
vieses, generalização). |
2,0 |
| 5. Comunicação técnica e apresentação |
Qualidade do relatório escrito, correção gramatical, uso adequado de
tabelas e gráficos com títulos, legendas e fontes, domínio do tempo no
seminário, clareza na exposição oral, postura e resposta à
arguição. |
1,0 |
| Total |
|
10,0 |
3.1 Critérios de Desempate e Observações Complementares
- Trabalhos entregues fora do prazo sofrerão desconto de 0,5 ponto por
dia útil de atraso, até o limite de 2,0 pontos.
- Caso duas ou mais equipes terminem empatadas, será considerado, como
critério de desempate, o domínio técnico demonstrado na arguição
oral.
- Relatórios entregues sem a base de dados em tabela serão penalizados
em 1,0 ponto no critério 2.
- Gráficos sem título, sem legenda de eixos ou sem fonte serão
penalizados em 0,5 ponto por gráfico no critério 5.
- A simples apresentação de fórmulas ou resultados numéricos, sem
interpretação no contexto do problema, implica nota zero no critério
4.
- O uso de modelo probabilístico inadequado ao tipo de variável (por
exemplo, Normal para contagens sem justificativa) implica penalização de
até 1,0 ponto no critério 3.
- Em cenários com dados reais, o descumprimento da
LGPD (anonimização, minimização) implica penalização de
até 1,0 ponto no critério 4.
- O uso de IA generativa (ChatGPT, Copilot, etc.) deve ser
explicitamente creditado; trechos não creditados serão tratados como
produção da equipe e verificados na arguição.
3.2 Escala Qualitativa de Referência (para devolutiva)
| 9,0 a 10,0 |
Excelente |
Domínio pleno, com interpretação crítica e recomendações
fundamentadas. |
| 7,0 a 8,9 |
Bom |
Domínio consistente, com pequenas lacunas de interpretação. |
| 5,0 a 6,9 |
Regular |
Aplicação correta das técnicas, mas com interpretação
superficial. |
| 3,0 a 4,9 |
Insuficiente |
Erros conceituais relevantes ou ausência de itens obrigatórios. |
| 0,0 a 2,9 |
Insatisfatório |
Trabalho não atende aos requisitos mínimos do PI. |
PARTE 4 — OBSERVAÇÕES FINAIS AOS ALUNOS
4.1 Limites da Análise Estatística
- Os resultados obtidos refletem apenas a amostra
coletada e as condições registradas no período de análise.
Generalizações devem ser feitas com cautela.
- Toda conclusão estatística está associada a uma margem de
erro e a um nível de confiança. Não confundir
“ausência de evidência” com “evidência de ausência”.
- O tamanho da amostra influencia a precisão do intervalo de confiança
e a potência do teste de hipótese. Amostras pequenas
podem não detectar desvios relevantes.
- A normalidade dos dados é um pressuposto para o teste t e Z. Em
amostras pequenas, recomenda-se avaliar a forma do histograma e, se
possível, realizar testes de normalidade. Desvios acentuados devem ser
reportados.
- Para o teste de proporção, o produto n·p e n·(1 − p) deve ser maior
ou igual a 5 para que a aproximação pela Normal seja adequada.
- A modelagem por Binomial, Poisson, Hipergeométrica, Geométrica,
Binomial Negativa e Exponencial deve ser avaliada quanto à sua
aderência ao fenômeno, e não assumida como verdade. Em
particular: Poisson exige variância ≈ média; Hipergeométrica exige
amostragem sem reposição em população finita; Binomial Negativa é
indicada quando há superdispersão (variância >
média); Geométrica é adequada para “número de tentativas até o 1º
sucesso”.
- O uso de σ histórico no teste Z é aceitável apenas se o processo
estiver estável (sem mudança de arquitetura, deploy,
fornecedor de nuvem ou método de coleta). Caso contrário, σ deve ser
estimado da própria amostra e usa-se o teste t.
4.2 Ética, Proteção de Dados e Autoria
- Os dados deste PI são fictícios e foram elaborados
com fins didáticos, mas devem ser tratados com o mesmo
rigor que dados reais exigem.
- É vedada a manipulação intencional de dados para obter resultados
favoráveis. Se necessário, os dados podem ser depurados, com registro
explícito do critério utilizado.
- Em cenários com dados reais, deve-se observar a Lei Geral de
Proteção de Dados (LGPD), anonimizando identificadores pessoais
e minimizando a coleta ao necessário.
- O uso de IA generativa é permitido como apoio, mas
a equipe é integralmente responsável pela veracidade dos cálculos e pela
coerência das interpretações. Todo trecho gerado por IA deve ser
explicitamente creditado no relatório.
- Citações a fontes externas devem seguir as normas da ABNT ou APA,
conforme orientação do docente.
- A autoria do trabalho é da equipe. Cópias, ainda que parciais, serão
tratadas como plágio.
4.3 Coerência e Comunicação Técnica
- O texto deve usar terminologia estatística precisa
(por exemplo, “evidências estatísticas de que…”, “ao nível de 5 % de
significância, rejeita-se H₀”), evitando afirmações categóricas como
“comprovou-se que…”.
- O gráfico deve ter título claro, rótulos nos eixos, legenda
(quando necessário) e fonte. Cores devem ter função, não apenas
efeito estético.
- As conclusões devem articular o resultado estatístico com a
decisão de TI/SI, indicando a ação recomendada e os
limites da recomendação.
- Em cenários com resultado borderline (valor-p
próximo de α), a equipe deve explicitar a incerteza e
discutir o que isso significa para a decisão, em vez de “forçar” uma
conclusão.
- A apresentação oral deve respeitar o tempo e priorizar a
síntese: problema, método, resultado principal,
conclusão e recomendação. Cálculos detalhados ficam no relatório
escrito.
4.4 Sugestões de Boas Práticas
- Construir a base de dados em planilha eletrônica
desde o início, registrando unidades de medida, timestamps e data de
coleta.
- Usar, quando possível, ferramentas de
observabilidade (Grafana, Datadog, New Relic, Kibana)
para extrair amostras do mundo real, mesmo que o PI utilize dados
sintéticos.
- Conferir se as perguntas do cenário estão todas respondidas no
relatório, com a técnica estatística adequada a cada uma.
- Revisar o relatório com atenção à coerência entre as perguntas, a
análise, a conclusão e as referências.
- Ensaiar a apresentação oral, cronometrando o tempo e definindo quem
apresenta cada parte.
- Ao utilizar software (Excel, Google Sheets, LibreOffice Calc, R,
Python, Minitab, Jupyter), registrar no relatório as fórmulas ou
comandos utilizados, para garantir rastreabilidade e
transparência.
- Ao ajustar modelos (Binomial Negativa, Exponencial, Geométrica),
comparar visualmente a curva ajustada com o histograma e reportar a
qualidade do ajuste.
FIM DO PROJETO INTEGRADOR — PROBABILIDADE E ESTATÍSTICA
(SISTEMA DE INFORMAÇÃO)