Questão 1.

Uma empresa de varejo deseja analisar o desempenho de vendas de seus produtos nos primeiros 10 dias do mês de janeiro, para identificar padrões, tendências e possíveis áreas de melhoria. Eles têm acesso a um conjunto de dados que contém informações sobre vendas, como quantidade vendida, preço unitário, categoria do produto, data da venda, região de venda, entre outras variáveis:

Tabela 1. Dados de vendas dos produtos A, B, C e D nos primeiros 10 dias de janeiro.
Data Produto Categoria Quantidade Preço.Unitário Região
01/01/2023 Produto A Eeletrônicos 10 500 Norte
01/01/2023 Produto B Vestuários 20 30 Sul
02/01/2023 Produto C Alimentos 15 10 Norte
02/01/2023 Produto A Eeletrônicos 8 500 Sul
03/01/2023 Produto B Vestuários 25 30 Leste
03/01/2023 Produto D Eeletrônicos 12 700 Oeste
04/01/2023 Produto A Eeletrônicos 18 500 Norte
04/01/2023 Produto C Alimentos 10 10 Sul
05/01/2023 Produto B Vestuários 22 30 Norte
05/01/2023 Produto D Eeletrônicos 9 700 Sul
06/01/2023 Produto A Eeletrônicos 16 500 Leste
06/01/2023 Produto C Alimentos 18 10 Oeste
07/01/2023 Produto B Vestuários 28 30 Norte
07/01/2023 Produto D Eeletrônicos 11 700 Sul
08/01/2023 Produto A Eeletrônicos 20 500 Leste
08/01/2023 Produto C Alimentos 12 10 Oeste
09/01/2023 Produto B Vestuários 30 30 Norte
09/01/2023 Produto D Eeletrônicos 10 700 Sul
10/01/2023 Produto A Eeletrônicos 15 500 Leste
10/01/2023 Produto C Alimentos 14 10 Oeste
Fonte: Dados da empresa de varejo.

a) Classificação das variáveis

  • Data: qualitativa (categórica) – nominal;
  • Produto: qualitativa (categórica) – nominal;
  • Categoria: qualitativa (categórica) – nominal;
  • Quantidade: quantitativa – discreta;
  • Preço Unitário: quantitativa – contínua;
  • Região: qualitativa (categórica) – nominal.

b) Agrupamento dos dados

Tabela 2. Frequência simples e relativa (%) por produto.
Produto Frequência simples Frequência relativa (%)
Produto A 6 30
Produto B 5 25
Produto C 5 25
Produto D 4 20

Produto A domina com 30% das ocorrências (frequência simples 6), indicando que é o item mais vendido ou registrado nos dados. Produtos B e C empatam em 25% cada, enquanto D tem 20%, sugerindo uma distribuição ligeiramente desigual, com foco em A.

Frequência Simples e Relativa (%) por Categoria
Categoria Frequência simples Frequência relativa (%)
Alimentos 5 25
Eeletrônicos 10 50
Vestuários 5 25

A categoria “Eletrônicos” representa 50% das vendas (frequência 10), destacando-se como a principal, enquanto “Alimentos” e “Vestuários” dividem os 50% restantes igualmente (25% cada). Isso sugere que eletrônicos impulsionam o varejo nesse período.

Frequência Simples e Relativa (%) por Classes de Quantidade
Classe Frequência simples Frequência relativa (%)
[8 – 12.4) 8 40
[12.4 – 16.8) 4 20
[16.8 – 21.2) 4 20
[21.2 – 25.6) 2 10
[25.6 – 30] 2 10

A classe mais baixa [8 – 12.4) concentra 40% das observações (frequência 8), indicando que muitas vendas envolvem quantidades menores. As classes superiores (acima de 21.2) somam apenas 20%, mostrando uma tendência a volumes moderados, com possível assimetria positiva.

Frequência Simples e Relativa (%) por Classes de Preço Unitário
Classe Frequência simples Frequência relativa (%)
[10 – 148) 10 50
[148 – 286) 0 0
[286 – 424) 0 0
[424 – 562) 6 30
[562 – 700] 4 20

A classe mais baixa [10 – 148) abrange 50% das observações, refletindo produtos acessíveis como alimentos e vestuários. Classes intermediárias estão vazias (0%), enquanto as altas [424 – 562) e [562 – 700] somam 50%, correspondendo a eletrônicos caros. Isso revela uma bimodalidade nos preços.

Frequência Simples e Relativa (%) por Região
Região Frequência simples Frequência relativa (%)
Leste 4 20
Norte 6 30
Oeste 4 20
Sul 6 30

Norte e Sul empatam em 30% cada (frequência 6), seguidos por Leste e Oeste com 20% cada. Isso indica equilíbrio relativo, mas com leve predominância no Norte e Sul, possivelmente devido a maior demanda ou cobertura nessas áreas.

c) Gráficos das variáveis

O gráfico de barras horizontais ou verticais (com cores como vermelho para A, verde para B, ciano para C e roxo para D) visualiza bem a dominância do Produto A (barra mais alta em 30%), facilitando a comparação rápida. As barras para B e C são semelhantes, reforçando o empate, enquanto D é menor, destacando oportunidades de melhoria para esse produto.

Com barras verdes para Eletrônicos (50%), vermelhas para Alimentos (25%) e azuis para Vestuários (25%), o gráfico enfatiza claramente o predomínio de Eletrônicos. A altura da barra verde é o dobro das outras, tornando visual a importância dessa categoria para o negócio.

As barras cinzas decrescentes (40% para [8-12.4), 20% para as próximas duas, e 10% para as últimas) ilustram uma distribuição assimétrica, com concentração em quantidades baixas. Isso ajuda a identificar que a maioria das vendas é de lotes pequenos, útil para planejamento de estoque.

Barras cinzas mostram 50% na classe baixa [10-148), 0% nas intermediárias e 30% + 20% nas altas. O gráfico destaca lacunas nas faixas médias, sugerindo que o portfólio de produtos é polarizado entre baratos e caros, o que pode indicar estratégia de precificação segmentada.

Barras coloridas (verde para Norte 30%, roxo para Sul 30%, vermelho para Leste 20%, ciano para Oeste 20%) mostram equilíbrio, com Norte e Sul ligeiramente à frente. A visualização facilita ver que não há disparidades extremas, mas sugere foco em expansão no Leste e Oeste.

d) Estatísticas descritivas

Estatísticas Descritivas - Dados Brutos
Estatística Quantidade Preço.Unitário
Média 16.15 300.00
Mediana 15.00 265.00
Desvio Padrão 6.41 296.03
Mínimo 8.00 10.00
Máximo 30.00 700.00

Para Quantidade: Média de 16.15 e mediana de 15 indicam distribuição levemente assimétrica positiva (média > mediana). Desvio padrão de 6.41 sugere variabilidade moderada, com valores de 8 a 30. Para Preço Unitário: Média de 300 e mediana de 265 mostram assimetria positiva maior, influenciada por preços altos de eletrônicos. Desvio padrão alto (296.03) reflete a dispersão entre produtos baratos (mín. 10) e caros (máx. 700).

Estatísticas Descritivas - Dados Agrupados (com pontos médios ponderados)
Estatística Quantidade Preço Unitário
Média 15.92 313.60
Mediana 14.60 148.00
Desvio Padrão 6.07 245.64
Mínimo 8.00 10.00
Máximo 30.00 700.00

Para Quantidade: Média (15.92) próxima à bruta, mas mediana (14.60) ligeiramente menor, possivelmente devido ao agrupamento em classes. Desvio padrão (6.07) similar, indicando que o agrupamento preserva bem as características originais. Para Preço Unitário: Média (313.60) um pouco maior que a bruta, mas mediana (148.00) bem menor, sugerindo que o agrupamento enfatiza classes baixas. Desvio padrão (245.64) reduzido, o que pode subestimar a variabilidade real devido às classes vazias. Observação: Há possível erro no cálculo da mediana agrupada, já que não coincide com a bruta, exigindo verificação da fórmula usada.

e) Percepções gerais observadas

Tabela de Vendas Totais (Quantidade × Preço Unitário)
Data Produto Categoria Quantidade Preço.Unitário Região Vendas Totais
01/01/2023 Produto A Eeletrônicos 10 500 Norte 5000
01/01/2023 Produto B Vestuários 20 30 Sul 600
02/01/2023 Produto C Alimentos 15 10 Norte 150
02/01/2023 Produto A Eeletrônicos 8 500 Sul 4000
03/01/2023 Produto B Vestuários 25 30 Leste 750
03/01/2023 Produto D Eeletrônicos 12 700 Oeste 8400
04/01/2023 Produto A Eeletrônicos 18 500 Norte 9000
04/01/2023 Produto C Alimentos 10 10 Sul 100
05/01/2023 Produto B Vestuários 22 30 Norte 660
05/01/2023 Produto D Eeletrônicos 9 700 Sul 6300
06/01/2023 Produto A Eeletrônicos 16 500 Leste 8000
06/01/2023 Produto C Alimentos 18 10 Oeste 180
07/01/2023 Produto B Vestuários 28 30 Norte 840
07/01/2023 Produto D Eeletrônicos 11 700 Sul 7700
08/01/2023 Produto A Eeletrônicos 20 500 Leste 10000
08/01/2023 Produto C Alimentos 12 10 Oeste 120
09/01/2023 Produto B Vestuários 30 30 Norte 900
09/01/2023 Produto D Eeletrônicos 10 700 Sul 7000
10/01/2023 Produto A Eeletrônicos 15 500 Leste 7500
10/01/2023 Produto C Alimentos 14 10 Oeste 140

A tabela expande os dados originais com a coluna “Vendas Totais”, destacando picos como 10.000 no Produto A em 08/01 (Leste) e 9.000 em 04/01 (Norte). Totais variam de 100 a 10.000, com eletrônicos gerando os maiores valores, reforçando sua importância econômica.

A linha flutua, com pico em torno de 9.000-10.000 por volta do dia 4-8, e declínio no final. Isso sugere tendência inicial de crescimento, seguida de estabilização ou queda, possivelmente influenciada por fatores sazonais ou promoções.

Barras mostram Produto A liderando com ~43.500, seguido por D (~29.400), B (~3.750) e C (~690). Isso revela que, apesar de frequências semelhantes, A e D (eletrônicos) geram receita muito superior devido a preços altos.

A categoria de Eletrônicos domina as vendas totais (72.900), representando cerca de 92% da receita, com Produtos A (43.500) e D (29.400) como os principais contribuintes, enquanto Vestuários (3.750) e Alimentos (690) têm demanda muito menor. Isso indica que eletrônicos são os mais vendidos, sugerindo foco em expansão dessa categoria para maximizar lucros, e possível reavaliação de estratégias para as outras.

Leste lidera com ~28.250, seguido por Sul (~25.700), Norte (~16.550) e Oeste (~8.840). Contrasta com frequências equilibradas, indicando que Leste e Sul têm vendas de maior valor (provavelmente mais eletrônicos).

As vendas variam significativamente por região, com Leste (26.250) e Sul (25.700) liderando a receita, seguidos por Norte (16.550) e Oeste (8.840), apesar de frequências semelhantes. Isso destaca maior potencial no Leste e Sul, possivelmente devido a preferência por eletrônicos caros, sugerindo estratégias de marketing direcionadas ao Oeste para aumentar penetração e equilibrar o desempenho regional.

Linhas para A (laranja) e D (roxo) mostram flutuações altas (picos em 10.000), enquanto B (verde) e C (azul) são baixas e estáveis. Isso ilustra que eletrônicos (A e D) impulsionam variações diárias.

Eletrônicos (verde) têm picos acentuados (ex.: ~10.000 no dia 8), enquanto Alimentos (vermelho) e Vestuários (azul) permanecem baixos. O gráfico reforça tendências sazonais concentradas em eletrônicos.

Picos notáveis incluem vendas de 10.000 (Produto A em 08/01, Leste) e 9.000 (Produto A em 04/01, Norte), contrastando com mínimas como 100-180 em Alimentos. Anomalias temporais mostram flutuações diárias (ex.: pico em dia 8), possivelmente ligadas a promoções ou sazonalidade, recomendando investigação de eventos externos para prever e mitigar variações negativas.

Questão 2.

Os dados abaixo correspondem às Variáveis:

  • (X):Taxa de Desemprego (%);

  • (Y):Taxa de Crescimento do PIB (%)

Mês Taxa de Desemprego (%) Taxa de Crescimento do PIB (%)
Jan 10.2 2.5
Fev 10.5 2.7
Mar 10.3 2.6
Abr 10.0 2.8
Mai 9.8 3.0
Jun 9.7 3.2
Jul 9.5 3.4
Ago 9.4 3.3
Set 9.6 3.1
Out 9.8 3.0
Nov 10.0 2.8
Dez 10.2 2.7

a) Agrupamento dos dados

Trimestre Taxa de Desemprego (%) Taxa de Crescimento do PIB (%)
1º Trimestre 10.33 2.60
2º Trimestre 9.83 3.00
3º Trimestre 9.50 3.27
4º Trimestre 10.00 2.83

Observa-se que o desemprego tende a diminuir do 1º ao 3º trimestre, enquanto o PIB apresenta crescimento gradual nesse mesmo período. No 4º trimestre, nota-se leve aumento no desemprego e queda no crescimento do PIB. Essa variação sugere uma relação inversa entre as duas variáveis. Assim, períodos de maior atividade econômica estão associados a menores taxas de desemprego.

b) Gráficos temporal das variáveis

O gráfico temporal mostra a evolução mensal da taxa de desemprego e do crescimento do PIB, evidenciando uma relação inversa entre as variáveis. Observa-se que os períodos de maior crescimento econômico coincidem com quedas na taxa de desemprego, enquanto aumentos no desemprego acompanham desacelerações do PIB. A tendência é consistente ao longo do ano, sem oscilações isoladas que comprometam a previsibilidade da relação entre as variáveis.

c) Diagrama de dispersão para X e Y

O diagrama de dispersão mostra uma relação negativa entre a taxa de desemprego e o crescimento do PIB. À medida que o desemprego aumenta, o PIB tende a diminuir. A linha de tendência confirma essa correlação inversa entre as variáveis.

d) Estatísticas descritivas

Tabela 1: Estatísticas descritivas mensais dos dados brutos
Estatística (X): Taxa de Desemprego (%) (Y): Taxa de Crescimento do PIB (%)
Média 9.92 2.92
Mediana 9.90 2.90
Mínimo 9.40 2.50
Máximo 10.50 3.40
Desvio Padrão 0.34 0.29

A tabela apresenta as estatísticas descritivas das variáveis analisadas, mostrando médias e medianas muito próximas, o que indica distribuição equilibrada dos dados. O desvio padrão baixo em ambas as variáveis revela pouca variação ao longo do período. Esses resultados reforçam a estabilidade e consistência dos dados analisados.

A Tabela 2 apresenta as estatísticas descritivas dos dados agrupados por trimestre, mostrando resultados muito próximos aos mensais. As médias e medianas idênticas indicam distribuição uniforme das taxas ao longo dos trimestres. Além disso, o baixo desvio padrão reforça a estabilidade das variações tanto no desemprego quanto no crescimento do PIB.

Tabela 2: Estatísticas descritivas dos dados agrupados por trimestre
Estatística (X):Taxa de Desemprego (%) (Y):Taxa de Crescimento do PIB (%)
Média 9.92 2.92
Mediana 9.92 2.92
Mínimo 9.50 2.60
Máximo 10.33 3.27
Desvio Padrão 0.35 0.28

e) Percepções gerais observadas

A análise trimestral evidencia clara relação inversa entre taxa de desemprego e crescimento do PIB ao longo do ano, com o 3º trimestre apresentando melhor cenário (menor desemprego 9,5% e maior PIB 3,27%). Os dados mostram baixa variabilidade (desvio padrão ~0,3 para ambas variáveis), indicando estabilidade econômica e previsibilidade nas oscilações. O comportamento cíclico observado, com melhora gradual até julho-setembro seguida de reversão no 4º trimestre, sugere influência de fatores sazonais típicos da economia. O diagrama de dispersão confirma correlação negativa forte entre as variáveis, validando teorias econômicas sobre a relação entre atividade produtiva e emprego. Essas percepções são fundamentais para políticas públicas, permitindo antecipar tendências e planejar intervenções nos períodos de maior vulnerabilidade econômica identificados no início e final do ano.

Questão 3.

O conjunto de dados a seguir, contém informações sobre o desempenho acadêmico dos alunos em uma escola:

Nome Idade Gênero Classe Série Matemática Português Ciências História
João 15 Masculino 9º ano A 80 75 85 70
Maria 14 Feminino 9º ano B 75 80 90 85
Pedro 15 Masculino 9º ano A 85 70 80 75
Ana 14 Feminino 9º ano A 90 85 95 90
José 15 Masculino 9º ano B 70 75 80 65
Clara 14 Feminino 9º ano A 80 90 85 80
Lucas 15 Masculino 9º ano A 85 80 90 85
Mariana 14 Feminino 9º ano B 75 70 80 75
Gabriel 15 Masculino 9º ano A 90 85 95 90
Sofia 14 Feminino 9º ano A 70 75 80 65

a) Classificação das variáveis

  • Nome: qualitativa (categórica) – nominal;
  • Idade: quantitativa – discreta;
  • Gênero: qualitativa (categórica) – nominal;
  • Classe: qualitativa – ordinal;
  • Série: qualitativa – ordinal;
  • Matemática: quantitativa – contínua;
  • Português: quantitativa – contínua;
  • Ciências: quantitativa – contínua;
  • História: quantitativa – contínua.

b) Agrupamento dos dados

Notas médias por Gênero
Gênero Matemática Português Ciências História
Feminino 78 80 86 79
Masculino 82 77 86 77

A tabela mostra as notas médias por gênero, revelando desempenho semelhante entre meninas e meninos. O gênero feminino se destaca em Português e História, enquanto o masculino tem médias um pouco maiores em Matemática. Em Ciências, ambos apresentam o mesmo resultado médio (86).

Notas médias por Série
Série Matemática Português Ciências História
A 82.9 80 87.1 79.3
B 73.3 75 83.3 75.0

Na análise por série, os alunos da turma A obtêm médias mais altas em todas as disciplinas em comparação à turma B. A diferença é mais expressiva em Matemática e História, indicando melhor desempenho geral da turma A. Isso pode refletir diferenças de perfil ou de ritmo de aprendizado entre as turmas.

c) Gráficos das variáveis

O gráfico de pizza mostra equilíbrio total entre os gêneros, com 50% de alunos do sexo feminino (14 anos) e 50% masculino (15 anos).

O gráfico de barras confirma as pequenas variações nas médias por disciplina e gênero. Observa-se que as diferenças são discretas, reforçando o equilíbrio no desempenho escolar. Em geral, o rendimento é semelhante entre meninos e meninas, com destaque pontual em algumas matérias.

d) Estatísticas descritivas

Estatísticas descritivas por disciplina
Estatística Matemática Português Ciências História
Média 80.0 78.5 86.0 78.0
Mediana 80.0 77.5 85.0 77.5
Máximo 90.0 90.0 95.0 90.0
Mínimo 70.0 70.0 80.0 65.0
Desvio Padrão 7.5 6.7 6.1 9.5

Os dados mostram desempenho equilibrado entre as disciplinas, com médias variando entre 78.0 e 86.0 pontos. Ciências apresenta a média mais alta (86.0) e o menor desvio padrão (6.1), indicando desempenho consistente. História tem o maior desvio padrão (9.5), sugerindo maior variabilidade nos resultados dos alunos.

Estatísticas descritivas por disciplina agrupadas por Gênero
Gênero Estatística Matemática Português Ciências História
Masculino Média 82.0 77.0 86.0 77.0
Masculino Mediana 85.0 75.0 85.0 75.0
Masculino Máximo 90.0 85.0 95.0 90.0
Masculino Mínimo 70.0 70.0 80.0 65.0
Masculino Desvio Padrão 7.6 5.7 6.5 10.4
Feminino Média 78.0 80.0 86.0 79.0
Feminino Mediana 75.0 80.0 85.0 80.0
Feminino Máximo 90.0 90.0 95.0 90.0
Feminino Mínimo 70.0 70.0 80.0 65.0
Feminino Desvio Padrão 7.6 7.9 6.5 9.6

Os alunos masculinos têm melhor desempenho em Matemática (média 82.0 vs 78.0) e Estatística (82.0 vs 78.0). As alunas femininas apresentam médias superiores em Português (80.0 vs 77.0) e História (79.0 vs 77.0). Ambos os grupos mantêm desempenho similar em Ciências (86.0), demonstrando equilíbrio nesta disciplina.

Estatísticas descritivas por disciplina agrupadas por Série
Série Estatística Matemática Português Ciências História
A Média 82.9 80.0 87.1 79.3
A Mediana 85.0 80.0 85.0 80.0
A Máximo 90.0 90.0 95.0 90.0
A Mínimo 70.0 70.0 80.0 65.0
A Desvio Padrão 7.0 7.1 6.4 9.8
B Média 73.3 75.0 83.3 75.0
B Mediana 75.0 75.0 80.0 75.0
B Máximo 75.0 80.0 90.0 85.0
B Mínimo 70.0 70.0 80.0 65.0
B Desvio Padrão 2.9 5.0 5.8 10.0

A Série A apresenta desempenho superior em todas as disciplinas, com médias consistentemente mais altas que a Série B. A diferença mais significativa ocorre em Matemática (82.9 vs 73.3) e em Estatística. A Série B mostra maior homogeneidade nos resultados, com desvios padrão menores, especialmente em Matemática (2.9 vs 7.0).

e) Percepções gerais observadas

A análise revela diferenças significativas entre as turmas A e B, com a primeira apresentando desempenho consistentemente superior em todas as disciplinas, especialmente em Matemática (diferença de 9,6 pontos), sugerindo possível segregação por nível de desempenho ou recursos diferenciados. Quanto ao gênero, observa-se equilíbrio geral com leves variações: meninos destacam-se em Matemática (+4 pontos) enquanto meninas sobressaem em Português (+3 pontos) e História (+2 pontos), confirmando padrões socioculturais conhecidos nas preferências acadêmicas. Ciências emerge como disciplina mais equilibrada (média 86,0 para ambos gêneros e menor desvio padrão 6,1), indicando metodologia de ensino eficaz e universal. História apresenta maior variabilidade (desvio 9,5), sugerindo necessidade de atenção pedagógica diferenciada para reduzir disparidades. A distribuição etária perfeita (50% com 14 anos feminino, 50% com 15 anos masculino) e o desempenho geral satisfatório (médias entre 78-86) indicam boa qualidade educacional, mas requerem investigação das causas da discrepância entre séries.