HOME

Column

SOBRE OS DADOS

Este dashboard apresenta uma análise exploratória de um conjunto de dados disponibilizado na plataforma Kaggle, com aproximadamente 5.000 registros relacionados a hábitos de estudo, produtividade acadêmica e fatores de estilo de vida que podem influenciar o desempenho dos estudantes.

Variáveis presentes no conjunto de dados:

Variável Tipo
Horas de estudo Quantitativa contínua
Padrões de sono Quantitativa contínua
Uso de redes sociais Quantitativa contínua
Qualidade da internet Qualitativa ordinal
Nível de saúde mental Quantitativa discreta
Pontuação de produtividade Quantitativa contínua

Objetivos desta aplicação:

  • Análise exploratória de dados (EDA)
  • Visualização de variáveis qualitativas e quantitativas
  • Identificação de padrões e tendências
  • Comunicação de resultados analíticos de forma visual e intuitiva

Este dashboard foi desenvolvido como prática de desenvolvimento de aplicações analíticas em R, utilizando o ecossistema flexdashboard + ggplot2. Link da base no kaggle: https://www.kaggle.com/datasets/sampathvinayakbablu/ultimate-student-productivity-dataset

Column

SOBRE O AUTOR

Alencar Morete é estudante de Análise e Desenvolvimento de Sistemas pelo Instituto Federal de Rondônia (IFRO), entusiasta da área de tecnologia e ciência de dados, com interesse em programação, análise de dados e desenvolvimento de aplicações digitais.

Possui experiência prática com ferramentas e linguagens como:

R e RStudio / Posit Cloud
Visualização de dados e dashboards
JavaScript e Node.js
Desenvolvimento web

Seu interesse principal está na aplicação de tecnologia para análise de dados, automação de processos e desenvolvimento de soluções digitais que transformem dados em informações úteis para tomada de decisão.

Este projeto foi desenvolvido como exercício de análise de dados e construção de dashboards interativos utilizando o ecossistema do R.

VARIÁVEIS QUALITATIVAS NOMINAIS

Column

Gráfico 1

Gráfico 2

Column

Explicando o gáfico 1

O gráfico apresenta a Função Densidade de Probabilidade (FDP) estimada para a variável consumo_cafeina_mg, construída a partir de 5.000 observações de estudantes. A curva exibe um perfil notavelmente plano e uniforme ao longo de toda a amplitude de valores (0 mg a 499 mg), indicando que o consumo de cafeína está distribuído de forma aproximadamente uniforme entre os estudantes da amostra — ou seja, não há concentração preferencial em torno de nenhum valor específico. A proximidade entre média (251,5 mg) e mediana (252,0 mg) reforça a simetria da distribuição, com cada faixa de 50 mg concentrando aproximadamente 10% dos estudantes. A ausência de picos sugere que os dados de consumo de cafeína foram gerados artificialmente, o que deve ser considerado em análises inferenciais, pois torna a variável pouco discriminativa por si só.

Explicando o gáfico 2

O gráfico apresenta a distribuição de frequência por idade dos estudantes da amostra, com 5.000 observações. Cada barra representa a contagem de estudantes para uma idade específica, variando de 16 a 25 anos. A distribuição também exibe um perfil aproximadamente uniforme entre as idades, sem picos expressivos que indiquem concentração etária dominante.

Cada faixa etária concentra cerca de 10% dos estudantes, com as idades de 24 (521), 22 (515) e 20 anos (513) registrando as maiores frequências — diferenças pequenas que reforçam a uniformidade da distribuição. Assim como observado no consumo de cafeína, esse padrão uniforme é indicativo de dados gerados artificialmente, já que populações reais tendem a apresentar concentração maior em determinadas faixas etárias, especialmente nas idades típicas de ingresso na graduação (18–21 anos).