Este dashboard apresenta uma análise exploratória de um conjunto de dados disponibilizado na plataforma Kaggle, com aproximadamente 5.000 registros relacionados a hábitos de estudo, produtividade acadêmica e fatores de estilo de vida que podem influenciar o desempenho dos estudantes.
Variáveis presentes no conjunto de dados:
| Variável | Tipo |
|---|---|
| Horas de estudo | Quantitativa contínua |
| Padrões de sono | Quantitativa contínua |
| Uso de redes sociais | Quantitativa contínua |
| Qualidade da internet | Qualitativa ordinal |
| Nível de saúde mental | Quantitativa discreta |
| Pontuação de produtividade | Quantitativa contínua |
Objetivos desta aplicação:
Este dashboard foi desenvolvido como prática de desenvolvimento de aplicações analíticas em R, utilizando o ecossistema flexdashboard + ggplot2. Link da base no kaggle: https://www.kaggle.com/datasets/sampathvinayakbablu/ultimate-student-productivity-dataset
Alencar Morete é estudante de Análise e Desenvolvimento de Sistemas pelo Instituto Federal de Rondônia (IFRO), entusiasta da área de tecnologia e ciência de dados, com interesse em programação, análise de dados e desenvolvimento de aplicações digitais.
Possui experiência prática com ferramentas e linguagens como:
R e RStudio / Posit Cloud
Visualização de dados e dashboards
JavaScript e Node.js
Desenvolvimento web
Seu interesse principal está na aplicação de tecnologia para análise de dados, automação de processos e desenvolvimento de soluções digitais que transformem dados em informações úteis para tomada de decisão.
Este projeto foi desenvolvido como exercício de análise de dados e construção de dashboards interativos utilizando o ecossistema do R.
O gráfico apresenta a Função Densidade de Probabilidade (FDP) estimada para a variável consumo_cafeina_mg, construída a partir de 5.000 observações de estudantes. A curva exibe um perfil notavelmente plano e uniforme ao longo de toda a amplitude de valores (0 mg a 499 mg), indicando que o consumo de cafeína está distribuído de forma aproximadamente uniforme entre os estudantes da amostra — ou seja, não há concentração preferencial em torno de nenhum valor específico. A proximidade entre média (251,5 mg) e mediana (252,0 mg) reforça a simetria da distribuição, com cada faixa de 50 mg concentrando aproximadamente 10% dos estudantes. A ausência de picos sugere que os dados de consumo de cafeína foram gerados artificialmente, o que deve ser considerado em análises inferenciais, pois torna a variável pouco discriminativa por si só.
O gráfico apresenta a distribuição de frequência por idade dos estudantes da amostra, com 5.000 observações. Cada barra representa a contagem de estudantes para uma idade específica, variando de 16 a 25 anos. A distribuição também exibe um perfil aproximadamente uniforme entre as idades, sem picos expressivos que indiquem concentração etária dominante.
Cada faixa etária concentra cerca de 10% dos estudantes, com as idades de 24 (521), 22 (515) e 20 anos (513) registrando as maiores frequências — diferenças pequenas que reforçam a uniformidade da distribuição. Assim como observado no consumo de cafeína, esse padrão uniforme é indicativo de dados gerados artificialmente, já que populações reais tendem a apresentar concentração maior em determinadas faixas etárias, especialmente nas idades típicas de ingresso na graduação (18–21 anos).