Este dashboard apresenta visualizacoes estatisticas baseadas em dados de estudantes da area de computacao, disponiveis publicamente no Kaggle (CS Students Performance Dataset).
O conjunto contem 180 registros de estudantes com 12 variaveis, incluindo informacoes pessoais, desempenho academico (GPA), habilidades tecnicas (Python, SQL, Java), projetos realizados e interesses de carreira.
O objetivo e analisar diferentes variaveis presentes no conjunto de dados, utilizando tecnicas de visualizacao estatistica em R. As analises cobrem as 4 classificacoes classicas da estatistica descritiva, permitindo identificar padroes e distribuicoes nos dados coletados.
Gabriel Lucena Ferreira
Desenvolvedor Full Stack | QA | Bolsista IFRO
📱 (69) 99324-2656
🔗 linkedin.com/in/gabriel-lucena-ferreira
💻 github.com/freysta
Estudante de Analise e Desenvolvimento de Sistemas no IFRO - Campus Ji-Parana (2024-2026), com formacao tecnica em Informatica pelo proprio IFRO e certificacao CS50 da Harvard University.
Experiencia profissional em QA e desenvolvimento Full Stack, incluindo estagio na Compass UOL (testes automatizados com Robot Framework, AWS, Scrum) e atuacao como bolsista no IFRO em suporte e QA do sistema Proinfe. Tambem atuou na Wadt Engenharia, CEPLAC/MAPA e em projetos freelancer entregues para clientes reais.
Os graficos apresentados representam variaveis qualitativas nominais, ou seja, categorias que nao possuem ordem natural ou hierarquia entre si — elas servem apenas para classificar ou identificar grupos distintos.
Analise 1: Distribuicao por Genero
O grafico de barras verticais mostra a quantidade e o percentual de estudantes em cada categoria de genero. Essa visualizacao e crucial para observar a proporcao entre os grupos e identificar se ha desequilibrio de representatividade na amostra. No dataset analisado, comparamos as frequencias absolutas e relativas das categorias de genero.
Analise 2: Area de Interesse
O grafico de barras horizontais apresenta as areas da computacao que despertam maior interesse entre os estudantes, ordenadas para facilitar a leitura. O uso de barras horizontais e a melhor escolha estatistica e de design para rotulos longos, pois evita a sobreposicao de texto. O gradiente azul reforcado na ponta destaca visualmente os dominios mais populares na tecnologia atual.
Diferente das nominais, as variaveis qualitativas ordinais tambem sao caracteristicas descritivas, porem possuem uma progressao, hierarquia ou ordem logica embutida em suas categorias (como Baixo, Medio, Alto, ou notas conceituais).
Analise das Habilidades (Python e SQL)
Nesta pagina, estamos observando como os estudantes se auto-avaliam (ou foram avaliados) em relacao as suas habilidades de programacao em Python e em linguagens de banco de dados SQL.
Apesar de o eixo X nao apresentar numeros de escala livre (como uma regua), existe um claro “crescimento” no conceito — de Weak (iniciante) ate Strong (avancado). Entender a concentracao dos alunos nessas categorias ajuda a mapear se a turma e predominantemente junior, plena ou avancada nas ferramentas base do mercado de analise de dados e desenvolvimento back-end.
As variaveis quantitativas discretas sao dados numericos oriundos de processos de contagem. A principal caracteristica dessa variavel e que ela nao aceita valores quebrados/fracionados dentro do seu intervalo logico — voce nao pode ter “21.5 anos de idade cronologica em anos letivos”.
Analise da Distribuicao por Idade
O grafico ao lado (conhecido como Lollipop Chart ou Grafico de Pirulito) e uma excelente forma de visualizar dados discretos com poucas categorias.
Ele nos mostra a quantidade exata de estudantes agrupados por idade (em anos inteiros). O comprimento das hastes permite comparar rapidamente quais faixas etarias concentram mais alunos, revelando o perfil tipico do estudante de computacao neste dataset. Outliers foram filtrados para manter a legibilidade e o foco nas idades mais representativas da graduacao.
Por fim, as variaveis quantitativas continuas sao dados numericos resultantes de um processo de medicao. Elas podem assumir teoricamente qualquer valor (inclusive fracionados/decimais) dentro de um intervalo.
Analise do Desempenho Academico (GPA)
O GPA (Grade Point Average) e uma variavel continua perfeita, pois a media das notas de um estudante pode gerar inumeras casas decimais.