HOME

Column

SOBRE OS DADOS

Este dashboard apresenta visualizacoes estatisticas baseadas em dados de estudantes da area de computacao, disponiveis publicamente no Kaggle (CS Students Performance Dataset).

O conjunto contem 180 registros de estudantes com 12 variaveis, incluindo informacoes pessoais, desempenho academico (GPA), habilidades tecnicas (Python, SQL, Java), projetos realizados e interesses de carreira.

O objetivo e analisar diferentes variaveis presentes no conjunto de dados, utilizando tecnicas de visualizacao estatistica em R. As analises cobrem as 4 classificacoes classicas da estatistica descritiva, permitindo identificar padroes e distribuicoes nos dados coletados.

Column

SOBRE O AUTOR

Gabriel Lucena Ferreira
Desenvolvedor Full Stack | QA | Bolsista IFRO


📧

📱 (69) 99324-2656

🔗 linkedin.com/in/gabriel-lucena-ferreira

💻 github.com/freysta


Estudante de Analise e Desenvolvimento de Sistemas no IFRO - Campus Ji-Parana (2024-2026), com formacao tecnica em Informatica pelo proprio IFRO e certificacao CS50 da Harvard University.

Experiencia profissional em QA e desenvolvimento Full Stack, incluindo estagio na Compass UOL (testes automatizados com Robot Framework, AWS, Scrum) e atuacao como bolsista no IFRO em suporte e QA do sistema Proinfe. Tambem atuou na Wadt Engenharia, CEPLAC/MAPA e em projetos freelancer entregues para clientes reais.

  • Linguagens: TypeScript · JavaScript · PHP · C# · Python · SQL
  • Frameworks: React · React Native · Next.js · NestJS · Laravel · Node.js
  • Dados & Cloud: MySQL · PostgreSQL · Firebase · AWS
  • QA: Robot Framework · Postman · Insomnia · testes manuais e automatizados

QUALITATIVAS NOMINAIS

Column

Distribuicao por Genero

Area de Interesse dos Estudantes

Column

O que sao Variaveis Qualitativas Nominais?

Os graficos apresentados representam variaveis qualitativas nominais, ou seja, categorias que nao possuem ordem natural ou hierarquia entre si — elas servem apenas para classificar ou identificar grupos distintos.

Analise 1: Distribuicao por Genero

O grafico de barras verticais mostra a quantidade e o percentual de estudantes em cada categoria de genero. Essa visualizacao e crucial para observar a proporcao entre os grupos e identificar se ha desequilibrio de representatividade na amostra. No dataset analisado, comparamos as frequencias absolutas e relativas das categorias de genero.

Analise 2: Area de Interesse

O grafico de barras horizontais apresenta as areas da computacao que despertam maior interesse entre os estudantes, ordenadas para facilitar a leitura. O uso de barras horizontais e a melhor escolha estatistica e de design para rotulos longos, pois evita a sobreposicao de texto. O gradiente azul reforcado na ponta destaca visualmente os dominios mais populares na tecnologia atual.

QUALITATIVAS ORDINAIS

Column

Nivel de Conhecimento em Python

Nivel de Conhecimento em SQL

Column

O que sao Variaveis Qualitativas Ordinais?

Diferente das nominais, as variaveis qualitativas ordinais tambem sao caracteristicas descritivas, porem possuem uma progressao, hierarquia ou ordem logica embutida em suas categorias (como Baixo, Medio, Alto, ou notas conceituais).

Analise das Habilidades (Python e SQL)

Nesta pagina, estamos observando como os estudantes se auto-avaliam (ou foram avaliados) em relacao as suas habilidades de programacao em Python e em linguagens de banco de dados SQL.

Apesar de o eixo X nao apresentar numeros de escala livre (como uma regua), existe um claro “crescimento” no conceito — de Weak (iniciante) ate Strong (avancado). Entender a concentracao dos alunos nessas categorias ajuda a mapear se a turma e predominantemente junior, plena ou avancada nas ferramentas base do mercado de analise de dados e desenvolvimento back-end.

QUANTITATIVAS DISCRETAS

Column

Distribuicao por Idade dos Estudantes

Column

O que sao Variaveis Quantitativas Discretas?

As variaveis quantitativas discretas sao dados numericos oriundos de processos de contagem. A principal caracteristica dessa variavel e que ela nao aceita valores quebrados/fracionados dentro do seu intervalo logico — voce nao pode ter “21.5 anos de idade cronologica em anos letivos”.

Analise da Distribuicao por Idade

O grafico ao lado (conhecido como Lollipop Chart ou Grafico de Pirulito) e uma excelente forma de visualizar dados discretos com poucas categorias.

Ele nos mostra a quantidade exata de estudantes agrupados por idade (em anos inteiros). O comprimento das hastes permite comparar rapidamente quais faixas etarias concentram mais alunos, revelando o perfil tipico do estudante de computacao neste dataset. Outliers foram filtrados para manter a legibilidade e o foco nas idades mais representativas da graduacao.

QUANTITATIVAS CONTINUAS

Column

Histograma do Desempenho Academico (GPA)

Boxplot do GPA por Genero

Column

O que sao Variaveis Quantitativas Continuas?

Por fim, as variaveis quantitativas continuas sao dados numericos resultantes de um processo de medicao. Elas podem assumir teoricamente qualquer valor (inclusive fracionados/decimais) dentro de um intervalo.

Analise do Desempenho Academico (GPA)

O GPA (Grade Point Average) e uma variavel continua perfeita, pois a media das notas de um estudante pode gerar inumeras casas decimais.

  1. Histograma: O primeiro grafico e o padrao-ouro estatistico para variaveis continuas. Diferente de um grafico de barras, as colunas do histograma sao encostadas umas nas outras para representar a continuidade dos dados (a famosa curva de distribuicao). Com ele, vemos onde a “massa” de notas esta concentrada.
  2. Boxplot: O grafico de caixas e extremamente poderoso. Ele nos permite comparar a estabilidade de duas populacoes (neste caso, a nota de meninos vs meninas), mostrando onde esta a mediana (linha central), os quartis de variacao e os outliers (pontos vermelhos isolados, que representam alunos que tiveram notas excepcionalmente altas ou baixas fora do padrao geral).