HOME

Column

SOBRE OS DADOS

50.000 faixas sintéticas no estilo Spotify, abrangendo o período de 2000 a 2024 em 20 gêneros. Cada registro espelha a API de Recursos de Áudio do Spotify: dançabilidade, energia, volume, presença de fala, acústica, instrumentalidade, presença ao vivo, valência, andamento, duração, tonalidade e modo — todos gerados com distribuições realistas. Desenvolvido para fins educacionais em:

  • Previsão de popularidade (regressão);
  • Classificação de gênero (20 classes);
  • Agrupamento de humor (K-Means / UMAP);
  • Tendências temporais;
  • Prototipagem de sistemas de recomendação.

Características notáveis incluem distribuição Zipf de popularidade, tonalidades realistas e variações de BPM entre 60 e 180.

Column

SOBRE O AUTOR

Olá a todos, meu nome é William da Silva Matsunaga.

Sou uma pessoa apaixonada por tecnologia desde a infância. Tudo começou quando ganhei meu primeiro computador, por volta dos meus 10 anos e, desde então, a curiosidade em entender, explorar e criar dentro desse universo só cresceu.

Hoje, essa paixão se tornou meu propósito profissional. Atualmente, estou cursando o ensino superior em Análise e Desenvolvimento de Sistemas e atuo como assistente de projetos, onde tenho a oportunidade de aplicar na prática conhecimentos relacionados à área de tecnologia.

Estou constantemente em busca de oportunidades para aprender, evoluir e me desenvolver, contribuindo com dedicação, curiosidade e vontade de crescer.

Qualitativas Nominais

Column

Gráfico 1

Column

Explicando o gáfico 1

Este gráfico apresenta a frequência total de faixas por gênero no dataset sintético contendo 50 mil músicas. Ele ajuda a identificar:

  • A diversidade ou concentração de gêneros
  • Possíveis desequilíbrios importantes para modelos preditivos
  • Padrões iniciais de distribuição
  • Insights para análise exploratória e tratamento de dados

Utiliza a cor darkgreen para manter a consistência visual com o tema geral do dashboard.

Qualitativas Ordinais

Column

Gráfico 1

Column

Explicando o gáfico 1

Este gráfico apresenta a distribuição da popularidade das músicas no dataset, considerando uma escala de 0 a 100.

Ele permite analisar:

  • Como as músicas estão distribuídas em termos de popularidade
  • Se há maior concentração em músicas pouco populares ou muito populares
  • A presença de padrões como cauda longa (muitas músicas com baixa popularidade)
  • Possíveis tendências que podem influenciar modelos de previsão

A popularidade é considerada uma variável qualitativa ordinal, pois representa uma classificação com ordem (do menos popular ao mais popular).

Qualitativas Discretas

Row

Gráfico 1

Row

Explicando o gáfico 1

Este gráfico apresenta a distribuição das músicas ao longo dos anos de lançamento (release_year), permitindo visualizar como as faixas estão distribuídas no tempo.

Ele possibilita analisar:

  • A quantidade de músicas lançadas por ano
  • Tendências de crescimento ou queda na produção musical ao longo do tempo
  • Concentração de dados em períodos mais recentes ou mais antigos
  • Possíveis padrões temporais relevantes para análises futuras

A variável release_year é classificada como quantitativa discreta, pois representa valores numéricos inteiros (anos), sem a possibilidade de valores fracionados.

Qualitativas Contínua

Row

Gráfico 1

Row

Explicando o gáfico 1

Este gráfico apresenta a distribuição da duração das músicas (duration_ms), medida em milissegundos.

Essa variável indica o tempo total de cada faixa, permitindo analisar o padrão de duração presente no dataset.

A análise possibilita identificar:

  • A duração média das músicas
  • A presença de faixas muito curtas ou muito longas
  • A concentração em intervalos comuns (ex: músicas entre 2 e 4 minutos)
  • Possíveis outliers que fogem do padrão

A variável duration_ms é classificada como quantitativa contínua, pois assume valores numéricos em uma escala contínua de tempo.