HOME

Column

SOBRE OS DADOS

O dataset Backloggd Games contém informações sobre 60.000 jogos cadastrados na plataforma Backloggd — uma rede social de rastreamento de jogos semelhante ao Letterboxd para filmes.

Variáveis disponíveis:

Variável Tipo Descrição
Title Qualitativa Nominal Nome do jogo
Release_Date Qualitativa Ordinal Data de lançamento
Developers Qualitativa Nominal Desenvolvedoras
Platforms Qualitativa Nominal Plataformas disponíveis
Genres Qualitativa Nominal Gêneros do jogo
Rating Quantitativa Contínua Nota média (0–5)
Plays Quantitativa Discreta Nº de usuários que jogaram
Playing Quantitativa Discreta Nº jogando atualmente
Backlogs Quantitativa Discreta Nº na lista de pendências
Wishlist Quantitativa Discreta Nº na lista de desejos

Estatísticas rápidas:

  • 🎮 Total de jogos: 60.000
  • ⭐ Rating médio: 3.03
  • 🎯 Gênero mais frequente: Adventure
  • 🖥️ Plataforma mais frequente: Windows PC

Column

SOBRE O AUTOR

Aluno: [Seu Nome Aqui]
Curso: Análise e Desenvolvimento de Sistemas (ADS)
Instituição: Instituto Federal de Rondônia — IFRO
Campus: Ji-Paraná
Disciplina: Estatística / Análise de Dados
Período: 2025


Objetivo do trabalho:

Este dashboard foi desenvolvido como atividade prática da disciplina, com o objetivo de aplicar conceitos de estatística descritiva sobre um dataset real, explorando:

  • Distribuição de frequências de variáveis qualitativas e quantitativas
  • Visualizações gráficas com ggplot2
  • Medidas de tendência central e dispersão
  • Interpretação crítica dos resultados

Ferramentas utilizadas:

  • Linguagem R
  • Pacote flexdashboard
  • Pacote ggplot2
  • Pacote dplyr
  • RStudio

VARIÁVEIS QUALITATIVAS NOMINAIS

Column

Gráfico 1 — Top 10 Gêneros mais frequentes

Gráfico 2 — Top 10 Plataformas mais frequentes

Column

Explicando o Gráfico 1 — Gêneros

O Gráfico 1 exibe a distribuição de frequências absolutas dos 10 gêneros mais comuns no dataset Backloggd. Trata-se de uma variável qualitativa nominal, pois os gêneros são categorias sem ordenação natural entre si.

Como ler: Cada barra representa um gênero; o comprimento indica quantos jogos pertencem àquele gênero (considerando apenas o gênero principal de cada título).

Principais observações:

  • O gênero Adventure é o mais frequente, com 19.368 jogos — demonstrando a predominância desse tipo no catálogo.
  • O segundo lugar é Indie com 6.964 títulos.
  • Existe uma concentração notável nos primeiros gêneros, enquanto os demais apresentam frequências bem menores — caracterizando uma distribuição assimétrica típica de dados de preferência cultural.

Conclusão: A visualização de barras horizontais é ideal para variáveis qualitativas nominais com muitas categorias, pois facilita a leitura dos rótulos e a comparação entre frequências.

Explicando o Gráfico 2 — Plataformas

O Gráfico 2 apresenta as 10 plataformas com maior número de jogos catalogados no dataset. Plataforma é também uma variável qualitativa nominal — os nomes das plataformas são rótulos sem hierarquia matemática entre si.

Como ler: Cada barra corresponde a uma plataforma; o comprimento representa a contagem de jogos disponíveis nela.

Principais observações:

  • Windows PC lidera com 29.620 jogos, o que reflete o grande volume de títulos desenvolvidos para PC ao longo da história dos videogames.
  • Plataformas como Android e Web browser aparecem em seguida, evidenciando a forte presença dos consoles da geração anterior.
  • Plataformas mais recentes ou de nicho aparecem com frequências menores, refletindo menor volume de catálogo ainda em construção.

Conclusão: A análise das plataformas é fundamental para entender o ecossistema de distribuição de jogos e como o mercado se distribuiu historicamente entre diferentes fabricantes e sistemas.

VARIÁVEIS QUANTITATIVAS

Column

Gráfico 3 — Distribuição dos Ratings

Gráfico 4 — Boxplot de Rating por Top 6 Gêneros

Column

Explicando o Gráfico 3 — Histograma de Ratings

O Gráfico 3 é um histograma que mostra a distribuição de frequências da variável Rating — uma variável quantitativa contínua que varia de 0 a 5 estrelas.

Como ler: Cada barra representa um intervalo de 0,1 pontos no rating; a altura indica quantos jogos receberam notas dentro daquele intervalo.

Medidas descritivas:

Medida Valor
Média 3.03
Mediana 3.1
Desvio Padrão 0.74
Mínimo 0.3
Máximo 5

Principais observações:

  • A distribuição apresenta uma concentração na faixa entre 3,0 e 4,5, sugerindo que a maioria dos jogos avaliados tem notas medianas a boas.
  • A média (3.03) e a mediana (3.1) estão próximas, indicando uma distribuição relativamente simétrica.
  • Ratings extremamente baixos (abaixo de 1,5) são raros, possivelmente porque jogos muito mal avaliados acumulam poucas avaliações.

Explicando o Gráfico 4 — Boxplot por Gênero

O Gráfico 4 utiliza boxplots (diagramas de caixa) para comparar a distribuição do Rating entre os 6 gêneros mais frequentes do dataset.

Como ler um boxplot: - A linha central representa a mediana - A caixa abrange o intervalo interquartil (IQR = Q3 − Q1), contendo 50% dos dados centrais - As hastes se estendem até 1,5× o IQR - Os pontos fora das hastes são outliers

Principais observações:

  • Todos os 6 gêneros apresentam medianas de rating semelhantes, na faixa de 3,0 a 3,8, o que indica que o gênero por si só não determina fortemente a nota.
  • Alguns gêneros mostram maior variabilidade (caixas mais largas), sugerindo que nesses gêneros há tanto jogos muito bons quanto muito ruins.
  • Os outliers inferiores são frequentes em todos os gêneros, representando títulos com avaliações muito abaixo da média do grupo.

Conclusão: O boxplot é uma ferramenta poderosa para comparar distribuições entre grupos categóricos, revelando não apenas a tendência central mas também a dispersão e a assimetria dos dados.