O dataset Backloggd Games contém informações sobre 60.000 jogos cadastrados na plataforma Backloggd — uma rede social de rastreamento de jogos semelhante ao Letterboxd para filmes.
Variáveis disponíveis:
| Variável | Tipo | Descrição |
|---|---|---|
| Title | Qualitativa Nominal | Nome do jogo |
| Release_Date | Qualitativa Ordinal | Data de lançamento |
| Developers | Qualitativa Nominal | Desenvolvedoras |
| Platforms | Qualitativa Nominal | Plataformas disponíveis |
| Genres | Qualitativa Nominal | Gêneros do jogo |
| Rating | Quantitativa Contínua | Nota média (0–5) |
| Plays | Quantitativa Discreta | Nº de usuários que jogaram |
| Playing | Quantitativa Discreta | Nº jogando atualmente |
| Backlogs | Quantitativa Discreta | Nº na lista de pendências |
| Wishlist | Quantitativa Discreta | Nº na lista de desejos |
Estatísticas rápidas:
Aluno: [Seu Nome Aqui]
Curso: Análise e Desenvolvimento de Sistemas
(ADS)
Instituição: Instituto Federal de Rondônia — IFRO
Campus: Ji-Paraná
Disciplina: Estatística / Análise de Dados
Período: 2025
Objetivo do trabalho:
Este dashboard foi desenvolvido como atividade prática da disciplina, com o objetivo de aplicar conceitos de estatística descritiva sobre um dataset real, explorando:
ggplot2Ferramentas utilizadas:
flexdashboardggplot2dplyrO Gráfico 1 exibe a distribuição de frequências absolutas dos 10 gêneros mais comuns no dataset Backloggd. Trata-se de uma variável qualitativa nominal, pois os gêneros são categorias sem ordenação natural entre si.
Como ler: Cada barra representa um gênero; o comprimento indica quantos jogos pertencem àquele gênero (considerando apenas o gênero principal de cada título).
Principais observações:
Conclusão: A visualização de barras horizontais é ideal para variáveis qualitativas nominais com muitas categorias, pois facilita a leitura dos rótulos e a comparação entre frequências.
O Gráfico 2 apresenta as 10 plataformas com maior número de jogos catalogados no dataset. Plataforma é também uma variável qualitativa nominal — os nomes das plataformas são rótulos sem hierarquia matemática entre si.
Como ler: Cada barra corresponde a uma plataforma; o comprimento representa a contagem de jogos disponíveis nela.
Principais observações:
Conclusão: A análise das plataformas é fundamental para entender o ecossistema de distribuição de jogos e como o mercado se distribuiu historicamente entre diferentes fabricantes e sistemas.
O Gráfico 3 é um histograma que mostra a distribuição de frequências da variável Rating — uma variável quantitativa contínua que varia de 0 a 5 estrelas.
Como ler: Cada barra representa um intervalo de 0,1 pontos no rating; a altura indica quantos jogos receberam notas dentro daquele intervalo.
Medidas descritivas:
| Medida | Valor |
|---|---|
| Média | 3.03 |
| Mediana | 3.1 |
| Desvio Padrão | 0.74 |
| Mínimo | 0.3 |
| Máximo | 5 |
Principais observações:
O Gráfico 4 utiliza boxplots (diagramas de caixa) para comparar a distribuição do Rating entre os 6 gêneros mais frequentes do dataset.
Como ler um boxplot: - A linha central representa a mediana - A caixa abrange o intervalo interquartil (IQR = Q3 − Q1), contendo 50% dos dados centrais - As hastes se estendem até 1,5× o IQR - Os pontos fora das hastes são outliers
Principais observações:
Conclusão: O boxplot é uma ferramenta poderosa para comparar distribuições entre grupos categóricos, revelando não apenas a tendência central mas também a dispersão e a assimetria dos dados.