O dataset Backloggd Games contem informacoes sobre 60,000 jogos cadastrados na plataforma Backloggd – uma rede social de rastreamento de jogos, analoga ao Letterboxd para filmes.
Classificacao estatistica das variaveis:
| Variavel | Tipo | Subtipo |
|---|---|---|
| Title | Qualitativa | Nominal |
| Developers | Qualitativa | Nominal |
| Platforms | Qualitativa | Nominal |
| Genres | Qualitativa | Nominal |
| Release_Date / Decada | Qualitativa | Ordinal |
| Faixa de Rating | Qualitativa | Ordinal |
| Plays | Quantitativa | Discreta |
| Playing | Quantitativa | Discreta |
| Backlogs | Quantitativa | Discreta |
| Wishlist | Quantitativa | Discreta |
| Reviews | Quantitativa | Discreta |
| Rating | Quantitativa | Continua |
Aluno: [Seu Nome Aqui]
Curso: Analise e Desenvolvimento de Sistemas
(ADS)
Instituicao: Instituto Federal de Rondonia – IFRO
Campus: Ji-Parana
Disciplina: Estatistica / Analise de Dados
Periodo: 2025
Objetivo do trabalho:
Este dashboard aplica conceitos de estatistica descritiva sobre um dataset real, explorando os quatro tipos de variaveis:
Ferramentas utilizadas:
| Ferramenta | Uso |
|---|---|
| R | Linguagem principal |
| flexdashboard | Layout do dashboard |
| ggplot2 | Visualizacoes |
| dplyr | Manipulacao de dados |
| RStudio / Posit Cloud | Ambiente |
O Grafico 1 exibe a distribuicao de frequencias absolutas dos 10 generos mais comuns. Trata-se de uma variavel qualitativa nominal: os generos sao categorias sem ordenacao natural entre si.
Como ler: Cada barra representa um genero; o comprimento indica quantos jogos pertencem aquele genero (considerando apenas o genero principal de cada titulo).
Principais observacoes:
Por que grafico de barras? E o tipo ideal para variaveis nominais. A unica medida resumo possivel e a moda.
O Grafico 2 apresenta as 10 plataformas com maior numero de jogos catalogados. Plataforma e tambem uma variavel qualitativa nominal – nomes sem hierarquia matematica.
Principais observacoes:
Conclusao: Para variaveis nominais, as unicas medidas validas sao contagens, proporcoes e moda.
O Grafico 3 mostra quantos jogos foram lancados em cada decada. Esta e uma variavel qualitativa ordinal: as categorias possuem ordem natural (1990 < 2000 < 2010…).
Principais observacoes:
Medidas possiveis: Em ordinais podemos calcular moda e mediana, mas nao a media, pois a distancia entre categorias nao e uniforme.
O Grafico 4 classifica os jogos em faixas de avaliacao – de “Ruim” a “Excelente”.
| Faixa | Intervalo |
|---|---|
| Ruim | 0 a 2 |
| Regular | 2 a 3 |
| Bom | 3 a 4 |
| Excelente | 4 a 5 |
Principais observacoes:
Por que ordinal? Existe uma progressao clara: Ruim < Regular < Bom < Excelente.
O Grafico 5 exibe os 20 jogos com maior numero de plays. Plays e uma variavel quantitativa discreta: contagem inteira de usuarios que marcaram o jogo como jogado.
Medidas descritivas de Plays (todos os jogos):
| Medida | Valor |
|---|---|
| Media | 266 |
| Mediana | 6 |
| Desvio Padrao | 1,348 |
| Maximo | 38,000 |
A mediana muito menor que a media confirma a assimetria: a maioria dos jogos tem poucos plays, enquanto poucos titulos concentram numeros gigantescos.
O Grafico 6 e um diagrama de dispersao que relaciona Plays e Backlogs. A linha vermelha e a reta de regressao linear.
Principais observacoes:
Conclusao: O diagrama de dispersao e ideal para investigar relacoes entre variaveis quantitativas.
O Grafico 7 mostra a distribuicao do Rating – uma variavel quantitativa continua que pode assumir qualquer valor real entre 0 e 5.
Medidas descritivas completas do Rating:
| Medida | Valor |
|---|---|
| Media | 3.03 |
| Mediana | 3.1 |
| Desvio Padrao | 0.74 |
| 1 Quartil (Q1) | 2.6 |
| 3 Quartil (Q3) | 3.5 |
| Minimo | 0.3 |
| Maximo | 5 |
Principais observacoes:
O Grafico 8 usa boxplots para comparar a distribuicao do Rating entre os 6 generos mais frequentes.
Como ler um boxplot:
| Elemento | Significado |
|---|---|
| Linha central | Mediana (Q2) |
| Borda inferior | 1 Quartil (Q1) |
| Borda superior | 3 Quartil (Q3) |
| Largura da caixa | IQR = Q3 - Q1 |
| Hastes | Ate 1,5 x IQR alem dos quartis |
| Pontos isolados | Outliers |
Principais observacoes:
Conclusao: Variaveis continuas admitem o conjunto completo de medidas estatisticas – sendo as mais ricas para analise.