HOME

Column

SOBRE OS DADOS

O dataset Backloggd Games contem informacoes sobre 60,000 jogos cadastrados na plataforma Backloggd – uma rede social de rastreamento de jogos, analoga ao Letterboxd para filmes.

Classificacao estatistica das variaveis:

Variavel Tipo Subtipo
Title Qualitativa Nominal
Developers Qualitativa Nominal
Platforms Qualitativa Nominal
Genres Qualitativa Nominal
Release_Date / Decada Qualitativa Ordinal
Faixa de Rating Qualitativa Ordinal
Plays Quantitativa Discreta
Playing Quantitativa Discreta
Backlogs Quantitativa Discreta
Wishlist Quantitativa Discreta
Reviews Quantitativa Discreta
Rating Quantitativa Continua

ESTATISTICAS RAPIDAS

60,000
3.03
Adventure
Windows PC

Column

SOBRE O AUTOR

Aluno: [Seu Nome Aqui]
Curso: Analise e Desenvolvimento de Sistemas (ADS)
Instituicao: Instituto Federal de Rondonia – IFRO
Campus: Ji-Parana
Disciplina: Estatistica / Analise de Dados
Periodo: 2025


Objetivo do trabalho:

Este dashboard aplica conceitos de estatistica descritiva sobre um dataset real, explorando os quatro tipos de variaveis:

  • Nominais – categorias sem ordem (genero, plataforma)
  • Ordinais – categorias com ordem logica (decada, faixa de rating)
  • Discretas – contagens inteiras (plays, backlogs, wishlist)
  • Continuas – valores em escala real (rating)

Ferramentas utilizadas:

Ferramenta Uso
R Linguagem principal
flexdashboard Layout do dashboard
ggplot2 Visualizacoes
dplyr Manipulacao de dados
RStudio / Posit Cloud Ambiente

VARIAVEIS QUALITATIVAS NOMINAIS

Column

Grafico 1 – Top 10 Generos mais frequentes

Grafico 2 – Top 10 Plataformas mais frequentes

Column

Explicando o Grafico 1 – Generos

O Grafico 1 exibe a distribuicao de frequencias absolutas dos 10 generos mais comuns. Trata-se de uma variavel qualitativa nominal: os generos sao categorias sem ordenacao natural entre si.

Como ler: Cada barra representa um genero; o comprimento indica quantos jogos pertencem aquele genero (considerando apenas o genero principal de cada titulo).

Principais observacoes:

  • O genero Adventure e o mais frequente, com 19,368 jogos.
  • O segundo lugar e Indie com 6,964 titulos.
  • Ha concentracao acentuada nos primeiros generos – distribuicao assimetrica tipica de preferencias culturais.

Por que grafico de barras? E o tipo ideal para variaveis nominais. A unica medida resumo possivel e a moda.

Explicando o Grafico 2 – Plataformas

O Grafico 2 apresenta as 10 plataformas com maior numero de jogos catalogados. Plataforma e tambem uma variavel qualitativa nominal – nomes sem hierarquia matematica.

Principais observacoes:

  • Windows PC lidera com 29,620 jogos.
  • Android e Web browser aparecem em seguida.
  • Plataformas recentes tem frequencias menores pois seu catalogo ainda esta em formacao.

Conclusao: Para variaveis nominais, as unicas medidas validas sao contagens, proporcoes e moda.

VARIAVEIS QUALITATIVAS ORDINAIS

Column

Grafico 3 – Jogos lancados por Decada

Grafico 4 – Jogos por Faixa de Rating

Column

Explicando o Grafico 3 – Decadas

O Grafico 3 mostra quantos jogos foram lancados em cada decada. Esta e uma variavel qualitativa ordinal: as categorias possuem ordem natural (1990 < 2000 < 2010…).

Principais observacoes:

  • Os Anos 2010 concentram o maior numero de lancamentos.
  • Os Anos 2020 aparecem com volume menor pois a decada ainda nao terminou na coleta.
  • Decadas antigas tem poucos titulos – jogos historicos sao menos catalogados.

Medidas possiveis: Em ordinais podemos calcular moda e mediana, mas nao a media, pois a distancia entre categorias nao e uniforme.

Explicando o Grafico 4 – Faixa de Rating

O Grafico 4 classifica os jogos em faixas de avaliacao – de “Ruim” a “Excelente”.

Faixa Intervalo
Ruim 0 a 2
Regular 2 a 3
Bom 3 a 4
Excelente 4 a 5

Principais observacoes:

  • A faixa “Bom (3-4)” concentra a maioria dos jogos.
  • Jogos “Excelentes” sao relativamente raros.
  • Jogos “Ruins” tambem sao pouco frequentes.

Por que ordinal? Existe uma progressao clara: Ruim < Regular < Bom < Excelente.

VARIAVEIS QUANTITATIVAS DISCRETAS

Column

Grafico 5 – Top 20 Jogos com mais Plays

Grafico 6 – Plays vs Backlogs (dispersao)

Column

Explicando o Grafico 5 – Top Plays

O Grafico 5 exibe os 20 jogos com maior numero de plays. Plays e uma variavel quantitativa discreta: contagem inteira de usuarios que marcaram o jogo como jogado.

Medidas descritivas de Plays (todos os jogos):

Medida Valor
Media 266
Mediana 6
Desvio Padrao 1,348
Maximo 38,000

A mediana muito menor que a media confirma a assimetria: a maioria dos jogos tem poucos plays, enquanto poucos titulos concentram numeros gigantescos.

Explicando o Grafico 6 – Plays vs Backlogs

O Grafico 6 e um diagrama de dispersao que relaciona Plays e Backlogs. A linha vermelha e a reta de regressao linear.

Principais observacoes:

  • Ha correlacao positiva: jogos populares atraem tanto quem ja jogou quanto quem quer jogar.
  • A dispersao aumenta com os valores – a relacao nao e perfeitamente linear.
  • Existem outliers notaveis.

Conclusao: O diagrama de dispersao e ideal para investigar relacoes entre variaveis quantitativas.

VARIAVEIS QUANTITATIVAS CONTINUAS

Column

Grafico 7 – Distribuicao dos Ratings (Histograma)

Grafico 8 – Boxplot de Rating por Top 6 Generos

Column

Explicando o Grafico 7 – Histograma de Ratings

O Grafico 7 mostra a distribuicao do Rating – uma variavel quantitativa continua que pode assumir qualquer valor real entre 0 e 5.

Medidas descritivas completas do Rating:

Medida Valor
Media 3.03
Mediana 3.1
Desvio Padrao 0.74
1 Quartil (Q1) 2.6
3 Quartil (Q3) 3.5
Minimo 0.3
Maximo 5

Principais observacoes:

  • A distribuicao e ligeiramente assimetrica a esquerda.
  • Concentracao principal entre 3,0 e 4,5.
  • Media e mediana proximas indicam distribuicao relativamente simetrica no centro.

Explicando o Grafico 8 – Boxplot por Genero

O Grafico 8 usa boxplots para comparar a distribuicao do Rating entre os 6 generos mais frequentes.

Como ler um boxplot:

Elemento Significado
Linha central Mediana (Q2)
Borda inferior 1 Quartil (Q1)
Borda superior 3 Quartil (Q3)
Largura da caixa IQR = Q3 - Q1
Hastes Ate 1,5 x IQR alem dos quartis
Pontos isolados Outliers

Principais observacoes:

  • Medianas similares entre generos (faixa de 3,0 a 3,8).
  • Generos com caixas mais largas tem avaliacoes mais heterogeneas.
  • Outliers inferiores sao comuns em todos os generos.

Conclusao: Variaveis continuas admitem o conjunto completo de medidas estatisticas – sendo as mais ricas para analise.