1. Introducció

Aquest conjunt de dades prové de SteamCharts, una plataforma que recopila informació històrica de jugadors actius a la plataforma Steam per a cada videojoc.

L’objectiu del projecte és analitzar l’evolució mensual de jugadors d’un o més videojocs de Steam per comprendre millor les tendències d’ús, els pics d’activitat i les fluctuacions en nombre de jugadors.

La pregunta principal que volem respondre és:

Com ha evolucionat l’activitat dels jugadors d’un videojoc al llarg del temps i quins factors poden explicar els canvis mensuals observats?

Aquestes dades son adequades perque disposen d’una evolució temporal coherent amb mitjanes de jugadors, màxims i percentatges de variació per diferents jocs de la plataforma, aixi que es poden comparar les dades d’un videojoc amb un altre, i extreure informació interessant.

2. Importació de les dades

Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.

dades <- read_csv("steamcharts.csv")
## Rows: 612265 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): month, gain, name
## dbl (4): avg_players, gain_percent, peak_players, steam_appid
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

El format original del fitxer és csv, un format tabular senzill d’importar i treballar. No s’ha fet cap modificació prèvia rellevant més enllà de l’exportació des d’un .RData original. Les columnes tenen noms clars i no ha calgut reanomenar-les.

3. Dimensions del dataset

dim(dades)
## [1] 612265      7
glimpse(dades)
## Rows: 612,265
## Columns: 7
## $ month        <chr> "Sep-25", "Aug-25", "Jul-25", "Jun-25", "May-25", "Apr-25…
## $ avg_players  <dbl> 7805.25, 6922.13, 7371.48, 8204.98, 9052.51, 9523.82, 103…
## $ gain         <chr> "883.12", "-449.35", "-833.5", "-847.53", "-471.31", "-84…
## $ gain_percent <dbl> 0.1276, -0.0610, -0.1016, -0.0936, -0.0495, -0.0819, -0.1…
## $ peak_players <dbl> 13254, 12168, 13951, 15798, 15333, 17727, 18180, 18934, 2…
## $ name         <chr> "Counter-Strike", "Counter-Strike", "Counter-Strike", "Co…
## $ steam_appid  <dbl> 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 1…

Nombre de files: correspon al nombre de mesos registrats per videojoc.

Nombre de columnes: 7 variables.

La unitat d’anàlisi és el registre mensual d’un videojoc concret, identificat per steam_appid.

4. Diccionari de variables

Descriviu cada variable del dataset.

Variable Tipus Descripció Valors possibles / rang
month caràcter Mes i any del registre (format “Feb-20”) Un mes per fila
avg_players numèrica Mitjana de jugadors actius durant el mes Depèn del joc (p.ex. 0–100k)
gain numèrica Increment absolut respecte del mes anterior Pot ser positiu o negatiu
gain_percent numèrica Variació percentual del mes Habitualment entre -1 i 1
peak_players numèrica Nombre màxim de jugadors simultanis en el mes Rang variable segons popularitat
name caràcter Nom del videojoc P.ex. “Counter-Strike”
steam_appid numèrica Identificador de Steam Enter positiu
tibble(
  variable = names(dades),
  tipus = sapply(dades, class)
)
## # A tibble: 7 × 2
##   variable     tipus    
##   <chr>        <chr>    
## 1 month        character
## 2 avg_players  numeric  
## 3 gain         character
## 4 gain_percent numeric  
## 5 peak_players numeric  
## 6 name         character
## 7 steam_appid  numeric

5. Estadístiques descriptives

summary(dades)
##     month            avg_players            gain            gain_percent       
##  Length:612265      Min.   :0.000e+00   Length:612265      Min.   :     -1.00  
##  Class :character   1st Qu.:2.530e+00   Class :character   1st Qu.:     -0.17  
##  Mode  :character   Median :1.061e+01   Mode  :character   Median :     -0.02  
##                     Mean   :5.933e+02                      Mean   :     14.71  
##                     3rd Qu.:6.046e+01                      3rd Qu.:      0.15  
##                     Max.   :1.585e+06                      Max.   :1622960.34  
##   peak_players         name            steam_appid    
##  Min.   :      0   Length:612265      Min.   :    10  
##  1st Qu.:     10   Class :character   1st Qu.:221260  
##  Median :     32   Mode  :character   Median :336610  
##  Mean   :   1193                      Mean   :346922  
##  3rd Qu.:    162                      3rd Qu.:502800  
##  Max.   :3236027                      Max.   :802870

Les variables numèriques no mostren valors absurds. Els rangs són coherents amb dades d’ús de videojocs.

Hi pot haver valors negatius a gain i gain_percent, cosa normal en disminucions mensuals.

No s’observen valors perduts en les variables principals.

La variable month podria convertir-se a format data per facilitar anàlisi temporal.

6. Visualització inicial

Una gràfica que mostra l’evolució dels jugadors promig de Counter-Strike

dades <- read.csv("steamcharts.csv")
joc <- "Counter-Strike"
dades_joc <- dades[dades$name == joc, ]

plot(
  dades_joc$avg_players,
  type = "l",
  main = paste("Jugadors promig de", joc),
  xlab = "Mesos",
  ylab = "Jugadors promig"
)

7. Variables externes i dades addicionals

Per respondre millor preguntes sobre el comportament dels jugadors, podríem necessitar:

Dates oficials d’actualitzacions del joc.

Llançament de DLCs o esdeveniments especials.

Dades de vendes o preu del joc.

Competidors que es llancen el mateix mes.

Aquestes dades poden trobar-se:

A Steam Store (dates de llançament, DLCs), a pàgines oficials del joc, o a pàgines que recopilen aquest tipus de dades.

8. Altres comentaris

La variable month en format text pot ser ambigua si hi ha múltiples anys; convertir-la a date potser és el millor per fer anàlisis més complets.

També seria interessant estudiar correlacions entre avg_players, peak_players i variacions mensuals.