Aquest conjunt de dades prové de SteamCharts, una plataforma que recopila informació històrica de jugadors actius a la plataforma Steam per a cada videojoc.
L’objectiu del projecte és analitzar l’evolució mensual de jugadors d’un o més videojocs de Steam per comprendre millor les tendències d’ús, els pics d’activitat i les fluctuacions en nombre de jugadors.
La pregunta principal que volem respondre és:
Com ha evolucionat l’activitat dels jugadors d’un videojoc al llarg del temps i quins factors poden explicar els canvis mensuals observats?
Aquestes dades son adequades perque disposen d’una evolució temporal coherent amb mitjanes de jugadors, màxims i percentatges de variació per diferents jocs de la plataforma, aixi que es poden comparar les dades d’un videojoc amb un altre, i extreure informació interessant.
Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.
dades <- read_csv("steamcharts.csv")
## Rows: 612265 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): month, gain, name
## dbl (4): avg_players, gain_percent, peak_players, steam_appid
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
El format original del fitxer és csv, un format tabular senzill d’importar i treballar. No s’ha fet cap modificació prèvia rellevant més enllà de l’exportació des d’un .RData original. Les columnes tenen noms clars i no ha calgut reanomenar-les.
dim(dades)
## [1] 612265 7
glimpse(dades)
## Rows: 612,265
## Columns: 7
## $ month <chr> "Sep-25", "Aug-25", "Jul-25", "Jun-25", "May-25", "Apr-25…
## $ avg_players <dbl> 7805.25, 6922.13, 7371.48, 8204.98, 9052.51, 9523.82, 103…
## $ gain <chr> "883.12", "-449.35", "-833.5", "-847.53", "-471.31", "-84…
## $ gain_percent <dbl> 0.1276, -0.0610, -0.1016, -0.0936, -0.0495, -0.0819, -0.1…
## $ peak_players <dbl> 13254, 12168, 13951, 15798, 15333, 17727, 18180, 18934, 2…
## $ name <chr> "Counter-Strike", "Counter-Strike", "Counter-Strike", "Co…
## $ steam_appid <dbl> 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 1…
Nombre de files: correspon al nombre de mesos registrats per videojoc.
Nombre de columnes: 7 variables.
La unitat d’anàlisi és el registre mensual d’un videojoc concret, identificat per steam_appid.
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| month | caràcter | Mes i any del registre (format “Feb-20”) | Un mes per fila |
| avg_players | numèrica | Mitjana de jugadors actius durant el mes | Depèn del joc (p.ex. 0–100k) |
| gain | numèrica | Increment absolut respecte del mes anterior | Pot ser positiu o negatiu |
| gain_percent | numèrica | Variació percentual del mes | Habitualment entre -1 i 1 |
| peak_players | numèrica | Nombre màxim de jugadors simultanis en el mes | Rang variable segons popularitat |
| name | caràcter | Nom del videojoc | P.ex. “Counter-Strike” |
| steam_appid | numèrica | Identificador de Steam | Enter positiu |
tibble(
variable = names(dades),
tipus = sapply(dades, class)
)
## # A tibble: 7 × 2
## variable tipus
## <chr> <chr>
## 1 month character
## 2 avg_players numeric
## 3 gain character
## 4 gain_percent numeric
## 5 peak_players numeric
## 6 name character
## 7 steam_appid numeric
summary(dades)
## month avg_players gain gain_percent
## Length:612265 Min. :0.000e+00 Length:612265 Min. : -1.00
## Class :character 1st Qu.:2.530e+00 Class :character 1st Qu.: -0.17
## Mode :character Median :1.061e+01 Mode :character Median : -0.02
## Mean :5.933e+02 Mean : 14.71
## 3rd Qu.:6.046e+01 3rd Qu.: 0.15
## Max. :1.585e+06 Max. :1622960.34
## peak_players name steam_appid
## Min. : 0 Length:612265 Min. : 10
## 1st Qu.: 10 Class :character 1st Qu.:221260
## Median : 32 Mode :character Median :336610
## Mean : 1193 Mean :346922
## 3rd Qu.: 162 3rd Qu.:502800
## Max. :3236027 Max. :802870
Les variables numèriques no mostren valors absurds. Els rangs són coherents amb dades d’ús de videojocs.
Hi pot haver valors negatius a gain i gain_percent, cosa normal en disminucions mensuals.
No s’observen valors perduts en les variables principals.
La variable month podria convertir-se a format data per facilitar anàlisi temporal.
Una gràfica que mostra l’evolució dels jugadors promig de Counter-Strike
dades <- read.csv("steamcharts.csv")
joc <- "Counter-Strike"
dades_joc <- dades[dades$name == joc, ]
plot(
dades_joc$avg_players,
type = "l",
main = paste("Jugadors promig de", joc),
xlab = "Mesos",
ylab = "Jugadors promig"
)
Per respondre millor preguntes sobre el comportament dels jugadors, podríem necessitar:
Dates oficials d’actualitzacions del joc.
Llançament de DLCs o esdeveniments especials.
Dades de vendes o preu del joc.
Competidors que es llancen el mateix mes.
Aquestes dades poden trobar-se:
A Steam Store (dates de llançament, DLCs), a pàgines oficials del joc, o a pàgines que recopilen aquest tipus de dades.
La variable month en format text pot ser ambigua si hi ha múltiples anys; convertir-la a date potser és el millor per fer anàlisis més complets.
També seria interessant estudiar correlacions entre avg_players, peak_players i variacions mensuals.