1. Pendahuluan
Sumber Data: Data yang digunakan dalam analisis ini
adalah “Steam Store Games (Clean dataset)” yang
bersumber dari situs Kaggle (diunggah oleh Nik Davis). Dataset ini
berisi rekapitulasi performa dan detail dari puluhan ribu game
PC yang didistribusikan melalui platform Steam.
Variabel yang Digunakan: Dalam laporan ini, fokus
analisis dibatasi pada 6 variabel utama yang mewakili metrik kategorik
dan numerik, yaitu:
- Platforms (Kategorik): Sistem operasi yang didukung
oleh game (misal: windows, mac, linux).
- Developer (Kategorik): Nama studio atau individu
yang mengembangkan game tersebut.
- Genres (Kategorik): Aliran atau jenis permainan
(misal: Action, Indie, RPG).
- Price (Numerik): Harga jual game di Steam
Store dalam mata uang USD (Dolar AS).
- Positive ratings (Numerik): Total jumlah ulasan
positif yang diberikan oleh pemain.
- Average playtime (Numerik): Rata-rata waktu yang
dihabiskan pemain di dalam game tersebut (dalam hitungan
menit).
2. Perhitungan Statistik Deskriptif
Berikut adalah ringkasan statistik untuk 3 variabel numerik dalam
dataset ini: Price, Positive Ratings,
dan Average Playtime.
Tabel Statistik Deskriptif Variabel Numerik
| Price ($) |
6.08 |
3.99 |
3.99 |
1.69 |
7.19 |
421.99 |
62.01 |
7.87 |
| Positive Ratings |
1000.56 |
24.00 |
1.00 |
6.00 |
126.00 |
2644404.00 |
360571655.81 |
18988.72 |
| Average Playtime (Mins) |
149.80 |
0.00 |
0.00 |
0.00 |
0.00 |
190625.00 |
3338068.37 |
1827.04 |
3. Sajian Grafik dan Interpretasi
B. Bar Chart: 10 Developer dengan Game Terbanyak (Kategorik)

Interpretasi:
- Statistik Deskriptif: Developer “Choice of Games”
dan “KOEI TECMO GAMES” mendominasi jumlah rilis game terbanyak
dibandingkan studio lainnya dalam top 10.
- Statistik Inferensia: Tingginya jumlah rilis ini
mengindikasikan bahwa model bisnis beberapa developer lebih berfokus
pada kuantitas rilis (seperti novel visual atau game berseri
berukuran kecil) dibanding merilis satu game raksasa dalam
jangka waktu lama (AAA games).
C. Histogram: Distribusi Harga Game (Numerik)

Interpretasi:
- Statistik Deskriptif: Frekuensi paling tinggi
menumpuk di harga $0 (Gratis/Free-to-Play) hingga $10. Jumlah game
menurun drastis seiring dengan mahalnya harga.
- Statistik Inferensia: Distribusi yang condong ke
kiri (positive skew) menunjukkan bahwa pasar Steam sangat sensitif
terhadap harga. Sebagian besar pengembang memilih bermain di harga
terjangkau untuk menarik volume pemain yang lebih besar.
D. Density Plot: Kepadatan Rata-rata Waktu Bermain (Numerik)

Interpretasi:
- Statistik Deskriptif: Puncak kepadatan waktu
bermain berada pada durasi yang sangat singkat (di bawah 200 menit atau
sekitar 3 jam). Kurva ini dengan jelas menunjukkan positive
skew . Hal ini berarti nilai rata-rata hitung (mean) lebih
besar daripada nilai tengah (median) akibat adanya sebagian kecil
game yang memiliki waktu bermain sangat ekstrem (ribuan jam) di
sisi kanan ekor kurva.
- Statistik Inferensia: Kesenjangan yang tinggi
antara median dan modus menunjukkan sebagian besar populasi
game ditamatkan atau ditinggalkan pemain dalam waktu singkat
bahkan ada banyak game yang tidak pernah dimainkan atau tidak
laku. Hanya ada sedikit game yang dimainkan oleh penggunanya
hingga ratusan/ribuan jam ( Winner Takes It All ).
E. Boxplot: Sebaran Harga berdasarkan Genre (Kategorik &
Numerik)

Interpretasi:
- Statistik Deskriptif: Garis tengah kotak (median)
menunjukkan bahwa genre “RPG” dan “Strategy” memiliki titik tengah harga
yang lebih tinggi dibandingkan genre “Indie” atau “Action”. Genre RPG
memiliki kotak IQR terluas, artinya terdapat banyak variasi harga di
antara game genre RPG.
- Statistik Inferensia: Distribusi data di dalam
boxplot ini juga mengalami positive skew, terlihat dari
jarak antara median ke batas kanan kotak (Q3) yang lebih lebar dibanding
jarak ke batas kiri (Q1), serta titik-titik hitam (outlier)
yang memanjang ke kanan. Ini membuktikan bahwa di semua genre, ada
segelintir game dengan harga premium yang mendobrak kebiasaan
penetapan harga standar di genrenya.