1. Pendahuluan

Sumber Data: Data yang digunakan dalam analisis ini adalah “Steam Store Games (Clean dataset)” yang bersumber dari situs Kaggle (diunggah oleh Nik Davis). Dataset ini berisi rekapitulasi performa dan detail dari puluhan ribu game PC yang didistribusikan melalui platform Steam.

Variabel yang Digunakan: Dalam laporan ini, fokus analisis dibatasi pada 6 variabel utama yang mewakili metrik kategorik dan numerik, yaitu:

  1. Platforms (Kategorik): Sistem operasi yang didukung oleh game (misal: windows, mac, linux).
  2. Developer (Kategorik): Nama studio atau individu yang mengembangkan game tersebut.
  3. Genres (Kategorik): Aliran atau jenis permainan (misal: Action, Indie, RPG).
  4. Price (Numerik): Harga jual game di Steam Store dalam mata uang USD (Dolar AS).
  5. Positive ratings (Numerik): Total jumlah ulasan positif yang diberikan oleh pemain.
  6. Average playtime (Numerik): Rata-rata waktu yang dihabiskan pemain di dalam game tersebut (dalam hitungan menit).

2. Perhitungan Statistik Deskriptif

Berikut adalah ringkasan statistik untuk 3 variabel numerik dalam dataset ini: Price, Positive Ratings, dan Average Playtime.

Tabel Statistik Deskriptif Variabel Numerik
Variabel Mean Median Modus Q1 Q3 Range Varians Std_Dev
Price ($) 6.08 3.99 3.99 1.69 7.19 421.99 62.01 7.87
Positive Ratings 1000.56 24.00 1.00 6.00 126.00 2644404.00 360571655.81 18988.72
Average Playtime (Mins) 149.80 0.00 0.00 0.00 0.00 190625.00 3338068.37 1827.04

3. Sajian Grafik dan Interpretasi

A. Pie Chart: Distribusi Platform (Kategorik)

Interpretasi:

  • Statistik Deskriptif: Berdasarkan grafik, mayoritas game di Steam (sekitar 68%) eksklusif hanya untuk platform Windows, diikuti oleh kombinasi platform (Windows;Mac;Linux) dan (Windows;Mac).
  • Statistik Inferensia: Berdasarkan data ini, kita dapat menyimpulkan bahwa pengembang cenderung memprioritaskan Windows karena memiliki pangsa pasar terbesar. Proporsi platform multi-OS yang kecil mengindikasikan bahwa pengembangan cross-platform masih menjadi tantangan teknis dan biaya.

B. Bar Chart: 10 Developer dengan Game Terbanyak (Kategorik)

Interpretasi:

  • Statistik Deskriptif: Developer “Choice of Games” dan “KOEI TECMO GAMES” mendominasi jumlah rilis game terbanyak dibandingkan studio lainnya dalam top 10.
  • Statistik Inferensia: Tingginya jumlah rilis ini mengindikasikan bahwa model bisnis beberapa developer lebih berfokus pada kuantitas rilis (seperti novel visual atau game berseri berukuran kecil) dibanding merilis satu game raksasa dalam jangka waktu lama (AAA games).

C. Histogram: Distribusi Harga Game (Numerik)

Interpretasi:

  • Statistik Deskriptif: Frekuensi paling tinggi menumpuk di harga $0 (Gratis/Free-to-Play) hingga $10. Jumlah game menurun drastis seiring dengan mahalnya harga.
  • Statistik Inferensia: Distribusi yang condong ke kiri (positive skew) menunjukkan bahwa pasar Steam sangat sensitif terhadap harga. Sebagian besar pengembang memilih bermain di harga terjangkau untuk menarik volume pemain yang lebih besar.

D. Density Plot: Kepadatan Rata-rata Waktu Bermain (Numerik)

Interpretasi:

  • Statistik Deskriptif: Puncak kepadatan waktu bermain berada pada durasi yang sangat singkat (di bawah 200 menit atau sekitar 3 jam). Kurva ini dengan jelas menunjukkan positive skew . Hal ini berarti nilai rata-rata hitung (mean) lebih besar daripada nilai tengah (median) akibat adanya sebagian kecil game yang memiliki waktu bermain sangat ekstrem (ribuan jam) di sisi kanan ekor kurva.
  • Statistik Inferensia: Kesenjangan yang tinggi antara median dan modus menunjukkan sebagian besar populasi game ditamatkan atau ditinggalkan pemain dalam waktu singkat bahkan ada banyak game yang tidak pernah dimainkan atau tidak laku. Hanya ada sedikit game yang dimainkan oleh penggunanya hingga ratusan/ribuan jam ( Winner Takes It All ).

E. Boxplot: Sebaran Harga berdasarkan Genre (Kategorik & Numerik)

Interpretasi:

  • Statistik Deskriptif: Garis tengah kotak (median) menunjukkan bahwa genre “RPG” dan “Strategy” memiliki titik tengah harga yang lebih tinggi dibandingkan genre “Indie” atau “Action”. Genre RPG memiliki kotak IQR terluas, artinya terdapat banyak variasi harga di antara game genre RPG.
  • Statistik Inferensia: Distribusi data di dalam boxplot ini juga mengalami positive skew, terlihat dari jarak antara median ke batas kanan kotak (Q3) yang lebih lebar dibanding jarak ke batas kiri (Q1), serta titik-titik hitam (outlier) yang memanjang ke kanan. Ini membuktikan bahwa di semua genre, ada segelintir game dengan harga premium yang mendobrak kebiasaan penetapan harga standar di genrenya.