Simulasi Variabel Random

Tujuan:

  1. Memahami konsep variabel random diskrit dan kontinu.
  2. Mampu melakukan simulasi menggunakan distribusi probabilitas pada penggunaan Software R.
  3. Menerapkan simulasi pada studi kasus kehidupan sehari-hari dengan dukungan data penelitian terdahulu.
  4. Menginterpretasikan hasil simulasi secara statistik

SIMULASI DISTRIBUSI DASAR

Simulasi Variabel Random oleh Ratna Nur Mustika Sanusi (2025), variabel random dibagi menjadi dua jenis:

  1. Variabel Random Diskrit: Variabel yang hanya dapat mengambil nilai-nilai tertentu (biasanya bilangan bulat). Contoh: jumlah pelanggan yang datang ke restoran dalam sehari.
  2. Variabel Random Kontinu: Variabel yang dapat mengambil nilai apa pun dalam suatu interval. Contoh: tinggi badan seseorang, pendapatan bulanan.

Distribusi yang akan digunakan dalam simulasi ini:

  1. Poisson (Diskrit): Untuk memodelkan jumlah kejadian langka dalam interval waktu atau ruang.
  2. Normal (Kontinu): Untuk memodelkan variabel kontinu yang berbentuk lonceng.

STUDI KASUS DISTRIBUSI DISKRIT-POISSON

Deskripsi Studi Kasus Studi kasus ini mengadaptasi penelitian dari Septiany et al. (2020) yang berjudul “The Use of Monte Carlo Method to Model the Aggregate Loss Distribution”. Penelitian ini memodelkan frekuensi klaim asuransi kesehatan menggunakan distribusi Poisson dan variannya untuk menentukan cadangan dana yang harus disiapkan perusahaan asuransi.

Tujuan Simulasi:

  1. Mensimulasikan jumlah klaim asuransi kesehatan per hari.
  2. Menghitung probabilitas jumlah klaim melebihi kapasitas.
  3. Menentukan cadangan dana berdasarkan Value at Risk (VaR).
# ============================================
# SIMULASI DISTRIBUSI POISSON - KLAIM ASURANSI
# ============================================

set.seed(123)

# Parameter berdasarkan penelitian Septiany et al. (2020)
n_hari <- 30                # Simulasi 30 hari
lambda_klaim <- 5           # Rata-rata klaim per hari

# Simulasi 30 variabel random dari distribusi Poisson
klaim_data <- rpois(n_hari, lambda = lambda_klaim)

# Tampilkan data
klaim_data
##  [1]  4  7  4  8  9  2  5  8  5  5  9  5  6  5  2  8  3  2  4  9  8  6  6 11  6
## [26]  6  5  5  4  3
summary(klaim_data)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.000   4.000   5.000   5.667   7.750  11.000
# Total Klaim dalam 30 Hari
total_klaim <- sum(klaim_data)
total_klaim
## [1] 170
# Probabilitas tidak ada klaim dalam sehari
prob_zero <- sum(klaim_data == 0 ) / n_hari
prob_zero
## [1] 0
# Probabilitas > 7 per hari klaim dalam sehari
prob_above_7 <- sum(klaim_data > 0 ) / n_hari
prob_above_7
## [1] 1
# Hari dengan klaim maksimum
max_klaim <- max(klaim_data)
max_klaim
## [1] 11

Kesimpulan

Interpretasi Output Data Klaim

Berdasarkan hasil simulasi distribusi Poisson untuk jumlah klaim asuransi kesehatan selama 30 hari, diperoleh data yang bervariasi antara 2 hingga 11 klaim per hari. Nilai minimum 2 klaim menunjukkan bahwa bahkan pada hari dengan klaim terendah, tetap ada pengajuan klaim yang masuk. Nilai maksimum 11 klaim menunjukkan adanya hari dengan beban klaim yang cukup tinggi. Rata-rata klaim per hari adalah 5.667 klaim, yang mendekati parameter lambda yang ditetapkan (5 klaim per hari), mengindikasikan bahwa simulasi berhasil merepresentasikan distribusi populasi dengan baik. Total klaim selama 30 hari adalah 170 klaim, yang memberikan gambaran tentang volume klaim yang harus dikelola perusahaan asuransi dalam periode tersebut.

Interpretasi Probabilitas

Probabilitas tidak ada klaim dalam sehari bernilai 0, yang berarti dalam periode simulasi 30 hari ini, tidak ada satupun hari tanpa klaim. Hal ini konsisten dengan karakteristik distribusi Poisson dimana kejadian klaim asuransi kesehatan cenderung terjadi setiap hari. Probabilitas klaim lebih dari 7 per hari bernilai 1 (100%), yang menunjukkan bahwa seluruh hari dalam simulasi memiliki klaim. Hari dengan klaim maksimum tercatat sebanyak 11 klaim, yang dapat dijadikan acuan untuk menentukan kapasitas maksimal layanan klaim yang harus disiapkan perusahaan asuransi. Histogram frekuensi klaim menunjukkan distribusi yang mendekati bentuk Poisson dengan sebagian besar klaim terkonsentrasi di sekitar nilai rata-rata.

# Histogram frekuensi klaim
hist(klaim_data, breaks = 10, 
     main = "Histogram Frekuensi Klaim per Hari",
     xlab = "Jumlah Klaim", 
     col = "lightgreen")

STUDI KASUS DISTRIBUSI KONTINU-NORMAL

Deskripsi Studi Kasus Studi kasus ini mengadaptasi penelitian dari Ritonga et al. (2025) yang berjudul “Penerapan Distribusi Normal Dalam Pengukuran Tinggi Badan Mahasiswa FMIPA Universitas Negeri Medan 2024”. Penelitian ini menerapkan distribusi normal untuk menganalisis data tinggi badan mahasiswa.

Tujuan Simulasi:

  1. Mensimulasikan tinggi badan 100 mahasiswa dengan distribusi normal.
  2. Menghitung rata-rata tinggi badan.
  3. Menghitung probabilitas mahasiswa dengan tinggi badan tertentu.
# ============================================
# SIMULASI DISTRIBUSI NORMAL - TINGGI BADAN
# ============================================

set.seed(123)

# Parameter simulasi
n <- 100              # Jumlah mahasiswa
mean_tb <- 161.4      # Rata-rata tinggi badan (cm)
sd_tb <- 8.79         # Standar deviasi (cm)

# Simulasi 100 variabel random dari distribusi normal
tb_data <- rnorm(n, mean = mean_tb, sd = sd_tb)
tb_data
##   [1] 156.4734 159.3767 175.1010 162.0198 162.5364 176.4754 165.4515 150.2801
##   [9] 155.3626 157.4826 172.1597 164.5628 164.9228 162.3729 156.5142 177.1070
##  [17] 165.7761 144.1134 167.5649 157.2442 152.0138 159.4840 152.3814 154.9930
##  [25] 155.9059 146.5740 168.7641 162.7481 151.3958 172.4210 165.1486 158.8063
##  [33] 169.2682 169.1188 168.6217 167.4531 166.2689 160.8558 158.7106 158.0557
##  [41] 155.2935 159.5724 150.2772 180.4651 172.0180 151.5279 157.8586 157.2981
##  [49] 168.2559 160.6672 163.6267 161.1491 161.0232 173.4300 159.4155 174.7298
##  [57] 147.7865 166.5388 162.4887 163.2981 164.7370 156.9846 158.4711 152.4467
##  [65] 151.9790 164.0680 165.3398 161.8659 169.5067 179.4202 157.0838 141.1024
##  [73] 170.2404 155.1661 155.3524 170.4148 158.8968 150.6699 162.9937 160.1791
##  [81] 161.4507 164.7866 158.1419 167.0641 159.4619 164.3164 171.0412 165.2252
##  [89] 158.5351 171.4980 170.1329 166.2204 163.4985 155.8807 173.3601 156.1237
##  [97] 180.6267 174.8716 159.3282 152.3778
summary(tb_data)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   141.1   157.1   161.9   162.2   167.5   180.6
# Standar Deviasi simulasi
sd_simulated <- sd(tb_data)
sd_simulated
## [1] 8.023652
# Probabilitas tinggi badan <= 160 cm
prob_below_160 <- sum(tb_data <= 160) / n
prob_below_160
## [1] 0.43
# Probabilitas tinggi badan >= 161 cm
prob_above_161 <- sum(tb_data >= 161) / n
prob_above_161
## [1] 0.54

Kesimpulan

Interpretasi Output Data Tinggi Badan

Berdasarkan hasil simulasi distribusi normal untuk tinggi badan 100 mahasiswa, diperoleh data yang bervariasi antara 141.1 cm hingga 180.6 cm. Nilai minimum 141.1 cm menunjukkan mahasiswa dengan tinggi badan terpendek dalam sampel simulasi, sedangkan nilai maksimum 180.6 cm menunjukkan mahasiswa dengan tinggi badan tertinggi. Rata-rata tinggi badan simulasi adalah 162.2 cm, yang sangat mendekati parameter mean yang ditetapkan (161.4 cm), mengvalidasi bahwa simulasi berhasil merepresentasikan distribusi populasi mahasiswa dengan baik. Standar deviasi simulasi adalah 8.02 cm, yang mendekati parameter SD populasi (8.79 cm), mengindikasikan sebaran data yang konsisten dan realistis.

Interpretasi Probabilitas Tinggi Badan

Probabilitas tinggi badan kurang dari atau sama dengan 160 cm adalah 0.43 (43%), yang berarti sebanyak 43% mahasiswa dalam simulasi memiliki tinggi badan 160 cm atau kurang. Ini menunjukkan proporsi mahasiswa dengan kategori tinggi badan sedang hingga pendek. Probabilitas tinggi badan lebih dari atau sama dengan 161 cm adalah 0.54 (54%), yang berarti sebanyak 54% mahasiswa memiliki tinggi badan 161 cm atau lebih. Kedua probabilitas ini saling melengkapi dan menunjukkan distribusi yang hampir seimbang di sekitar nilai median 161.9 cm. Histogram distribusi normal menunjukkan bentuk lonceng yang khas, dengan sebagian besar data terkonsentrasi di sekitar nilai rata-rata, sesuai dengan karakteristik distribusi normal.

# Histogram
hist(tb_data, breaks = 15, 
     main = "Histogram Distribusi Normal - Tinggi Badan",
     xlab = "Tinggi Badan (cm)", 
     col = "lightblue")

STUDI KASUS DISTRIBUSI BINOMIAL

Deskripsi Studi Kasus Studi kasus ini membahas simulasi jumlah produk cacat dari total produk yang diproduksi menggunakan distribusi binomial. Dalam industri manufaktur, kontrol kualitas sangat penting untuk memastikan produk memenuhi standar.

Tujuan Simulasi:

1.Mensimulasikan jumlah produk cacat selama 30 hari produksi. 2. Menghitung rata-rata produk cacat per hari. 3. Menghitung probabilitas produk cacat melebihi target kualitas.

# ============================================
# SIMULASI DISTRIBUSI BINOMIAL - PRODUK CACAT
# ============================================

set.seed(123)

# Parameter simulasi
n_hari <- 30                # Simulasi 30 hari
n_produk <- 2000            # Produk yang diproduksi per hari
p_cacat <- 0.05             # Probabilitas produk cacat (5%)


produk_cacat <- rbinom(n_hari, size = n_produk, prob = p_cacat)
produk_cacat
##  [1]  95  98 101  83 122  96  88 107  94 107 107 118  92 104 106  97 107 102  99
## [20]  93  94 108  84  91  77  94 107 107  99 111
summary(produk_cacat)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    77.0    94.0    99.0    99.6   107.0   122.0
# Total produk cacat dalam 30 hari
total_cacat <- sum(produk_cacat)
total_cacat
## [1] 2988
# Probabilitas tidak ada produk cacat
prob_zero <- sum(produk_cacat == 0 ) / n_hari
prob_zero
## [1] 0
# Probabilitas produk cacat > 100
prob_above_100 <- sum(produk_cacat > 100 ) / n_hari
prob_above_100
## [1] 0.4666667
# Produk cacat maksimum dalam 30 hari 
max_cacat <- max(produk_cacat)
max_cacat
## [1] 122

Kesimpulan

Interpretasi Output Data Produk Cacat

Berdasarkan hasil simulasi distribusi binomial untuk jumlah produk cacat selama 30 hari produksi, diperoleh data yang bervariasi antara 77 hingga 122 produk cacat per hari. Nilai minimum 77 produk cacat menunjukkan hari dengan kualitas produksi terbaik dalam periode simulasi, sedangkan nilai maksimum 122 produk cacat menunjukkan hari dengan kualitas produksi terburuk. Rata-rata produk cacat per hari adalah 99.6 produk, yang mendekati nilai harapan teoritis (n × p = 2000 × 0.05 = 100 produk), mengvalidasi bahwa simulasi berhasil merepresentasikan distribusi populasi dengan akurat. Total produk cacat selama 30 hari adalah 2988 produk, yang memberikan gambaran tentang volume produk cacat yang harus dikelola perusahaan manufaktur dalam periode tersebut.

Interpretasi Probabilitas dan Kontrol Kualitas

Probabilitas tidak ada produk cacat bernilai 0, yang berarti dalam periode simulasi 30 hari ini, tidak ada satupun hari produksi tanpa produk cacat. Hal ini realistis karena dalam proses manufaktur skala besar, hampir mustahil menghasilkan produk tanpa cacat sama sekali. Probabilitas produk cacat lebih dari 100 per hari adalah 0.467 (46.7%), yang berarti hampir separuh hari produksi memiliki produk cacat melebihi target kualitas (100 produk). Produk cacat maksimum dalam 30 hari tercatat sebanyak 122 produk, yang dapat dijadikan acuan untuk menentukan batas toleransi cacat maksimal yang dapat diterima. Histogram produk cacat menunjukkan distribusi yang mendekati bentuk binomial dengan sebagian besar data terkonsentrasi di sekitar nilai rata-rata 100 produk cacat per hari.

# Histogram
hist(produk_cacat, breaks = 10, 
     main = "Histogram Produk Cacat per Hari",
     xlab = "Jumlah Produk Cacat", 
     col = "lightgreen")

KESIMPULAN UMUM SIMULASI

Ketiga studi kasus simulasi variabel random ini menunjukkan bahwa software R dapat digunakan secara efektif untuk memodelkan fenomena acak dalam berbagai konteks kehidupan sehari-hari. Distribusi Poisson cocok untuk memodelkan kejadian langka seperti klaim asuransi, distribusi Normal cocok untuk memodelkan karakteristik biologis seperti tinggi badan, dan distribusi Binomial cocok untuk memodelkan keberhasilan/kegagalan dalam proses produksi. Hasil simulasi dari ketiga distribusi ini dapat digunakan sebagai dasar pengambilan keputusan dalam manajemen risiko, kontrol kualitas, dan perencanaan kapasitas layanan.