Email : valensius.jimy@student.matanauniversity.ac.id
RPubs : https://rpubs.com/valensiusjimy/
Jurusan : Statistika
Address : ARA Center, Matana University Tower
Jl. CBD Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten 15810.
Dalam pertemuan pertama pada mata kuliah Komputasi Statistika ini, kami sebagai mahasiswa diberikan tugas pertama oleh dosen pengajar kami untuk menjawab beberapa soal latihan mengenai distribusi peluang. Maka dari itu, tujuan dibuatnya projek kali ini adalah untuk memenuhi tugas tersebut dan sekiranya mendapat hasil yang maksimal. Lebih dari itu, harapannya lewat tugas ini juga dapat memberikan manfaat untuk pembaca.
Pada soal pertama ini berkaitan dengan distribusi Binomial, dimana soalnya adalah seperti berikut ini.
Misalkan terdapat 20 pertanyaan pilihan ganda dan setiap pertanyaan memiliki 5 kemungkinan jawaban dan hanya 1 dari mereka yang benar. Tentukan peluang memiliki 4 atau kurang jawaban yang benar jika seorang siswa mencoba setiap pertanyaan secara acak.
JAWAB
  Adapun peluang menjawab pertanyaan dengan benar adalah 1/5 atau 0.2
dbinom(4, size = 20, prob = 0.2)## [1] 0.2181994
Untuk menentukan peluang memiliki 4 atau kurang jawaban yang benar dengan acak, dapat kita gunakan fungsi dbinom dengan x = 0,...,4
dbinom(0, size = 20, prob = 0.2) +
+ dbinom(1, size = 20, prob = 0.2) +
+ dbinom(2, size = 20, prob = 0.2) +
+ dbinom(3, size = 20, prob = 0.2) +
+ dbinom(4, size = 20, prob = 0.2)## [1] 0.6296483
Dan untuk fungsi kumulatifnya dapat dibuat seperti berikut ini.
kumu <- pbinom(4, size = 20, prob = 0.2)
print(cat("Fungsi Kumulatif Peluangnya adalah :", kumu))## Fungsi Kumulatif Peluangnya adalah : 0.6296483NULL
VISUALISASI
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
data.frame(heads = 0:10,
pmf = dbinom(x = 0:10, size = 20, prob = 0.2),
cdf = pbinom(q = 0:10, size = 20, prob = 0.2,
lower.tail = TRUE)) %>%
mutate(Heads = ifelse(heads <= 4, "<=4", "lainnya")) %>%
ggplot(aes(x = factor(heads), y = cdf, fill = Heads)) +
geom_col() +
theme_minimal()+
geom_text(
aes(label = round(cdf,2), y = cdf + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0) +
labs(title = "Peluang dari X <= 4 Sukses",
subtitle = "b(20, .2)",
x = "Sukses(x)",
y = "Peluang") Untuk soal 2 dan soal 3 ini akan berkaitan dengan distribusi poisson dengan soal seperti berikut ini.
Jika ada 20 mobil yang melintasi jembatan per menit rata -rata, temukan kemungkinan memiliki 13 atau lebih mobil yang melintasi jembatan dalam satu menit tertentu.
JAWAB
Kita dapat menggunakan fungsi ppois untuk mencari peluang memiliki 12 atau kurang mobil yang melintasi jembatan pada menit tertentu.
pois <- ppois(12, lambda = 20)
print(cat("Peluang <= 12 adalah :", pois))## Peluang <= 12 adalah : 0.03901199NULL
Sedangkan untuk peluang memiliki 13 atau lebih mobil adalah sebagai berikut ini.
poiss <- ppois(12, lambda = 20, lower = FALSE)
print(cat("Peluang >= 13 adalah :", poiss))## Peluang >= 13 adalah : 0.960988NULL
Sehingga jika terdapat 20 mobil yang melintasi jembatan rata-rata per menit kemungkinannya terdapat 13 atau lebih mobil yang melintasi jembatan pada menit tertentu adalah 96%.
Misalkan probabilitas bahwa obat menghasilkan efek samping tertentu adalah p = 0,1% dan n = 1.000 pasien dalam uji klinis menerima obat. Berapa probabilitas 0 orang mengalami efek samping dengan menggunakan teknik visualisasi?
JAWAB
dpois(x = 0, lambda = 1000*0.001)## [1] 0.3678794
library(ggplot2)
library(dplyr)
options(scipen = 999, digits = 2)
n = 0:10
density = dpois(x=n, lambda = 1000*0.001)
probability = ppois(q = n ,lambda = 1000*0.001, lower.tail = TRUE )
df <- data.frame(n, density, probability)
ggplot(df, aes(x = n, y = density)) +
geom_col(fill = "lightblue") +
geom_text(
aes(label = round(density,2), y = density + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0,
color = "black"
)+
labs(title = "Poisson(1)",
subtitle = "PMF dan CDF of Poisson(1) distribution.",
x = "Events (x)",
y = "Density")+
geom_line (data=df, aes(x=n, y= probability), color="red") Selanjutnya pada soal terakhir ini akan berkaitan dengan distribusi peluang eksponensial.
Misalkan waktu checkout rata -rata dari kasir supermarket adalah tiga menit. Temukan probabilitas checkout pelanggan yang diselesaikan oleh kasir dalam waktu kurang dari dua menit.
JAWAB
mean <- 3
x <- 2
lambda <- 1/mean
prob <- 1- exp(-lambda * x)
prob## [1] 0.49
Jadi peluang checkout yang diselesaikan oleh kasir dalam waktu < 2 menit adalah 0.49
x <- seq(0, 10, by=0.1)
y <- dexp(x, rate=lambda)
plot(x, y, type="l", xlab="Waktu Checkout (Menit)", ylab="Density",
main="Distribusi Eksponensial dari Waktu Checkout", col = "red")