Binomial Distribution

Distribusi binomial adalah distribusi yang menggambarkan jumlah sukses dalam n percobaan independen dengan probabilitas sukses p

set.seed(1)
n = 123456
nTrial = 50
pSukses = 0.4
binomData = rbinom(n, size = nTrial, prob = pSukses)

hist(binomData, breaks = 10, 
     main="Histogram Distribusi Binomial", 
     xlab = 'Jumlah Sukses', 
     col='blue')

Disini saya mencoba untuk melakukan 123456x eksperimen dengan tiap eksperimen berisi 50 percobaan dan probabilitas sukses di tiap percobaan adalah 0.4. Dengan demikian, expected value dari mean tiap percobaan adalah 20, maka seharusnya data akan memusat di angka 20, dan benar seperti apa yang ditunjukkan oleh histogram.

Normal Distribution

Distribusi normal adalah distribusi kontinu yang berbentuk lonceng, dengan mean mu dan standar deviasi sigma.

kingMU <- 17 # Biasakan gunakan KING untuk MU
sigmaBoy <- 1.945
normData <- rnorm(n, mean = kingMU, sd = sigmaBoy)

hist(normData, breaks = 10, 
     main = "Histogram Distribusi Normal",
     xlab = "Nilai", 
     col = "lightpink")

Karena sebelumnya kita sudah set ā€œnā€, maka n tidak perlu dideklarasikan ulang, dan pada distribusi ini, terlihat bentuknya simetris antara ruas kanan dan kiri, hal ini dikarenakan kita mendeklarasikan sigma (sebaran data) secara eksplisit.

Study Kasus

Skor IPK mahasiswa SSD

set.seed(1312)

n = 204
meanI = 3.0
sdI = 0.4

ipk = rnorm(n, mean = meanI, sd = sdI)

ipk[ipk < 0] = 0
ipk[ipk > 4] = 4

summary(ipk)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.555   2.723   2.960   2.970   3.206   4.000
hist(ipk,
     breaks = 10,
     main = "Histogram Simulasi IPK Mahasiswa",
     xlab = "IPK",
     col = "skyblue")

Di sini kita mencoba untuk mensimulasikan skor IPK mahasiswa SSD dengan total N = 204 dan mean 3, pada baris kedua, kita memberikan batas jika hasil simulasi mengeluarkan nilai kurang dari 0, maka akan dibulatkan menjadi 0, jika lebih dari 4 maka akan dibulatkan menjadi 4.