R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

Judul

Sampling Analisis terhadap Data Mahasiswa STK 57 dan mengechek apakah proses sampling binomial atau tidak

Permasalahan

  1. Hitunglah berapa % mhs STK 57 yang dari jabodetabek?
  2. Menyajikan mahasiswa nomor berapa yang terambil secara acak sebanyak 10 mahasiswa?
  3. Berapa % mahasiswa STK 57 yang dari jabodetabek setelah pengambilan sample di nomor 2?
  4. Seperti no.2, hanya saja mengambil secara acak sebanyak 30 mahasiswa, lalu hitung % mahasiswa stk 57 dari
    jabodetabek?
  5. Membuat kesimpulan dari hasil yang lebih bagus antara sample 10 dan sample 30?
  6. Apakah proses no.1 s/d no.5 termasuk binomial? Jelaskan apa fungsi peluangnya?

Install Packages

Sebelum melakukan analisis sebainya import library yang diperlukan namun jika library belum tersedia maka perlu melalukan prosedure install library tersebut dengan cara yang tertera dibawah

  1. jika hanya 1 library maka ikutin codes berikut -> install.packages(‘multcompView’)
  2. jika lebih dari 1 maka bisa dibikin list library yang ingin diinstal seperti berikut -> install.packages(c(“readxl”,“e1071”, “caret”, “doSNOW”, “ipred”, “ROCR”,“dplyr”,“tidyr”,“ggplot2”,“reshape2”))

Setelah melakukan install packages maka bisa melakukan import library yang dibutuhkan, dengan cara berikut:

library(multcompView)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)
library(ggplot2)
library(readxl)

Import data mahasiswa stk 57 yang ingin dijadikan sebagai sources analasis. ada beberapa cara import seperti yang ditunjukan di codes berikut:

setwd("C:/Users/ESISR/Downloads/S2 IPB/STA511 Analisis Statistika-20210815T135602Z-001/Week 01")
#df <- read.csv("datap1.csv", stringsAsFactors = FALSE)
#df <- read.delim('clipboard')
#df <- data.frame("Nama" = c("Rahmatin","Nur","Amalia"), "TInggi" = c(160,155,159))
df <- read_xlsx("datap1_tugas.xlsx",sheet = 'Sheet1')
print(head(df))
## # A tibble: 6 x 2
##     Mhs Asal 
##   <dbl> <chr>
## 1     1 N    
## 2     2 J    
## 3     3 J    
## 4     4 N    
## 5     5 J    
## 6     6 J

Data yang mahasiswa baru stk 57 memiliki 79 mahasiswa dengan 2 kolom yaitu nomor dan asal mahasiswa

print(paste(" Banyak Rows = ", dim(df)[1],'and Banyak Columns = ', dim(df)[2]))
## [1] " Banyak Rows =  79 and Banyak Columns =  2"

Nomor 1

test = data.frame(round(table(df$Asal)/nrow(df),2))

colnames(test) = c('Asal','Percentage')
table(df$Asal)
## 
##  J  N 
## 37 42
ggplot(test, aes(x = "", y = Percentage, fill = Asal)) + geom_col(color = "black") + 
  geom_label(aes(label = Percentage), position = position_stack(vjust = 0.5), show.legend = FALSE) +  
  coord_polar(theta = "y")

Berdasarkan pie chart diatas mahasiswa jabodetabek sebanyak 37 (47%) dari 79 Mahasiswa, sisanya sekitar 42 (53%) berasal dari luar jadbodetabek. Hal ini mengindikasikan bahwa jurusan stk tidak hanya dikenal dan diminati oleh jabodetabek, tetapi diminati dari luar jabodetabek.

Nomor 2

Setelah menghitung proporsi mahasiwa yang berasal jabodetabek, selanjutnya melakukan pengambilan sample pada data tersebut. Jumlah pengambilan sample bisa berapapun 10,20, dst. namun perlu diingat bahwa tujuan pengambilan sample ini untuk mendapatkan statistik untuk mempermudah dalam pendugaan parameter populasi, oleh karena itu dibutuhkanlah sample, dan juga perlu diingat bahwa menentukan jumlah sample tidak perlu sampai mendekati jumlah yang sebenernya karena akan memakan biaya waktu serta biaya lainnya.

Metode pengambilan sample ini bisa dibagi menjadi 2: 1) with replacement artinya baris dari suatu sample space bisa terambil kembali sebanyak n-sample 2) without replacement yaitu baris dari suatu sample space tidak bisa terambil kembali.

sebelum melakukan sampling terhadap data mhs stk 57, saya akan menunjukan ilustrasi perbedaan without replacement dan without replacement.

##Contoh : Sample space = [Bandung, Jakarta, Medan, Tangerang, Bogor] jumlah sample yang ingin diambil = 3

with replacement

Setiap pengambilan trials 1 - 3 dari sample space, setiap kota akan memiliki peluang terambil yang sama karena setiap kota yang terambil di trial ke-i akan dikembalikan lagi ke sample space untuk dipakai di trials ke-i+1. hal ini mengindikasikan bahwa proses pengambilan with replacement ini bisa dibilang binomial. seperti yang ditunjukan contoh berikut. percobaan 1: Sample space = [Bandung(0.20), Jakarta(0.20), Medan(0.20), Tangerang(0.20), Bogor(0.20)] trials-1 = Tangerang percobaan 2: Sample space = [Bandung(0.20), Jakarta(0.20), Medan(0.20), Tangerang(0.20), Bogor(0.20)] trials-2 = Bogor percobaan 3: Sample space = [Bandung(0.20), Jakarta(0.20), Medan(0.20), Tangerang(0.20), Bogor(0.20)] trials-3 = Tangerang

without replacement

berbeda denga with replacement, without replacement ini setiap triasl dari sample space, setiap kota akan memiliki peluang terambil yang berubah karena setiap kota yang terambil tidak dikembalikan lagi ke sample space. hal ini mengindikasikan juga proses sample ini bukan binomial akan dikembalikan lagi ke sample space untuk dipakai di trials ke-i+1. seperti yang ditunjukan contoh berikut. percobaan 1: Sample space = [Bandung(0.20), Jakarta(0.20), Medan(0.20), Tangerang(0.20), Bogor(0.20)] trials-1 = Jakarta percobaan 2: Sample space = [Bandung(0.25), Medan(0.25), Tangerang(0.25), Bogor(0.25)] trials-2 = Bogor percobaan 3: Sample space = [Bandung(0.33), Medan(0.33), Tangerang(0.33)] trials-3 = Tangerang

Berdasarkan penjelasan saya diatas, maka saya menggunakan 2 metode pengambilan sample yaitu with repalcement dan without replacement. Jumlah sample yang akan diambil akan dicoba mulai dari 10 mahasiswa. Hasilnya bisa dilihat sebagai berikut.

# ambil 10 sample with replacement indicates binomial
sample10_1_with_replacement <- df[sample(df$Mhs,size=10,replace = T),]
# ambil 10 sample without replacement indicates nonbinomial
sample10_1_without_replacement <- df[sample(df$Mhs,size=10,replace = F),]
#view table
print(sample10_1_with_replacement)
## # A tibble: 10 x 2
##      Mhs Asal 
##    <dbl> <chr>
##  1    46 N    
##  2    30 J    
##  3    32 J    
##  4    44 J    
##  5    50 J    
##  6    25 J    
##  7    58 J    
##  8    54 J    
##  9     7 N    
## 10    65 J
print(sample10_1_without_replacement)
## # A tibble: 10 x 2
##      Mhs Asal 
##    <dbl> <chr>
##  1    12 N    
##  2    50 J    
##  3    14 N    
##  4    35 J    
##  5    34 J    
##  6    23 N    
##  7    48 N    
##  8    44 J    
##  9    30 J    
## 10    67 N

Bisa dilhat dari hasil sample with replacement dan without replacement, terdapat 2 kesimpulan yang bisa diambil bahwa untuk metode sample with replacement ada 1 mhs stk 57 muncul 2 kali di sample sejumlah 10, sedangkan without replacement semua sample yang terambil unique artinya tidak ada mhs stk 57 yang muncul 2 kali.

Nomor 3

bagaimana proporsi mhs stk 57 asal jabodetabek setelah dilakukan sample with replacement and without replacement. Hasil proporsi akan disajikan melalui stacked bar chart berikut.

test10_with = data.frame(round(table(sample10_1_with_replacement$Asal)/nrow(sample10_1_with_replacement),2))
test10_without = data.frame(round(table(sample10_1_without_replacement$Asal)/nrow(sample10_1_without_replacement),2))
colnames(test10_with) = c('Asal','Percentage')
colnames(test10_without) = c('Asal','Percentage')
test10_with$group = c("G10_with","G10_with")
test10_without$group = c("G10_without","G10_without")
test$group = c("G","G")
#combine df
tgabung = rbind(test,test10_with)
tgabung = rbind(tgabung,test10_without)
# Stacked + percent
ggplot(tgabung, aes(fill=Asal, y=Percentage, x=group)) + geom_bar(position="fill", stat="identity") +
  geom_text(aes(y=c(1,0.50,1,0.3,1,0.4), label=Percentage), vjust=1.6, color="white", size=3.5)

Proporsi sample dari mahasiswa stk 57 asal jabodetabek berbeda dari populasi baik dengan with replacement maupun without replacement masing-masing proporsi mahasiwa jabodetabek untuk setiap metode adalah 40% with replacement dan 50% without replacement. Hal ini mungkin terjadi karena setiap mahasiwa tidak diambil dari suatu segmentasi tertentu, sehingga perbedaan proporsi antara sample dan populasi mungkin terjadi, namun selisih perbedaanya tidak begitu jauh. Hasil sample diatas hanya dilakukan 1 kali untuk setiap 10 sample, bagaimana kalo diulang sebanyak 100 kali lalu diambil average proportion apakah masih ada perbedaan atau tidak antara sample dan populasi.

j_var <- matrix(nrow = 10, ncol = 1)
j_freg <- matrix(nrow = 10, ncol = 1)
j_rep <- matrix(nrow = 10, ncol = 1)
n_var <- matrix(nrow = 10, ncol = 1)
n_freg <- matrix(nrow = 10, ncol = 1)
n_rep <- matrix(nrow = 10, ncol = 1)
for (i in 1:10)
{
new = data.frame(table(df[sample(df$Mhs,size=10,replace = T),]$Asal)/nrow(df[sample(df$Mhs,size=10,replace = T),]),'rep' = c(i,i))
j_var[i] = 'J'
j_freg[i] = new[new$Var1=='J',]$Freq
j_rep[i] = new[new$Var1=='J',]$rep
n_var[i] = 'N'
n_freg[i] = new[new$Var1=='N',]$Freq
n_rep[i] = new[new$Var1=='N',]$rep
}
test10_with_rep = data.frame('Asal' = rbind(j_var,n_var),'Freq' = rbind(j_freg,n_freg),'rep' = rbind(j_rep,n_rep))
test10_with_rep
##    Asal Freq rep
## 1     J  0.4   1
## 2     J  0.2   2
## 3     J  0.3   3
## 4     J  0.3   4
## 5     J  0.7   5
## 6     J  0.5   6
## 7     J  0.4   7
## 8     J  0.6   8
## 9     J  0.4   9
## 10    J  0.1  10
## 11    N  0.6   1
## 12    N  0.8   2
## 13    N  0.7   3
## 14    N  0.7   4
## 15    N  0.3   5
## 16    N  0.5   6
## 17    N  0.6   7
## 18    N  0.4   8
## 19    N  0.6   9
## 20    N  0.9  10
test10_with_reps = aggregate((test10_with_rep$Freq),list(test10_with_rep$Asal), mean)
colnames(test10_with_reps) = c('Asal','Percentage')
test10_with_reps
##   Asal Percentage
## 1    J       0.39
## 2    N       0.61
test10_with_reps$group = c("G10_with_10rep","G10_with_10rep")
tgabung = rbind(tgabung,test10_with_reps)

# ambil 10 sample  without replacement sebanyak 10 kali indicates binomial
j_var <- matrix(nrow = 10, ncol = 1)
j_freg <- matrix(nrow = 10, ncol = 1)
j_rep <- matrix(nrow = 10, ncol = 1)
n_var <- matrix(nrow = 10, ncol = 1)
n_freg <- matrix(nrow = 10, ncol = 1)
n_rep <- matrix(nrow = 10, ncol = 1)
for (i in 1:10)
{
new = data.frame(table(df[sample(df$Mhs,size=10,replace = F),]$Asal)/nrow(df[sample(df$Mhs,size=10,replace = F),]),'rep' = c(i,i))
j_var[i] = 'J'
j_freg[i] = new[new$Var1=='J',]$Freq
j_rep[i] = new[new$Var1=='J',]$rep
n_var[i] = 'N'
n_freg[i] = new[new$Var1=='N',]$Freq
n_rep[i] = new[new$Var1=='N',]$rep
}
test10_without_rep = data.frame('Asal' = rbind(j_var,n_var),'Freq' = rbind(j_freg,n_freg),'rep' = rbind(j_rep,n_rep))
test10_without_rep
##    Asal Freq rep
## 1     J  0.3   1
## 2     J  0.3   2
## 3     J  0.4   3
## 4     J  0.3   4
## 5     J  0.3   5
## 6     J  0.4   6
## 7     J  0.4   7
## 8     J  0.6   8
## 9     J  0.6   9
## 10    J  0.4  10
## 11    N  0.7   1
## 12    N  0.7   2
## 13    N  0.6   3
## 14    N  0.7   4
## 15    N  0.7   5
## 16    N  0.6   6
## 17    N  0.6   7
## 18    N  0.4   8
## 19    N  0.4   9
## 20    N  0.6  10
test10_without_reps = aggregate((test10_without_rep$Freq),list(test10_without_rep$Asal), mean)
colnames(test10_without_reps) = c('Asal','Percentage')
test10_without_reps
##   Asal Percentage
## 1    J        0.4
## 2    N        0.6
test10_without_reps$group = c("G10_without_10rep","G10_without_10rep")
tgabung = rbind(tgabung,test10_without_reps)
# Stacked + percent
tgabung
##    Asal Percentage             group
## 1     J       0.47                 G
## 2     N       0.53                 G
## 3     J       0.80          G10_with
## 4     N       0.20          G10_with
## 5     J       0.50       G10_without
## 6     N       0.50       G10_without
## 7     J       0.39    G10_with_10rep
## 8     N       0.61    G10_with_10rep
## 9     J       0.40 G10_without_10rep
## 10    N       0.60 G10_without_10rep
ggplot(tgabung, aes(fill=Asal, y=Percentage, x=group)) + geom_bar(position="fill", stat="identity") +
  geom_text(aes(y=c(1,0.3,1,0.3,1,0.3,1,0.3,1,0.3), label=Percentage), vjust=1.6, color="white", size=3.5)

Hasil stacked bar chart diatas menunjukan bahwa sample with replacement sebanyak 10 jika dilakukan sebanyak dan di rata-rata akan cenderung mendekati proporsi dari populasi, sehingga pengambilan sample tidak bisa dilakukan sekali untuk metode sample with replacement, sedangkan metode without replacement baik secara perulangan sebanyak 10 atau 1 kali hasilnya memang sudah tidak berbeda jauh dari proporsi aslinya, sehingga tidak perlu dilakukan perulangan sebanyak > 1 kali

Nomor 4

# ambil 30 sample with replacement indicates binomial
sample30_1_with_replacement <- df[sample(df$Mhs,size=30,replace = T),]
sample30_1_with_replacement
## # A tibble: 30 x 2
##      Mhs Asal 
##    <dbl> <chr>
##  1    79 N    
##  2    18 J    
##  3    76 N    
##  4    59 N    
##  5    24 N    
##  6    16 J    
##  7    68 N    
##  8    65 J    
##  9    33 N    
## 10    23 N    
## # ... with 20 more rows
# ambil 30 sample without replacement indicates nonbinomial
sample30_1_without_replacement <- df[sample(df$Mhs,size=30,replace = F),]
sample30_1_without_replacement
## # A tibble: 30 x 2
##      Mhs Asal 
##    <dbl> <chr>
##  1    31 N    
##  2    51 N    
##  3    30 J    
##  4    12 N    
##  5    79 N    
##  6     2 J    
##  7    78 J    
##  8    58 J    
##  9    46 N    
## 10    26 N    
## # ... with 20 more rows
# create data
test30_with = data.frame(round(table(sample30_1_with_replacement$Asal)/nrow(sample30_1_with_replacement),2))
test30_without = data.frame(round(table(sample30_1_without_replacement$Asal)/nrow(sample30_1_without_replacement),2))
colnames(test30_with) = c('Asal','Percentage')
colnames(test30_without) = c('Asal','Percentage')
test30_with$group = c("G30_with","G30_with")
test30_without$group = c("G30_without","G30_without")
#combine df
tgabung = rbind(tgabung,test30_with)
tgabung = rbind(tgabung,test30_without)

# ambil 30 sample  with replacement sebanyak 10 kali indicates binomial
j_var <- matrix(nrow = 10, ncol = 1)
j_freg <- matrix(nrow = 10, ncol = 1)
j_rep <- matrix(nrow = 10, ncol = 1)
n_var <- matrix(nrow = 10, ncol = 1)
n_freg <- matrix(nrow = 10, ncol = 1)
n_rep <- matrix(nrow = 10, ncol = 1)
for (i in 1:10)
{
new = data.frame(table(df[sample(df$Mhs,size=30,replace = T),]$Asal)/nrow(df[sample(df$Mhs,size=30,replace = T),]),'rep' = c(i,i))
j_var[i] = 'J'
j_freg[i] = new[new$Var1=='J',]$Freq
j_rep[i] = new[new$Var1=='J',]$rep
n_var[i] = 'N'
n_freg[i] = new[new$Var1=='N',]$Freq
n_rep[i] = new[new$Var1=='N',]$rep
}
test30_with_rep = data.frame('Asal' = rbind(j_var,n_var),'Freq' = rbind(j_freg,n_freg),'rep' = rbind(j_rep,n_rep))
test30_with_rep
##    Asal      Freq rep
## 1     J 0.3000000   1
## 2     J 0.6333333   2
## 3     J 0.4666667   3
## 4     J 0.6000000   4
## 5     J 0.4333333   5
## 6     J 0.4000000   6
## 7     J 0.3666667   7
## 8     J 0.4333333   8
## 9     J 0.2333333   9
## 10    J 0.6000000  10
## 11    N 0.7000000   1
## 12    N 0.3666667   2
## 13    N 0.5333333   3
## 14    N 0.4000000   4
## 15    N 0.5666667   5
## 16    N 0.6000000   6
## 17    N 0.6333333   7
## 18    N 0.5666667   8
## 19    N 0.7666667   9
## 20    N 0.4000000  10
test30_with_reps = aggregate((test30_with_rep$Freq),list(test30_with_rep$Asal), mean)
colnames(test30_with_reps) = c('Asal','Percentage')
test30_with_reps$Percentage = round(test30_with_reps$Percentage,2)
test30_with_reps$group = c("G30_with_10rep","G30_with_10rep")
tgabung = rbind(tgabung,test30_with_reps)

# ambil 30 sample  without replacement sebanyak 10 kali indicates binomial
j_var <- matrix(nrow = 10, ncol = 1)
j_freg <- matrix(nrow = 10, ncol = 1)
j_rep <- matrix(nrow = 10, ncol = 1)
n_var <- matrix(nrow = 10, ncol = 1)
n_freg <- matrix(nrow = 10, ncol = 1)
n_rep <- matrix(nrow = 10, ncol = 1)
for (i in 1:10)
{
new = data.frame(table(df[sample(df$Mhs,size=30,replace = F),]$Asal)/nrow(df[sample(df$Mhs,size=30,replace = F),]),'rep' = c(i,i))
j_var[i] = 'J'
j_freg[i] = new[new$Var1=='J',]$Freq
j_rep[i] = new[new$Var1=='J',]$rep
n_var[i] = 'N'
n_freg[i] = new[new$Var1=='N',]$Freq
n_rep[i] = new[new$Var1=='N',]$rep
}
test30_without_rep = data.frame('Asal' = rbind(j_var,n_var),'Freq' = rbind(j_freg,n_freg),'rep' = rbind(j_rep,n_rep))
test30_without_rep
##    Asal      Freq rep
## 1     J 0.3666667   1
## 2     J 0.3666667   2
## 3     J 0.4333333   3
## 4     J 0.5000000   4
## 5     J 0.4333333   5
## 6     J 0.4333333   6
## 7     J 0.3666667   7
## 8     J 0.3333333   8
## 9     J 0.4333333   9
## 10    J 0.4666667  10
## 11    N 0.6333333   1
## 12    N 0.6333333   2
## 13    N 0.5666667   3
## 14    N 0.5000000   4
## 15    N 0.5666667   5
## 16    N 0.5666667   6
## 17    N 0.6333333   7
## 18    N 0.6666667   8
## 19    N 0.5666667   9
## 20    N 0.5333333  10
test30_without_reps = aggregate((test30_without_rep$Freq),list(test30_without_rep$Asal), mean)
colnames(test30_without_reps) = c('Asal','Percentage')
test30_without_reps$Percentage = round(test30_without_reps$Percentage,2)
test30_without_reps
##   Asal Percentage
## 1    J       0.41
## 2    N       0.59
test30_without_reps$group = c("G30_without_10rep","G30_without_10rep")
tgabung = rbind(tgabung,test30_without_reps)
tgabung
##    Asal Percentage             group
## 1     J       0.47                 G
## 2     N       0.53                 G
## 3     J       0.80          G10_with
## 4     N       0.20          G10_with
## 5     J       0.50       G10_without
## 6     N       0.50       G10_without
## 7     J       0.39    G10_with_10rep
## 8     N       0.61    G10_with_10rep
## 9     J       0.40 G10_without_10rep
## 10    N       0.60 G10_without_10rep
## 11    J       0.43          G30_with
## 12    N       0.57          G30_with
## 13    J       0.57       G30_without
## 14    N       0.43       G30_without
## 15    J       0.45    G30_with_10rep
## 16    N       0.55    G30_with_10rep
## 17    J       0.41 G30_without_10rep
## 18    N       0.59 G30_without_10rep
# Stacked + percent
ggplot(tgabung, aes(fill=Asal, y=Percentage, x=group)) + geom_bar(position="fill", stat="identity") +
  geom_text(aes(y=c(1,0.3,1,0.3,1,0.3,1,0.3,1,0.3,1,0.4,1,0.4,1,0.4,1,0.4), label=Percentage), vjust=7.6, color="white", size=3.5)

Berdasarkan stacked bar plot diatas, % mhs stk 57 berasal dari jabodetabek dengan pengambilan sample 30 tentunya berbeda dengan popupasinya dan proporsi pengambilan 10 sample, namun demikian selisih antara sample terhadap populasi tidak begitu jauh kecuali pengambilan sampel sebanyak 10 yang dilakukan hanya sekali, mungkin bisa aja randoman yang pertama lagi dapat yang jelek oleh karena itu sebaiknya dilakukan perulangan sebanyak m kali.

Nomor 5

Dari total populasi data asal mahasiswa stk 57 sebanyak 79 untuk membuat kesimpulan lebih baik mengambil kesimpulan dari hasil sample 10 atau 30. Dari sini bisa dilihat dari berbagai aspek, namun yang akan saya sampaikan cuman 2. Pertama, semakin banyak sample yang bisa diperoleh akan semakin baik karena hasilnya kemungkinan akan mendekati nilai sebenernya. Namun ketika di suatu perusahaan ada variable lain yang harus diperhatikan yaitu biaya karena semakin banyak sample yang dibutuh akan semakin besar pula biaya yang dikeluarkan. Kedua, kalo dari study case diatas menurut saya kesimpulan no.4 atau hasil pengambilan sample 30 masih bagus karena dari segi jumlah juga tidak terlalu banyak artinya tidak akan memakan biaya, dan juga lebih mendekati ke nilai sebenernya.

Nomor 6

Dari hasil proses sampling 10, 30 serta dilakukan perulangan sebanyak 10 kali dengan 2 metode yaiut with replacement dan without replacement. Bisa disimpulkan bahwa metode sample withour replacement merupakan proses non-binomial sepertinya yang sudah dijelaskan di no.2 karena setiap pengambilan dari trial 1 ke trial lainnya, peluang setiap anggota sample space akan berbeda setiap trailnya, sedangkan with replacement merupakan proses binomial karena setiap trial 1 ke trial lainnya sampai ke n, anggota sample space akan memilikan peluang yang sama setiap trail-nya.

Fungsi peluang Binomial dari with replacement :

p = proporsi J = 0.47 q = 1-p = proporsi N = 0.53

Fungsi peluang binomial pada saat n-sample = 10:

P(x) = (10!/(x!(10-x)!)) (p^x) ((1-p)^(10-x))

P(x) = (10!/(x!(10-x)!)) (0.47^x) ((1-0.47)^(10-x))

Fungsi peluang binomial pada saat n-sample = 30:

P(x) = (30!/(x!(30-x)!)) (p^x) ((1-p)^(30-x))

P(x) = (30!/(x!(30-x)!)) (0.47^x) ((1-0.47)^(30-x))