Deksripsi data kategorik dapat menggunakan tabel maupun grafik. Sebagai contoh deskripsi dengan tabel dapat menggunakan tabel kontingensi dan tabel proporsi. Sedangkan contoh deskripsi dengan grafik dapat menggunakan The Grouped Dot Chart, Mosaic Chart dan lain sebagainya.
Suatu survei dilakukan terhadap pengguna dan bukan pengguna jasa-jasa keuangan. Berikut ini tersaji tabulasi silang antara pekerjaan responden dengan skor tingkat kemampuannya dalam pengelolaan keuangan. Bagaimanakah hubungan antar kedua peubah ini?
survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),ncol=5,nrow=3,
byrow=FALSE,dimnames=list(c("Rendah","Sedang","Tinggi"),
c("Pertanian","PNS","Business owner","Profesional","Lainnya")))
survei
## Pertanian PNS Business owner Profesional Lainnya
## Rendah 30 41 34 48 23
## Sedang 3 9 4 10 6
## Tinggi 44 62 74 48 14
Grafik yang menggambarkan tiap titiknya mewakili satu sel di tabel frekuensi. Grafik ini menyajikan frekuensi sehingga tidak mudah untuk pembandingan satu sel terhadap sel lainnya
##Program untuk pengelompokan berdasarkan pekerjaan
dotchart(survei,xlab="Frequency",xlim=c(0,100))
pada grafik ini kemampuan pengelolaan bersarang di pekerjaan
##Program untuk pengelompokan berdasarkan kemampuan pengelolaan keuangan
dotchart(t(survei),xlab="Frequency",xlim=c(0,100))
berbeda terbalik dengan grafik sebelumnya, pada grafik ini pekerjaan bersarang di kemampuan pengelolaan keuangan
Bila diinginkan sajiannya berupa proporsi
n<-sum(survei)
propsurvei<-survei/n
dotchart(propsurvei,xlab="Relative Frequency", xlim=c(0,0.3))
#Proporsi dihitung menurut pekerjaan
jumkerja <- colSums(survei)
proppekerjaan <- survei/rbind(jumkerja,jumkerja,jumkerja)
dotchart(proppekerjaan,xlab="Conditional Relative Frequency",xlim=c(0,1))
#Proporsi dihitung menurut kemampuan perencanaan keuangan
jumrkeu <- colSums(t(survei))
proprkeu <-t(survei)/rbind(jumrkeu,jumrkeu,jumrkeu,jumrkeu,jumrkeu)
dotchart(proprkeu,xlab="Conditional Relative Frequency",xlim=c(0,0.5))
Bila sajian grafik ditujukan untuk inferensia, statistik yang lebih tepat digunakan adalah proporsi yang didampingi dengan margin of error. pada grafik ini akan ditampilkan dengan selang kepercayaannya.
survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),ncol=5,nrow=3,byrow=FALSE,
dimnames=list(c("Rendah","Sedang","Tinggi"),c("Pertanian","PNS","Business owner","Profesional","Lainnya")))
n<-sum(survei)
propsurvei<-survei/n
dotchart(propsurvei,xlab="Proportion",lcolor="white",xlim=c(0,0.3))
sd<-sqrt((1.-propsurvei)*propsurvei/n) #Menghitung standard deviasi
sd<-sd*qnorm(0.975) #untuk Proporsi, ketika n besar maka menggunakan Z tetapi jika n kecil maka menggunakan Binomial.
hlo<-propsurvei-sd
hhi<-propsurvei+sd
titik<-c(propsurvei[,5],propsurvei[,4],propsurvei[,3],propsurvei[,2],propsurvei[,1])
kiri <-c(hlo[,5],hlo[,4],hlo[,3],hlo[,2],hlo[,1])
kanan<-c(hhi[,5],hhi[,4],hhi[,3],hhi[,2],hhi[,1])
dlx<-cbind(kiri,titik,kanan)
ys<-c(1:3,6:8,11:13,16:18,21:23)
dly<-cbind(ys,ys,ys)
ldl<-length(survei)
for (i in 1:ldl) lines(dlx[i,],dly[i,])
Sebagai alternatif sajian Dot Chart tidak secara tersarang, melainkan bersilang
library(lattice) #library yang digunakan
dotplot(survei,xlab="Frequency",ylab="EyeColor",as.table=TRUE,groups=FALSE,stack=FALSE,layout=c(1,5),scales=list(alternating=3))
dotplot(survei,xlab="Frequency",ylab="EyeColor",as.table=TRUE,groups=FALSE,stack=FALSE,layout=c(5,1),scales=list(alternating=3)) #hasil transpose dari chart sebelumnya.
barplot(survei,horiz=TRUE,xlab="Frequency",ylab="Pekerjaan",legend= rownames(survei),beside=TRUE,cex.names=0.6,xlim=c(0,100),col=c("deepskyblue3","chartreuse","deeppink3"))
#The Side-by-Side Bar Chart (Relative Frequency)
n<-sum(survei)
propsurvei<-survei/n
barplot(propsurvei,horiz=TRUE,xlab="Relative Frequency",ylab="Pekerjaan",
legend =rownames(propsurvei),beside=TRUE,cex.names=0.6,xlim=c(0,0.3),col=c("deepskyblue3","chartreuse","deeppink3"))
barplot(survei,horiz=TRUE,xlab="Frequency",ylab="Pekerjaan",legend= rownames(survei),beside=FALSE,cex.names=0.6,xlim=c(0,150),col=c("deepskyblue3","chartreuse","deeppink3"))
Seperti the side by side stacked chart hanya berbeda dengan adanya sekat diantara kategorinya.
mosaicplot(t(survei),main=" ", las=1,cex=0.75,col=c("deepskyblue3","chartreuse","deeppink3"))
Peubah acah adalah gambaran apa yang kita peroleh dari fenomena-fenomena yang ada. Fungsi peubah acak adalah fungsi yang memetakan hasil ruang contoh ke ruang bilangan real. Peubah yang cocok untuk data kategorik adalah peubah acak diskret. Terdapat beberapa peubah acak diskret diantaranya adalah peubah acak Bernoulli, Binomial, Poisson, Geometrik, Hypergeometrik dan Multinomial.
Merupakan fenomena dengan 2 kemungkinan hasil (sukses dan gagal), dengan p adalah peluang sukses. peubah acak (X) bernilai 1 jika kejaidan sukses dan 0 jika kejadian gagal.
x <- rbinom(100,1,0.2)
barplot(table(x))
y <- rbinom(100,1,0.5)
barplot(table(y))
Jumlah kejadian sukses dari n kejadian Bernoulli yang saling bebas dengan peluang sukses tetap sebesar p. Bentuk sebaran binomial akan simetris biasanya pada saat p=0.5. akan memungkinkan simetris walaupun p tidak sama dengan 0.5 dimana n besar.
#X~binom(8,0.5)
x <- rbinom(100,8,0.5)
barplot(table(x))
x <- rbinom(1000,8,0.5)
barplot(table(x))
Misalkan terdapat 12 nasabah asuransi di suatu tempat. Diketahui bahwa proporsi nasabah telat bayar polis ialah 1/6. Jika antar nasabah saling bebas, tentukanlah peluang bahwa terdapat 7 sampai 9 nasabah yang telat bayar polis! X = banyaknya nasabah asuransi yang telat membayar X ~ binomial(n = 12, p = 1/6) P(7 ≤ X ≤ 9)
pbinom(9, size=12, prob=1/6) - pbinom(6, size=12, prob=1/6)
## [1] 0.001291758
Merupakan kejadian binom pada selang waktu atau luasan tertentu, dengan rataan banyaknya kejadian sukses dalam selang tersebut adalah μ
x <- rpois(1000,1)
barplot(table(x))
x <- rpois(1000,3)
barplot(table(x))
x <- rpois(1000,6)
barplot(table(x))
#Misalkan di suatu kota secara rata-rata terdapat 2 mesin ATM yang rusak dalam 1 tahun. a. Berapakah peluang tidak mesin ATM rusak dalam 1 tahun ke depan? b. Berapakah peluang terdapat 2 mesin ATM rusak dalam 2 tahun ke depan? Misalkan: X=banyaknya mesin ATM rusak dalam waktu 1 tahun Maka: X~poisson(λ=1)
#a. P(X=0)
ppois(0,lambda=1)
## [1] 0.3678794
#b. misalkan: Y: banyaknya mesin ATM rusak dalam waktu 2 tahun
#maka Y~poisson(lambda=2)
#P(Y=2)
diff(ppois(c(1,2),lambda=2))
## [1] 0.2706706
#diff-->karena yang kita hitung adalah peluang kumulatif
Banyaknya pengulangan yang dibutuhkan hingga karakteristik yang diperhatikan muncul sekali. Jika kejadian sukses muncul, maka berhenti.
x <- rgeom(1000,0.2)
barplot(table(x))
x <- rgeom(1000,0.5)
barplot(table(x))
x <- rgeom(1000,0.8)
barplot(table(x))
Misalkan suatu bank melakukan pengambilan undian berhadiah untuk setiap bulan. Pak Yus adalah nasabah bank tersebut.Jika peluang keberhasilan Pak Yus memperoleh hadiah undian tersebut ialah 0.45. a. Berapakah peluang Pak Yus mendapatkan hadiah undian pada bulan ke-3 ? b. Berapakah peluang Pak Yus mendapatkan hadian undian minimal pada bulan ke-5 ?
Misalkan: X=banyaknya bulan yang dilalui sampai Pak Yus menang undian Maka: X~geometrik(p=0.45)
#a. P(X=3)
diff(pgeom(c(2,3),prob=0.45))
## [1] 0.07486875
#b.P(X>=5)=P(X>4)
pgeom(4,prob=0.45,lower.tail=FALSE)
## [1] 0.05032844
Digambarkan sebagai angka keberhasilan dalam contoh berukuran n yang diambil dari populasi berukuran N.
x<-rhyper(1000,50,50,10)
barplot(table(x))
x<-rhyper(1000,20,80,10)
barplot(table(x))
Misalkan terdapat 100 orang nasabah pada suatu bank dengan 2 kategori, yaitu kategori A dan B dengan masing-masing berisi 60 dan 40 orang nasabah.Pada bank tersebut akan dilakukan pemilihan 20 nasabah secara acak untuk dijadikan responden suatu survei evaluasi. a. Berapakah peluang bahwa terpilih 10 orang nasabah kategori A dan 10 orang nasabah kategori B ? Misalkan: X=banyaknya nasabah kategori A yang terpilih Maka: X~hipergeometrik(N=100,K=60,n=20)
#a. P(X=10)
dhyper(10,m=60,n=40,k=20)
## [1] 0.1192361