Praktikum 1

Materi: Penggunaan Software R untuk Eksplorasi Data Kategorik

1. Deskripsi Data Melalui Tabel dan Grafik

Pada bagian ini akan ditampilkan beberapa sajian grafis antar data kategorik

Ilustrasi

Suatu survei dilakukan terhadap pengguna dan bukan pengguna jasa-jasa keuangan. Berikut ini tersaji tabulasi silang antara pekerjaan responden dengan skor tingkat kemampuannya dalam pengelolaan keuangan. Bagaimanakah hubungan antar kedua peubah ini?

Ilustrasi

Ilustrasi

Untuk melihat bagaimana hubungan kedua peubah kategorik tersebut dapat dilakukan beberapa sajian grafis berikut ini:

The Grouped Dot Chart

Berikut adalah sintak untuk pengelompokkan berdasarkan pekerjaan dan kemampuan pengelolaan keuangan

survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),
               ncol=5,nrow=3,byrow=FALSE,
               dimnames=list(c("Rendah","Sedang","Tinggi"),
                             c("Pertanian","PNS","Business owner","Profesional","Lainnya")))

dotchart(survei,xlab="Frequency",xlim=c(0,100))

dotchart(t(survei),xlab="Frequency",xlim=c(0,100))

Bila diinginkan sajiannya berupa proporsi

n<-sum(survei)
propsurvei<-survei/n 
dotchart(propsurvei,xlab="Relative Frequency", xlim=c(0,0.3))

Proporsi dihitung menurut pekerjaan

jumkerja <-colSums(survei)
proppekerjaan <-survei/rbind(jumkerja,jumkerja,jumkerja)
dotchart(proppekerjaan,xlab="Conditional Relative Frequency",xlim=c(0,1))

Proporsi dihitung menurut kemampuan perencanaan keuangan

jumrkeu<-rowSums(survei)
proprkeu <-t(survei)/rbind(jumrkeu,jumrkeu,jumrkeu,jumrkeu,jumrkeu)
dotchart(proprkeu,xlab="Conditional Relative Frequency",xlim=c(0,0.5))

The Grouped Dot-Whisker Chart

Bila sajian grafik ditujukan untuk inferensia, statistik yang lebih tepat digunakan adalah proporsi yang didampingi dengan margin of error

survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),
               ncol=5,nrow=3,byrow=FALSE,
               dimnames=list(c("Rendah","Sedang","Tinggi"),
                             c("Pertanian","PNS","Business owner","Profesional","Lainnya")))
n<-sum(survei)
propsurvei<-survei/n
dotchart(propsurvei,xlab="Proportion",lcolor="white",xlim=c(0,0.3))

sd<-sqrt((1.-propsurvei)*propsurvei/n)
sd<-sd*qnorm(0.975)
hlo<-propsurvei-sd
hhi<-propsurvei+sd
titik<-c(propsurvei[,5],propsurvei[,4],propsurvei[,3],propsurvei[,2],propsurvei[,1])
kiri <-c(hlo[,5],hlo[,4],hlo[,3],hlo[,2],hlo[,1])
kanan<-c(hhi[,5],hhi[,4],hhi[,3],hhi[,2],hhi[,1])
dlx<-cbind(kiri,titik,kanan)
ys<-c(1:3,6:8,11:13,16:18,21:23)
dly<-cbind(ys,ys,ys)
ldl<-length(survei)
  for (i in 1:ldl) lines(dlx[i,],dly[i,])

The Two-Way Dot Chart

Alternatif sajian Dot Chart tidak secara tersarang, melainkan bersilang

survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),
               ncol=5,nrow=3,byrow=FALSE,
               dimnames=list(c("Rendah","Sedang","Tinggi"),
                             c("Pertanian","PNS","Business owner","Profesional","Lainnya")))
library(lattice)
dotplot(survei,xlab="Frequency",ylab="Eye Color",as.table=TRUE,groups=FALSE,stack=FALSE,layout=c(1,5),scales=list(alternating=3))

dotplot(survei,xlab="Frequency",ylab="Eye Color",as.table=TRUE,groups=FALSE,stack=FALSE,layout=c(5,1),scales=list(alternating=3))

The Side-by-Side Bar Chart

survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),
               ncol=5,nrow=3,byrow=FALSE,
               dimnames=list(c("Rendah","Sedang","Tinggi"),
                             c("Pertanian","PNS","Business owner","Profesional","Lainnya")))
barplot(survei,horiz=TRUE,xlab="Frequency",ylab="Pekerjaan",legend = rownames(survei),beside=TRUE,cex.names=0.6,xlim=c(0,100))

Jika datanya proporsi

n<-sum(survei)
propsurvei<-survei/n
barplot(propsurvei,horiz=TRUE,xlab="Relative Frequency",ylab="Pekerjaan",legend = rownames(propsurvei),beside=TRUE,cex.names=0.6,xlim=c(0,0.3))

The Side-by-Side Stacked Bar Chart

survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),
               ncol=5,nrow=3,byrow=FALSE,
               dimnames=list(c("Rendah","Sedang","Tinggi"),
                             c("Pertanian","PNS","Business owner","Profesional","Lainnya")))

barplot(survei,horiz=TRUE,xlab="Frequency",ylab="Pekerjaan",legend = rownames(survei),beside=FALSE,cex.names=0.6,xlim=c(0,150))

The Mosaic Chart

survei<-matrix(data=c(30,3,44,41,9,62,34,4,74,48,10,48,23,6,14),
               ncol=5,nrow=3,byrow=FALSE,
               dimnames=list(c("Rendah","Sedang","Tinggi"),
                             c("Pertanian","PNS","Business owner","Profesional","Lainnya")))
mosaicplot(t(survei),main=" ", las=1,cex=0.75,color=TRUE)

2. Peubah Acak

Pada bagian ini ditampilkan ilustrasi dari beberapa peubah acak diskret serta bagaimana menghitung nilai peluang kejadian peubah acak diskret tersebut

Ilustrasi Sebaran Bernoulli

Diambil contoh acak sebanyak n=100 dengan p=0.2; p=0.5

x <-rbinom(100,1,0.2)
barplot(table(x))

y <-rbinom(100,1,0.5)
barplot(table(y))

Ilustrasi Sebaran Binomial

Diambil contoh acak sebanyak n=100 dan n=1000 dengan x=8; p=0.5

x <-rbinom(100,8,0.5)
barplot(table(x))

x <-rbinom(1000,8,0.5)
barplot(table(x))

Misalkan terdapat 12 nasabah asuransi di suatu tempat.Diketahui bahwa proporsi nasabah telat bayar polis ialah 1/6. Jika antar nasabah saling bebas,tentukanlah peluang bahwa terdapat 7 sampai 9 nasabah yang telat bayar polis!

pbinom(9, size=12, prob=1/6) -pbinom(6, size=12, prob=1/6)
## [1] 0.001291758

Ilustrasi Sebaran Poisson

poisson(1), poisson(3), poisson(6)

x <-rpois(1000,1) 
barplot(table(x))

x <-rpois(1000,3) 
barplot(table(x))

x <-rpois(1000,6) 
barplot(table(x))

Misalkan di suatu kota secara rata-rata terdapat 2 mesin ATM yang rusak dalam 1 tahun.

a.Berapakah peluang tidak ada mesin ATM rusak dalam 1 tahun kedepan?

b.Berapakah peluang terdapat 2 mesin ATM rusak dalam 2 tahun kedepan?

ppois(0,lambda=1) #a.
## [1] 0.3678794
diff(ppois(c(1,2),lambda=2)) #b.
## [1] 0.2706706

Ilustrasi Sebaran Geometri

x <-rgeom(1000,0.2) #geom(0.2)
barplot(table(x))

x <-rgeom(1000,0.5) #geom(0.5)
barplot(table(x))

x <-rgeom(1000,0.8) #geom(0.8)
barplot(table(x))

Misalkan suatu bank melakukan pengambilan undian berhadiah untuk setiap bulan.Pak Yus adalah nasabah bank tersebut. Jika peluang keberhasilan Pak Yus memperoleh hadiah undian tersebut ialah 0.45.

a.Berapakah peluang Pak Yus mendapatkan hadiah undian pada bulan ke-3?

b.Berapakah peluang Pak Yus mendapatkan hadian undian minimal pada bulan ke-5?

diff(pgeom(c(2,3),prob=0.45))#a.
## [1] 0.07486875
pgeom(4,prob=0.45,lower.tail=FALSE) #b.
## [1] 0.05032844

Ilustrasi Sebaran Hipergeometrik

x <-rhyper(1000,50,50,10) #hyper(100,50,10)
barplot(table(x))

x <-rhyper(1000,20,80,10) #hyper(100,20,10)
barplot(table(x))

Misalkan terdapat 100 orang nasabah pada suatu bank dengan 2 kategori, yaitu kategori A dan B dengan masing-masing berisi 60 dan 40 orang nasabah.. Pada bank tersebut akan dilakukan pemilihan 20 nasabah secara acak untuk dijadikan responden suatu survei evaluasi. a.Berapakah peluang bahwa terpilih 10 orang nasabah kategori A dan 10 orang nasabah kategori B?

dhyper(10,m=60,n=40,k=20)
## [1] 0.1192361