Email             :
RPubs            : https://rpubs.com/aliciaarifin/
Jurusan          : Statistika
Address         : ARA Center, Matana University Tower
                         Jl. CBD Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten 15810.


1 Ujian Tengah Semester Komputasi Statistika

Berikut ini adalah Soal UTS Komputasi Statistika:

1.1 Distribusi Peluang

1.1.1 Soal 1

Jika diketahui jumlah penjualan sebuah produk A berdistribusi normal dengan rata-rata 250 unit per-hari dengan standar deviasi 10 unit. Maka, berapakah peluang bahwa pada suatu hari hasil penjualan akan:
Lebih besar dari 268 unit?
Berada antara 245-260 unit?

miu = 250
sd = 10

# pnorm() normalnya mengeluarkan hasil lower.tail, bukan uppertail.
# lebih besar dari 268 unit
pnorm(268, mean = miu, sd=sd, lower.tail = F) 
## [1] 0.03593032
# berada diantara 245-260 unit
pnorm(260, mean = miu, sd=sd) - pnorm(245, mean = miu, sd=sd) 
## [1] 0.5328072

Peluang suatu hari lebih besar dari 268 unit adalah 3,59%, dan peluang suatu hari hasil penjualan akan berada antara 245-260 unit adalah 53,28%.

1.1.2 Soal 2

Salah satu penyakit mata yang disebut Glaukoma dapat berdampak negatif pada penderita apabila Intraocular Pressure (IOP) nya tinggi. Pada subuah penelitian diketahui bahwa distribusi dari IOP populasi secara umum mengikuti sebaran normal dengan rata-rata 16 mm/HG dan standar deviasinya 3 mm/Hg. Jika nilai IOP sekitar 12 dan 20 mm/Hg dianggap normal, maka berapa persen dari populasi umum akan berada dalam rentang ini?

miu = 16
sd = 3

pnorm(20, mean=miu, sd=sd, lower.tail = T) - pnorm(12, mean=miu, sd=sd, lower.tail = T) 
## [1] 0.8175776

populasi umum yang akan dikatakan normal sebanyak 81,75% dari populasi yang dikatakan normal adalah nilai IOP antara 12-20 mm/Hg.

1.2 Uji Hipotesis

1.2.1 Soal 3

Dalam R terdapat Dataset chickwts yang terdiri dari dua variabel (weight dan feed) dan 71 kasus/baris. Diketahui bahwa ariabel weight merupakan variabel numerik dengan skala interval/rasio, sedangkan variabel feed merupakan variabel nonnumerik dengan skala nominal. Perlu dicatat bahwa, variabel weight ini berisi nilai pertumbuhan berat badan anak ayam, sedangkan variabel feed berisi perlakuan (treatment) dalam pemberian jenis pakannya. Andaikan anda sebagai peneliti ingin melakukan pengujian apakah rata-rata dari variabel weight sama dengan nilai 150, dimana α=0.025!

# dari data chickwts
miu0 = 150
alpha = 0.025

miu = mean(chickwts$weight)
S = sd(chickwts$weight)
n = length(chickwts$weight)

# two tailed t test becuase of unknown of standard deviation
t.test = (miu-miu0)/(S / sqrt(n)) ;t.test
## [1] 12.01318
#find t α
t.half.alpha = qt(1-(alpha/2), df=n-1)
c(-t.half.alpha, t.half.alpha)
## [1] -2.290639  2.290639

H0 = miu0 = miu, H1 = miu0 =/ miu.
t.test > + t.alpha, H0 ditolak, rata-rata variabel weight tidak sama dengan 150.

1.2.2 Soal 4

Dengan menggunakan dataset chickwts pada R. Lakukan pengujian perbandingan rata-rata weight dari dua kelompok dalam variabel feed, yaitu antara kelompok “casein” dan “sunflower”.

casein = subset(chickwts, feed== 'casein')
sunflower= subset(chickwts, feed=='sunflower')
alpha = 0.05

# asumsi 1
# kedua sample independen

# cek normalitas kedua data
sapiro_c = shapiro.test(casein$weight);sapiro_c$p.value
## [1] 0.2591841
sapiro_s = shapiro.test(sunflower$weight);sapiro_s$p.value
## [1] 0.3602904
paste0("kedua data berdistribusi normal karena p-value> 0.05, H0 diterima")
## [1] "kedua data berdistribusi normal karena p-value> 0.05, H0 diterima"
# cek ragamnya
var.test(weight~feed, data= chickwts[chickwts$feed %in% c("casein","sunflower"),])
## 
##  F test to compare two variances
## 
## data:  weight by feed
## F = 1.7408, num df = 11, denom df = 11, p-value = 0.3718
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.5011282 6.0469059
## sample estimates:
## ratio of variances 
##           1.740769
paste("kedua variabel merupakan variabel homogen, p-value > alpha")
## [1] "kedua variabel merupakan variabel homogen, p-value > alpha"
# kedua variabel merupakan homogen, gunakan t unpaired test
t.test = t.test(casein$weight , sunflower$weight ,var.equal=T) ; t.test
## 
##  Two Sample t-test
## 
## data:  casein$weight and sunflower$weight
## t = -0.22851, df = 22, p-value = 0.8214
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -53.73622  43.06955
## sample estimates:
## mean of x mean of y 
##  323.5833  328.9167
t.test$p.value 
## [1] 0.8213587
paste("p-value > alpha 0.05, tidak terdapat perbedaan rata-rata anak ayam yang diberi makan casein dengan sunflower")
## [1] "p-value > alpha 0.05, tidak terdapat perbedaan rata-rata anak ayam yang diberi makan casein dengan sunflower"

Untuk mencari t.test tidak berpasangan, kita harus mengetahui apakah data yang akan kita gunakan berdistribusi normal atau tidak, dan cari apakah variabel tersebut homogen atau bukan. dari tes di atas, kita mengetahui bahwa variabel yang kita gunakan yaitu sunflower dan casein berdistribusi normal dan homogen.
Pada saat di uji t tidak berpasangan, didapatkan p-value 0.8213587 atau 82.14%, p-value ini lebih besar dari alpha (asumsikan alpha=0.05 karena tidak diketahui), atau H0 ditolak (H0 = terdapat perbedaan rata-rata anak ayam yang diberi makan casein dengan sunflower)

1.2.3 Soal 5

Kemenpora ingin menguji efektivitas jenis pelatihan baru yang diusulkan, dengan membandingkan rata-rata 10 pelari di lintasan 100 meter. Berikut adalah catatan waktu (detik) sebelum dan setelah pelatihan dari masing-masing 10 pelari.
Sebelum training: 12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3.
Setelah training: 12.7, 13.6, 12.0, 15.2, 16.8, 20.0, 12.0, 15.9, 16.0, 11.1.
Buktikan bahwa apakah ada perbedaan pada hasil perlakuan/pelatihan uji rata-rata dua sampel berpasangan tersebut!

# paired t.test karena sample sama, perlakuan berbeda.
before = c(12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3)
after = c(12.7, 13.6, 12.0, 15.2, 16.8, 20.0, 12.0, 15.9, 16.0, 11.1)

# paired t.test
t.paired = t.test(before, after, paired = TRUE); t.paired
## 
##  Paired t-test
## 
## data:  before and after
## t = -0.21331, df = 9, p-value = 0.8358
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -0.5802549  0.4802549
## sample estimates:
## mean difference 
##           -0.05

H0 = tidak terdapat perbedaan rata-rata pada hasil perlakuan
p-value >0.05, H0 diterima.
Tidak terdapat perbedaan rata-rata pada hasil perlakuan.