UTS

Komputasi Statistika


Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/saram.05/
RPubs https://rpubs.com/sausanramadhani/

Distribusi Peluang

Soal 1

Jika diketahui jumlah penjualan sebuah produk A berdistribusi normal dengan rata-rata 250 unit per-hari dengan standar deviasi 10 unit. Maka, berapakah peluang bahwa pada suatu hari hasil penjualan akan:

● Lebih besar dari 268 unit?
● Berada antara 245-260 unit?

Jawab

● Lebih besar dari 268 unit?

pnorm(268, mean=250, sd=10, lower.tail=FALSE)
## [1] 0.03593032

Saya bulatkan hasil tersebut, maka menjadi 0.04 atau sama dengan 4%.
Jadi, peluang hasil penjualan lebih besar dari 268 unit adalah 4%.

● Berada antara 245-260 unit?

pnorm(245, mean=250, sd=10, lower.tail=FALSE) - pnorm(260, mean=250, sd=10, lower.tail=FALSE)
## [1] 0.5328072

Jadi, peluang hasil penjualan antara 245 sampai 260 unit adalah sebesar 53%.

Soal 2

Salah satu penyakit mata yang disebut Glaukoma dapat berdampak negatif pada penderita apabila Intraocular Pressure (IOP) nya tinggi. Pada sebuah penelitian diketahui bahwa distribusi dari IOP populasi secara umum mengikuti sebaran normal dengan rata-rata 16 mm/HG dan standar deviasinya 3 mm/Hg. Jika nilai IOP sekitar 12 dan 20 mm/Hg dianggap normal, maka berapa persen dari populasi umum akan berada dalam rentang ini?

Jawab

Nilai IOP sekitar 12 dan 20 mm/Hg dianggap normal, maka bisa dihitung populasi umumnya sebagai berikut :

pnorm(12, mean=16, sd=3, lower.tail=FALSE) - pnorm(20, mean=16, sd=3, lower.tail=FALSE)
## [1] 0.8175776

Nilai tersebut saya bulatkan menjadi 0.82 atau sama dengan 82%.
Jadi, populasi umum saat nilai IOP sekitar 12 dan 20 mm/Hg adalah sebesar 82%.

Uji Hipotesis

Soal 3

Dalam R terdapat Dataset chickwts yang terdiri dari dua variabel (weight dan feed) dan 71 kasus/baris. Diketahui bahwa variabel weight merupakan variabel numerik dengan skala interval/rasio, sedangkan variabel feed merupakan variabel nonnumerik dengan skala nominal. Perlu dicatat bahwa, variabel weight ini berisi nilai pertumbuhan berat badan anak ayam, sedangkan variabel feed berisi perlakuan (treatment) dalam pemberian jenis pakannya. Andaikan anda sebagai peneliti ingin melakukan pengujian apakah rata-rata dari variabel weight sama dengan nilai 150, dimana α=0.025!

Jawab

H0 : rata-rata dari variabel weight sama dengan nilai 150
H1 : rata-rata dari variabel weight tidak sama dengan nilai 150

Karena diketahui rata-rata tetapi tidak diketahui standar deviasinya, maka saya gunakan cara berikut ini:

mu0 = 150
xbar = mean(chickwts$weight)
s = sd(chickwts$weight)
n = 71
t = (xbar-mu0)/(s/sqrt(n));t
## [1] 12.01318
alpha = 0.025
t.half.alpha = qt(1-alpha/2, df=n-1)
c(-t.half.alpha, t.half.alpha)
## [1] -2.290639  2.290639
pval = 2*pt(t, df=n-1);pval
## [1] 2

Berdasarkan hasil tersebut, didapatkan t test 12.01318 maka t test berada di luar atau lebih besar dari interval yang didapat yaitu -2.290639 sampai 2.290639. Pada aturan two tiled (population mean and unknown standard deviation), jika t≥tα∕2 maka H0 diterima artinya rata-rata dari variabel weight sama dengan nilai 150.

Untuk lebih meyakinkan lagi, saya mencari p-valuenya. Didapat p-value sebesar 2 yang mana p-value lebih besar daripada alpha (0.025) maka H0 diterima artinya rata-rata dari variabel weight sama dengan nilai 150.

Dari kedua hasil tersebut, dapat disimpulkan bahwa rata-rata variabel weight sama dengan 150.

Soal 4

Dengan menggunakan dataset chickwts pada R. Lakukan pengujian perbandingan rata-rata weight dari dua kelompok dalam variabel feed, yaitu antara kelompok “casein” dan “sunflower”.

Jawab

H0 : tidak terdapat perbedaan antara rata-rata weight dari dua kelompok dalam variabel feed, yaitu antara kelompok “casein” dan “sunflower”
H1 : terdapat perbedaan antara rata-rata weight dari dua kelompok dalam variabel feed, yaitu antara kelompok “casein” dan “sunflower”

Asumsikan bahwa confidence levelnya 95%.
Kita siapkan data casein dan sunflower terlebih dahulu :

feed.casein = subset(chickwts, feed=="casein")$weight          # data casein
feed.sunflower = subset(chickwts, feed=="sunflower")$weight    # data sunflower

Cari tahu apakah data casein dan sunflower termasuk distribusi normal atau tidak :

alpha = 1-0.95;alpha
## [1] 0.05
shapiro.test(feed.casein)
## 
##  Shapiro-Wilk normality test
## 
## data:  feed.casein
## W = 0.91663, p-value = 0.2592
shapiro.test(feed.sunflower)
## 
##  Shapiro-Wilk normality test
## 
## data:  feed.sunflower
## W = 0.92809, p-value = 0.3603

Untuk data casein, didapat p-value (0.2592) lebih besar dari alpha (0.05) artinya data casein berdistribusi normal. Kemudian untuk data sunflower, didapat p-value (0.3603) lebih besar dari alpha (0.05) artinya data sunflower berdistribusi normal.
Dengan demikian, kedua data tersebut berdistribusi normal. Sehingga bisa dilanjutkan ke tahap berikutnya yaitu t test untuk mengetahui H0 ditolak atau diterima.

t.test(feed.casein, feed.sunflower)
## 
##  Welch Two Sample t-test
## 
## data:  feed.casein and feed.sunflower
## t = -0.22851, df = 20.502, p-value = 0.8215
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -53.94204  43.27538
## sample estimates:
## mean of x mean of y 
##  323.5833  328.9167

Pada dataset chickwts, rata-rata feed.casein adalah 323.5833 dan rata-rata feed.sunflower adalah 328.9167. Confidence intervalnya antara -53.94204 dan 43.27538. Dengan demikian, kedua rata-rata variabel berada di luar confidence interval. Kemudian, didapat p-value sebesar 0.8215 yang mana lebih besar daripada alpha.

Berdasarkan hasil tersebut, dapat disimpulkan bahwa H0 diterima yang artinya tidak terdapat perbedaan antara rata-rata weight dari dua kelompok dalam variabel feed, yaitu antara kelompok “casein” dan “sunflower”.

Soal 5

Kemenpora ingin menguji efektivitas jenis pelatihan baru yang diusulkan, dengan membandingkan rata-rata 10 pelari di lintasan 100 meter. Berikut adalah catatan waktu (detik) sebelum dan setelah pelatihan dari masing-masing 10 pelari. Sebelum training: 12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3. Setelah training: 12.7, 13.6, 12.0, 15.2, 16.8, 20.0, 12.0, 15.9, 16.0, 11.1. Buktikan bahwa apakah ada perbedaan pada hasil perlakuan/pelatihan uji rata-rata dua sampel berpasangan tersebut!

Jawab

Dari data yang sudah diberikan, kita jadikan satu dalam sebuah dataframe seperti berikut ini :

no <- seq(1:10)        # urutan/banyaknya pelari di lintasan 100 meter
sebelum <- c(12.9, 13.5, 12.8, 15.6, 17.2, 19.2, 12.6, 15.3, 14.4, 11.3)  # sebelum training
setelah <- c(12.7, 13.6, 12.0, 15.2, 16.8, 20.0, 12.0, 15.9, 16.0, 11.1)  # setelah training
kemenpora <- data.frame(no,sebelum,setelah)
kemenpora

Pembuktian apakah ada perbedaan pada hasil perlakuan/pelatihan uji rata-rata dua sampel berpasangan tersebut :

H0 : tidak terdapat perbedaan pada hasil perlakuan/pelatihan uji rata-rata dua sampel berpasangan tersebut
H1 : terdapat perbedaan pada hasil perlakuan/pelatihan uji rata-rata dua sampel berpasangan tersebut

t.test(sebelum, setelah)
## 
##  Welch Two Sample t-test
## 
## data:  sebelum and setelah
## t = -0.043323, df = 17.653, p-value = 0.9659
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.478112  2.378112
## sample estimates:
## mean of x mean of y 
##     14.48     14.53

Didapat p-valuenya sebesar 0.9659 yang mana lebih besar dari alpha (0.05) artinya H0 diterima. Dengan demikian, dapat disimpulkan bahwa tidak terdapat perbedaan pada hasil perlakuan/pelatihan uji rata-rata dua sampel berpasangan tersebut.