Komputasi Statistika
~ Confidence Interval ~
| Kontak | : \(\downarrow\) |
| dsciencelabs@outlook.com | |
| https://www.instagram.com/dsciencelabs/ | |
| RPubs | https://rpubs.com/dsciencelabs/ |
Interval Kepercayaan
Confidence Interval mengukur tingkat ketidakpastian atau kepastian dalam metode pengambilan sampel. Interval kepercayaan dapat dihitung untuk berbagai statistik, seperti mean, median, atau kemiringan regresi linier.
Estimasi Titik Rata-Rata Populasi
Mean populasi adalah ukuran pusat atau nilai “rata-rata” di seluruh populasi dari variabel yang diukur. Dengan demikian, rata-rata sampel adalah perkiraan sampel dari rata-rata populasi.
Kasus 14
Menemukan perkiraan titik rata-rata mahasiswa height dengan data sampel dari survei menggunakan mean() fungsi dan na.rm=TRUE jika ada nilai yang hilang, setelah itu menggunakan fungsi t.test untuk menghitung statistik dan uji statistik untuk suatu variabel, termasuk interval kepercayaan.
library(MASS) # load the MASS package data set survey
height.survey = survey$Height # save the survey data of student heights
mean(height.survey, na.rm=TRUE) # the point estimate of student heights## [1] 172.3809
p.est<-t.test(height.survey, conf.level = 0.95) # computes a number of statistical tests
p.est$conf.int # print confidence intervals## [1] 171.0380 173.7237
## attr(,"conf.level")
## [1] 0.95
Latihan 5
Temukan perkiraan titik rata-rata mahasiswa Age dengan data sampel dari survei!
library(MASS)
Age.survey = survey$Age
mean(Age.survey, na.rm=TRUE) ## [1] 20.37451
p.test <- t.test(Age.survey, conf.level = 0.95)
p.test$conf.int## [1] 19.54600 21.20303
## attr(,"conf.level")
## [1] 0.95
Rata-Rata Populasi (SIgma Dikenal)
Misalkan \(100(1-\sigma/2)\) persentil dari distribusi normal standar sebagai \(z_{\sigma/2}\). Untuk sampel acak dengan ukuran yang cukup besar, titik akhir dari estimasi interval pada \((1-\sigma)\) tingkat kepercayaan.
Kasus 15
Asumsikan simpangan baku populasi \(\sigma\) tinggi siswa dalam survei adalah 9,48. Tentukan margin of error dan estimasi interval pada tingkat kepercayaan 95%.
library(MASS) # load the MASS package data set survey
height.response = na.omit(survey$Height) # filter out missing values in Height
n = length(height.response) # assign the length of response
sigma = 9.48 # population standard deviation
sem = sigma/sqrt(n) # standard error of the mean
E = qnorm(.975)*sem ;E # margin of error (upper tail 95% of CI)## [1] 1.285237
xbar = mean(height.response); xbar # sample mean ## [1] 172.3809
xbar + c(-E, E) # confidence interval as told## [1] 171.0956 173.6661
Solusi alternatif: Alih-alih menggunakan rumus buku teks, kita dapat menerapkan z.testfungsi dalam TeachingDemospaket. Ini bukan paket inti R, dan harus diinstal dan dimuat ke ruang kerja sebelumnya.
library(TeachingDemos) # load TeachingDemos package
z.test(height.response, sd=sigma) # apply the z.test##
## One Sample z-test
##
## data: height.response
## z = 262.88, n = 209.00000, Std. Dev. = 9.48000, Std. Dev. of the sample
## mean = 0.65575, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 171.0956 173.6661
## sample estimates:
## mean of height.response
## 172.3809
Rata-Rata Populasi (Sigma Tidak Diketahui)
Misalkan \(100(1-\sigma/2)\) persentil Student T dengan \(n-1\) derajat kebebasan sebagai \(t\sigma/2\). Untuk sampel acak dengan ukuran yang cukup besar, dan dengan simpangan baku \(s\), titik akhir estimasi interval di \((1-\sigma)\) tingkat kepercayaan
Kasus 16
Tanpa mengasumsikan simpangan baku populasi \(\sigma\) dari tinggi siswa dalam survei, temukan margin kesalahan dan perkiraan interval pada tingkat kepercayaan 95%.
library(MASS) # load the MASS package data set survey
height.response = na.omit(survey$Height) # filter out missing values in Height
n = length(height.response) # assign the length of response
s = 9.48 # sample standard deviation
SE = s/sqrt(n) # standard error estimate
E = qt(.975, df=n-1)*SE; E # margin of error (upper tail 95% of CI)## [1] 1.292759
xbar = mean(height.response); xbar # sample mean ## [1] 172.3809
xbar + c(-E, E) # confidence interval as told## [1] 171.0881 173.6736
Tanpa asumsi deviasi standar populasi, margin kesalahan untuk survei tinggi badan siswa pada tingkat kepercayaan 95% adalah 1,3429 sentimeter. Interval kepercayaan adalah antara 171,04 dan 173,72 sentimeter.
Solusi alternatif: Alih-alih menggunakan rumus buku teks, kita dapat menerapkan fungsi t.test dalam paket statistik bawaan.
library(stats) # load stats package
t.test(height.response) # apply the z.test##
## One Sample t-test
##
## data: height.response
## t = 253.07, df = 208, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 171.0380 173.7237
## sample estimates:
## mean of x
## 172.3809
Ukuran Sampling Rata-rata Populasi (Sigma Dikenal)
\[ n=\frac{(z_{\sigma/2})^2\sigma^2}{E^2} \] Dengan menggunakan rumus diatas untuk memberikan ukuran sampel yang dibutuhkan di bawah persyaratan estimasi interval rata-rata populasi pada \((1-\sigma)\) tingkat kepercayaan, margin of Error\(E\) dan varians populasi \(\sigma^2\).
Kasus 17
Asumsikan simpangan baku populasi σ tinggi siswa dalam survei adalah 9,48. Temukan ukuran sampel yang diperlukan untuk mencapai margin kesalahan 1,2 cm pada tingkat kepercayaan 95%.
zstar = qnorm(.975) # quantiles (95% confidence level)
sigma = 9.48 # assume population standard deviation
E = 1.2 # expected error
zstar^2*sigma^2/ E^2 # sampling size ## [1] 239.7454
Berdasarkan asumsi simpangan baku populasi sebesar 9,48, diperlukan ukuran sampel 240 untuk mencapai margin of error 1,2 cm pada tingkat kepercayaan 95%
Latihan 6
Tingkatkan kualitas survei sampel dengan meningkatkan ukuran sampel dengan standar deviasi yang tidak diketahui \(\sigma\)!
zstar = qnorm(.975)
sigma = 9.48
E = 1.
zstar^2*sigma^2/ E^2## [1] 345.2334
Titik Estimasi Proporsi Penduduk
Misalnya, kita dapat memperkirakan proporsi mahasiswi di universitas berdasarkan hasil survei kumpulan data sampel.
library(MASS) # load the MASS package
gender.response = na.omit(survey$Sex) # filter out missing values in `gender`
n = length(gender.response) # valid responses countUntuk mengetahui jumlah siswa perempuan, kita membandingkan respon gender dengan faktor Female, dan menghitung sum. Membaginya dengan \(n\) memberikan proporsi siswa perempuan dalam survei sampel.
library(MASS) # load the MASS package
k = sum(gender.response == "Female") # the sum of female responses
pbar = k/n; pbar # female student proportion in survey## [1] 0.5
Estimasi Interval Proporsi Penduduk
Jika ukuran sampel n dan proporsi populasi p memenuhi syarat bahwa \(np>=5\) dan \(n(1-p)>=5\) dari titik akhir estimasi interval di \((1-\sigma)\) tingkat kepercayaan didefenisikan dalam hal proporsi sampel sebagai berikut
\[ \bar{p}±z_{\sigma/2}\sqrt{\frac{\bar{p}(1-\bar{p})}{n}} \]
Kasus 18
Hitunglah margin of error dan estimasi interval untuk proporsi siswa perempuan dalam survei pada tingkat kepercayaan 95%.
library(MASS) # load the MASS package
k = sum(gender.response == "Female") # the sum of female responses
pbar = k/n # female student proportion in survey
SE = sqrt(pbar*(1-pbar)/n); SE # standard error ## [1] 0.03254723
E = qnorm(.975)*SE; E # margin of error## [1] 0.06379139
pbar + c(-E, E) # the CI of sample proportion## [1] 0.4362086 0.5637914
Pada tingkat kepercayaan 95%, antara 43,6% dan 56,3% mahasiswa adalah perempuan, dan margin kesalahannya adalah 6,4%.
Solusi alternatif: Alih-alih menggunakan rumus buku teks, kita dapat menerapkan prop.test fungsi dalam stats paket bawaan.
library(stats) # load the MASS package
prop.test(k, n) # the interval estimate of proportion##
## 1-sample proportions test without continuity correction
##
## data: k out of n, null probability 0.5
## X-squared = 0, df = 1, p-value = 1
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.4367215 0.5632785
## sample estimates:
## p
## 0.5
Ukuran Sampel Proporsi Populasi
Rumus dibawah ini memberikan ukuran sampel yang dibutuhkan di bawah persyaratan perkiraan interval proporsi populasi pada \((1-\sigma)\) tingkat kepercayaan, margin of error \(E\) dan perkiraan proporsi yang direncanakan \(p\).
\[ n=\frac{(z_\sigma/2)^2p(1-p)}{E^2} \]
Kasus 19
Dengan menggunakan perkiraan proporsi 50% yang direncanakan, temukan ukuran sampel yang diperlukan untuk mencapai margin kesalahan 5% untuk survei siswa perempuan pada tingkat kepercayaan 95%.
zstar = qnorm(.975) # quantiles (95% confidence level)
p = 0.5 # 50% planned proportion estimate
E = 0.05 # expected error
zstar^2*p*(1-p)/E^2 # sampling size## [1] 384.1459
Latihan 7
Asumsikan Anda tidak memiliki perkiraan proporsi yang direncanakan, temukan ukuran sampel yang diperlukan untuk mencapai margin kesalahan 5% untuk survei siswa laki-laki pada tingkat kepercayaan 95%!
zstar = qnorm(.975)
sigma = .975
E = 0.05
zstar^2/E^2## [1] 1536.584
Latihan 8
Lakukan analisis interval kepercayaan pada kumpulan data ini dari tahun 2004 yang mencakup data pendapatan rata-rata per jam, status perkawinan, jenis kelamin, dan usia ribuan orang.
cps = read.csv("cps04.csv")
mean(cps$age, na.rm=TRUE)## [1] 29.75445
p.test <- t.test(cps$age, conf.level = 0.95)
p.test$conf.int## [1] 29.69103 29.81786
## attr(,"conf.level")
## [1] 0.95
Dengan keyakinan 95% disimpulkan bahwa perkiraan interval mencakup rata-rata populasi umur yang sebenarnya.
t.test(cps$age)##
## One Sample t-test
##
## data: cps$age
## t = 919.71, df = 7985, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 29.69103 29.81786
## sample estimates:
## mean of x
## 29.75445
Proporsi Populasi
fm = cps$female
le = length(fm)
su = sum(fm == "1")
pbar = su/le; pbar## [1] 0.414851
Interval proporsi populasi
prop.test(su, le)##
## 1-sample proportions test with continuity correction
##
## data: su out of le, null probability 0.5
## X-squared = 231.26, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.4040262 0.4257582
## sample estimates:
## p
## 0.414851
Disimpulkan bahwa antara 40.4% dan 42.6% data adalah perempuan.