Komputasi Statistika

~ Confidence Interval ~


Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/dsciencelabs/
RPubs https://rpubs.com/dsciencelabs/

Interval Kepercayaan

Confidence Interval mengukur tingkat ketidakpastian atau kepastian dalam metode pengambilan sampel. Interval kepercayaan dapat dihitung untuk berbagai statistik, seperti mean, median, atau kemiringan regresi linier.

Estimasi Titik Rata-Rata Populasi

Mean populasi adalah ukuran pusat atau nilai “rata-rata” di seluruh populasi dari variabel yang diukur. Dengan demikian, rata-rata sampel adalah perkiraan sampel dari rata-rata populasi.

Kasus 14

Menemukan perkiraan titik rata-rata mahasiswa height dengan data sampel dari survei menggunakan mean() fungsi dan na.rm=TRUE jika ada nilai yang hilang, setelah itu menggunakan fungsi t.test untuk menghitung statistik dan uji statistik untuk suatu variabel, termasuk interval kepercayaan.

library(MASS)                                          # load the MASS package data set survey
height.survey = survey$Height                          # save the survey data of student heights
mean(height.survey, na.rm=TRUE)                        # the point estimate of student heights
## [1] 172.3809
p.est<-t.test(height.survey, conf.level = 0.95)        # computes a number of statistical tests 
p.est$conf.int                                         # print confidence intervals
## [1] 171.0380 173.7237
## attr(,"conf.level")
## [1] 0.95

Latihan 5

Temukan perkiraan titik rata-rata mahasiswa Age dengan data sampel dari survei!

library(MASS)                                
Age.survey = survey$Age                 
mean(Age.survey, na.rm=TRUE)  
## [1] 20.37451
p.test <- t.test(Age.survey, conf.level = 0.95)
p.test$conf.int
## [1] 19.54600 21.20303
## attr(,"conf.level")
## [1] 0.95

Rata-Rata Populasi (SIgma Dikenal)

Misalkan \(100(1-\sigma/2)\) persentil dari distribusi normal standar sebagai \(z_{\sigma/2}\). Untuk sampel acak dengan ukuran yang cukup besar, titik akhir dari estimasi interval pada \((1-\sigma)\) tingkat kepercayaan.

Kasus 15

Asumsikan simpangan baku populasi \(\sigma\) tinggi siswa dalam survei adalah 9,48. Tentukan margin of error dan estimasi interval pada tingkat kepercayaan 95%.

library(MASS)                                          # load the MASS package data set survey
height.response = na.omit(survey$Height)               # filter out missing values in Height
n = length(height.response)                            # assign the length of response
sigma = 9.48                                           # population standard deviation 
sem = sigma/sqrt(n)                                    # standard error of the mean
E = qnorm(.975)*sem ;E                                 # margin of error (upper tail 95% of CI)
## [1] 1.285237
xbar = mean(height.response); xbar                     # sample mean 
## [1] 172.3809
xbar + c(-E, E)                                        # confidence interval as told
## [1] 171.0956 173.6661

Solusi alternatif: Alih-alih menggunakan rumus buku teks, kita dapat menerapkan z.testfungsi dalam TeachingDemospaket. Ini bukan paket inti R, dan harus diinstal dan dimuat ke ruang kerja sebelumnya.

library(TeachingDemos)                                 # load TeachingDemos package 
z.test(height.response, sd=sigma)                      # apply the z.test
## 
##  One Sample z-test
## 
## data:  height.response
## z = 262.88, n = 209.00000, Std. Dev. = 9.48000, Std. Dev. of the sample
## mean = 0.65575, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  171.0956 173.6661
## sample estimates:
## mean of height.response 
##                172.3809

Rata-Rata Populasi (Sigma Tidak Diketahui)

Misalkan \(100(1-\sigma/2)\) persentil Student T dengan \(n-1\) derajat kebebasan sebagai \(t\sigma/2\). Untuk sampel acak dengan ukuran yang cukup besar, dan dengan simpangan baku \(s\), titik akhir estimasi interval di \((1-\sigma)\) tingkat kepercayaan

Kasus 16

Tanpa mengasumsikan simpangan baku populasi \(\sigma\) dari tinggi siswa dalam survei, temukan margin kesalahan dan perkiraan interval pada tingkat kepercayaan 95%.

library(MASS)                                          # load the MASS package data set survey
height.response = na.omit(survey$Height)               # filter out missing values in Height
n = length(height.response)                            # assign the length of response
s = 9.48                                               # sample standard deviation 
SE = s/sqrt(n)                                         # standard error estimate
E = qt(.975, df=n-1)*SE; E                             # margin of error (upper tail 95% of CI)
## [1] 1.292759
xbar = mean(height.response); xbar                     # sample mean 
## [1] 172.3809
xbar + c(-E, E)                                        # confidence interval as told
## [1] 171.0881 173.6736

Tanpa asumsi deviasi standar populasi, margin kesalahan untuk survei tinggi badan siswa pada tingkat kepercayaan 95% adalah 1,3429 sentimeter. Interval kepercayaan adalah antara 171,04 dan 173,72 sentimeter.
Solusi alternatif: Alih-alih menggunakan rumus buku teks, kita dapat menerapkan fungsi t.test dalam paket statistik bawaan.

library(stats)                                         # load stats package 
t.test(height.response)                                # apply the z.test
## 
##  One Sample t-test
## 
## data:  height.response
## t = 253.07, df = 208, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  171.0380 173.7237
## sample estimates:
## mean of x 
##  172.3809

Ukuran Sampling Rata-rata Populasi (Sigma Dikenal)

\[ n=\frac{(z_{\sigma/2})^2\sigma^2}{E^2} \] Dengan menggunakan rumus diatas untuk memberikan ukuran sampel yang dibutuhkan di bawah persyaratan estimasi interval rata-rata populasi pada \((1-\sigma)\) tingkat kepercayaan, margin of Error\(E\) dan varians populasi \(\sigma^2\).

Kasus 17

Asumsikan simpangan baku populasi σ tinggi siswa dalam survei adalah 9,48. Temukan ukuran sampel yang diperlukan untuk mencapai margin kesalahan 1,2 cm pada tingkat kepercayaan 95%.

zstar = qnorm(.975)                                    # quantiles (95% confidence level)
sigma = 9.48                                           # assume population standard deviation 
E = 1.2                                                # expected error
zstar^2*sigma^2/ E^2                                   # sampling size 
## [1] 239.7454

Berdasarkan asumsi simpangan baku populasi sebesar 9,48, diperlukan ukuran sampel 240 untuk mencapai margin of error 1,2 cm pada tingkat kepercayaan 95%

Latihan 6

Tingkatkan kualitas survei sampel dengan meningkatkan ukuran sampel dengan standar deviasi yang tidak diketahui \(\sigma\)!

zstar = qnorm(.975)
sigma = 9.48
E = 1.                                               
zstar^2*sigma^2/ E^2
## [1] 345.2334

Titik Estimasi Proporsi Penduduk

Misalnya, kita dapat memperkirakan proporsi mahasiswi di universitas berdasarkan hasil survei kumpulan data sampel.

library(MASS)                                          # load the MASS package 
gender.response = na.omit(survey$Sex)                  # filter out missing values in `gender`
n = length(gender.response)                            # valid responses count

Untuk mengetahui jumlah siswa perempuan, kita membandingkan respon gender dengan faktor Female, dan menghitung sum. Membaginya dengan \(n\) memberikan proporsi siswa perempuan dalam survei sampel.

library(MASS)                                          # load the MASS package 
k = sum(gender.response == "Female")                   # the sum of female responses
pbar = k/n; pbar                                       # female student proportion in survey
## [1] 0.5

Estimasi Interval Proporsi Penduduk

Jika ukuran sampel n dan proporsi populasi p memenuhi syarat bahwa \(np>=5\) dan \(n(1-p)>=5\) dari titik akhir estimasi interval di \((1-\sigma)\) tingkat kepercayaan didefenisikan dalam hal proporsi sampel sebagai berikut

\[ \bar{p}±z_{\sigma/2}\sqrt{\frac{\bar{p}(1-\bar{p})}{n}} \]

Kasus 18

Hitunglah margin of error dan estimasi interval untuk proporsi siswa perempuan dalam survei pada tingkat kepercayaan 95%.

library(MASS)                                          # load the MASS package 
k = sum(gender.response == "Female")                   # the sum of female responses
pbar = k/n                                             # female student proportion in survey
SE = sqrt(pbar*(1-pbar)/n); SE                         # standard error 
## [1] 0.03254723
E = qnorm(.975)*SE; E                                  # margin of error
## [1] 0.06379139
pbar + c(-E, E)                                        # the CI of sample proportion
## [1] 0.4362086 0.5637914

Pada tingkat kepercayaan 95%, antara 43,6% dan 56,3% mahasiswa adalah perempuan, dan margin kesalahannya adalah 6,4%.
Solusi alternatif: Alih-alih menggunakan rumus buku teks, kita dapat menerapkan prop.test fungsi dalam stats paket bawaan.

library(stats)                                         # load the MASS package 
prop.test(k, n)                                        # the interval estimate of proportion
## 
##  1-sample proportions test without continuity correction
## 
## data:  k out of n, null probability 0.5
## X-squared = 0, df = 1, p-value = 1
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.4367215 0.5632785
## sample estimates:
##   p 
## 0.5

Ukuran Sampel Proporsi Populasi

Rumus dibawah ini memberikan ukuran sampel yang dibutuhkan di bawah persyaratan perkiraan interval proporsi populasi pada \((1-\sigma)\) tingkat kepercayaan, margin of error \(E\) dan perkiraan proporsi yang direncanakan \(p\).

\[ n=\frac{(z_\sigma/2)^2p(1-p)}{E^2} \]

Kasus 19

Dengan menggunakan perkiraan proporsi 50% yang direncanakan, temukan ukuran sampel yang diperlukan untuk mencapai margin kesalahan 5% untuk survei siswa perempuan pada tingkat kepercayaan 95%.

zstar = qnorm(.975)                                    # quantiles (95% confidence level)
p = 0.5                                                # 50% planned proportion estimate
E = 0.05                                               # expected error
zstar^2*p*(1-p)/E^2                                    # sampling size
## [1] 384.1459

Latihan 7

Asumsikan Anda tidak memiliki perkiraan proporsi yang direncanakan, temukan ukuran sampel yang diperlukan untuk mencapai margin kesalahan 5% untuk survei siswa laki-laki pada tingkat kepercayaan 95%!

zstar = qnorm(.975) 
sigma = .975 
E = 0.05 
zstar^2/E^2
## [1] 1536.584

Latihan 8

Lakukan analisis interval kepercayaan pada kumpulan data ini dari tahun 2004 yang mencakup data pendapatan rata-rata per jam, status perkawinan, jenis kelamin, dan usia ribuan orang.

cps = read.csv("cps04.csv")
mean(cps$age, na.rm=TRUE)
## [1] 29.75445
p.test <- t.test(cps$age, conf.level = 0.95)
p.test$conf.int
## [1] 29.69103 29.81786
## attr(,"conf.level")
## [1] 0.95

Dengan keyakinan 95% disimpulkan bahwa perkiraan interval mencakup rata-rata populasi umur yang sebenarnya.

t.test(cps$age)
## 
##  One Sample t-test
## 
## data:  cps$age
## t = 919.71, df = 7985, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  29.69103 29.81786
## sample estimates:
## mean of x 
##  29.75445

Proporsi Populasi

fm = cps$female
le = length(fm)
su = sum(fm == "1")
pbar = su/le; pbar
## [1] 0.414851

Interval proporsi populasi

prop.test(su, le)
## 
##  1-sample proportions test with continuity correction
## 
## data:  su out of le, null probability 0.5
## X-squared = 231.26, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.4040262 0.4257582
## sample estimates:
##        p 
## 0.414851

Disimpulkan bahwa antara 40.4% dan 42.6% data adalah perempuan.