課堂上老師強調所謂的“95%信賴區間”這95%不表示機率,而是信心,所以今天我們利用R語言來設計一個小迴圈來實際操作。
就以課堂上Doll電腦公司的題目作為例子,觀察25段的前置時間的需求量並且計算其平均數與給定的母體標準差,進行100次的實際抽樣。
c_mean <- 370.16 #樣本平均數
c_sd <- 75 #給定標準差
n <- 25 #樣本
plot(x=c(300,450), #劃出一個空白兩個維度的框架,X座標為300~450
y=c(0,110), #訂出Y軸的座標為0~110
type = "n") #不畫任何點或線
abline(v = c_mean, #劃出平均數位置的線
lty = 2, #選擇虛線
col = "red") #選擇紅色
for(i in 1:100)
{
x = rnorm(25 , c_mean , c_sd) #隨機產生一組以(n,c_mean,c_sd)為參數
width = qt(0.975 , n-1)*sd(x)/sqrt(n) #計算95%信賴區間估計誤差的界線(bound on the error of estimation)
left = mean(x)-width #信賴區間下限(Lower confidence limit)
right = mean(x)+width #信賴區間上限(Upper confidence limit)
if (c_mean >= left && c_mean <= right) #抽樣結果落在區間內
{ lines(c(left,right), #X軸位置連接上下限
c(i,i), #Y軸位置連接上下限
lty = 2) #選擇虛線
}
else #抽樣結果不落在區間內
{
lines(c(left,right), #X軸位置連接上下限
c(i,i), #Y軸位置連接上下限
lty = 1, #選擇實線
lwd = 2) #選擇兩倍線寬
}
}
利用100次的迴圈可以看出來每次的結果位置都有些許差異,但是整體而言可以利用實線(不落在區域內)與虛線(落在區域內)可以看出課堂上所強調的“信心”,希望讀者可以藉此R中的迴圈函式對於信賴區間定義更為了解。
本篇筆記參考“R軟體:應用統計方法”(作者:陳景祥)