信賴區間

課堂上老師強調所謂的“95%信賴區間”這95%不表示機率,而是信心,所以今天我們利用R語言來設計一個小迴圈來實際操作。

就以課堂上Doll電腦公司的題目作為例子,觀察25段的前置時間的需求量並且計算其平均數與給定的母體標準差,進行100次的實際抽樣。

c_mean <- 370.16    #樣本平均數
c_sd <- 75          #給定標準差
n <- 25             #樣本

plot(x=c(300,450),  #劃出一個空白兩個維度的框架,X座標為300~450
     y=c(0,110),    #訂出Y軸的座標為0~110
     type = "n")    #不畫任何點或線

abline(v = c_mean,  #劃出平均數位置的線
       lty = 2,     #選擇虛線
       col = "red") #選擇紅色

for(i in 1:100)
{
  x = rnorm(25 , c_mean , c_sd)           #隨機產生一組以(n,c_mean,c_sd)為參數
  
  width = qt(0.975 , n-1)*sd(x)/sqrt(n)  #計算95%信賴區間估計誤差的界線(bound on the error of estimation)

  
  left = mean(x)-width                   #信賴區間下限(Lower confidence limit) 
  right = mean(x)+width                  #信賴區間上限(Upper confidence limit) 
  
  if (c_mean >= left && c_mean <= right) #抽樣結果落在區間內
  { lines(c(left,right),                 #X軸位置連接上下限
          c(i,i),                        #Y軸位置連接上下限
          lty = 2)                       #選擇虛線                  
  }
  else                                   #抽樣結果不落在區間內
  {
    lines(c(left,right),                 #X軸位置連接上下限
          c(i,i),                        #Y軸位置連接上下限
          lty = 1,                       #選擇實線
          lwd = 2)                       #選擇兩倍線寬
  }

}

利用100次的迴圈可以看出來每次的結果位置都有些許差異,但是整體而言可以利用實線(不落在區域內)與虛線(落在區域內)可以看出課堂上所強調的“信心”,希望讀者可以藉此R中的迴圈函式對於信賴區間定義更為了解。

參考資料

本篇筆記參考“R軟體:應用統計方法”(作者:陳景祥)