經驗分配函數 (Empirical Distribution function)

實務上取得之統計資料,無法確認資料之特徵與機率分佈。可先透過頻率分配 (Frequency Distribution)、累積相對頻率分配 (Cumulative Relative Frequency Distribution)、q-q plot (Quantile-Quantile Plot) 等方法進一步確認


經驗累積分配函數(Empirical cumulative distribution function, e.c.d.f.)

ecdf 也是 R 繪製經驗累積分配函數的指令


R 指令所使用的機率分配縮寫與 d、p、q、r (極為重要!!)

d : density 密度、機率函數在某點的高度,對離散型機率分配而言即該點機率
p : c.d.f  累積分配函數,累積(離散:加總、連續:積分)到某個點為止的機率
q : quantile 可以給機率查分位數 
r : random 隨機、模擬,可產生特定機率分配之模擬樣本  


讓R隨機產生50筆來自標準常態分配的資料,繪直方圖,並執行 ecdf、qqnorm、qqline 檢驗

x <- rnorm(50)
hist(x)

plot(ecdf(x), do.point=F, verticals=T)  # 不要點,要垂直階梯

qqnorm(x)
qqline(x)

讓R隨機產生50筆來自常態分配 \(N(60,10^2)\) 的資料,繪直方圖,並執行 ecdf、qqnorm、qqline 檢驗

x <- rnorm(50,60,10)
hist(x)

plot(ecdf(x), do.point=F, verticals=T)  # 不要點,要垂直階梯

qqnorm(x)
qqline(x)

讓R隨機產生100位同學 (亂猜選擇題) 來自二項分配 \(B(20, \frac{1}{4}\)) 的資料,繪直方圖,並執行 ecdf、qqnorm、qqline 檢驗

x <- rbinom(100, 20 ,1/4)
hist(x)

plot(ecdf(x), do.point=F, verticals=T)  # 不要點,要垂直階梯

qqnorm(x)
qqline(x)

常態分配經驗法則檢驗 (以上述二項分配結果為例) ,平均數 \(\mu=20*\frac{1}{4}=5\),標準差 \(\sigma=\sqrt{\frac{15}{4}}\)

x1 <- length(x[x[]< 5+1*sqrt(15/4)])-length(x[x[]< 5-1*sqrt(15/4)])
x2 <- length(x[x[]< 5+2*sqrt(15/4)])-length(x[x[]< 5-2*sqrt(15/4)])
x3 <- length(x[x[]< 5+3*sqrt(15/4)])-length(x[x[]< 5-3*sqrt(15/4)])

x1 / 100 * 100 
## [1] 56
x2 / 100 * 100 
## [1] 92
x3 / 100 * 100 
## [1] 100