Napaka ocene variabilnosti

Author: A. Blejec

Abstract

Opisali bomo, kako je s širino intervaalov zaupanja pri različnih velikostih vzorcev.

Intervali zaupanja

Kako je s širino intervaalov zaupanja pri različnih velikostih vzorcev? To vprašanje je povezano s širino vzorčne porazdelitve med kvantiloma (npr. \( q_{0.025} \) in \( q_{0.975} \))

Oglejmo si, kako se spreminja širina vzorčne porazdelitve. Brez škode lahko smatramo, da je prava varianca enaka 1. Interval zaupanja za standardni odklon lahko izračunamo s korenjenjem mej intervalka zaupanja za varianco

alpha <- 0.05
nmax <- 400
ns <- 2:nmax
qhigh <- sqrt(ns/qchisq(alpha/2, ns))
qlow <- sqrt(ns/qchisq(1 - alpha/2, ns))

Narišimo:

plot(ns, qlow, type = "l", xlab = "n", ylab = "Kvantili", ylim = c(0, 5))
lines(ns, qhigh)
segments(ns, qlow, ns, qhigh)
abline(h = 1, lwd = 2, col = "red")

plot of chunk unnamed-chunk-2

Narišimo še odvisnost dejanske širine od velikosti vzorca.

plot(ns, qhigh - qlow, type = "l", xlab = "n", ylab = "Širina intervala", ylim = c(0, 
    1))
n0 <- 300
abline(v = n0)
d300 <- approx(ns, qhigh - qlow, n0)$y
abline(h = d300)

plot of chunk unnamed-chunk-3

d300

## [1] 0.161

Širina 0.95% intervala zaupanja pri n=300 je 16% standardnega odklona. Napaka je torej 8%.