Problem von statistik-forum.de

Aus einer sehr großen Grundgesamtheit (13.000 - wir setzen hier: unendlich groß) werden 100 Stichproben gezogen. Jede Stichprobe ist entweder fehlerhaft oder fehlerfrei. Wie verlässlich ist die Aussage aus dieser Stichprobe hinsichtlich der wahren Verteilung in der Grundgesamtheit?

is <- 1:20
cis <- sapply(is, FUN = function(n) binom.test(n, 100)$conf.int)
plot(is, is/100, type="p", ylim=c(0,.30), 
     xlab="Fehlerhafte aus 100", 
     ylab="95%-KI für Anteil der Fehlerhaften")
d <- sapply(1:length(is), function(i){
        lines(c(is[i],is[i]), c(cis[1,i],cis[2,i]))
        return(abs(cis[1,i]-cis[2,i]))
      })

print(data.frame(Fehler=is, BreiteDesKI=round(d,3)))
##    Fehler BreiteDesKI
## 1       1       0.054
## 2       2       0.068
## 3       3       0.079
## 4       4       0.088
## 5       5       0.096
## 6       6       0.104
## 7       7       0.110
## 8       8       0.116
## 9       9       0.122
## 10     10       0.127
## 11     11       0.132
## 12     12       0.137
## 13     13       0.141
## 14     14       0.145
## 15     15       0.149
## 16     16       0.152
## 17     17       0.156
## 18     18       0.159
## 19     19       0.162
## 20     20       0.165