Populationsvarianz vs. Stichprobenvarianz
Eine öfter wiederkehrende Frage ist, weshalb bei der Varianz einer
Stichprobe als Divisor nicht \(n\)
sondern \(n - 1\) eingesetzt ist. Mit
einer Stichprobe schätzen wir auf die Kennzahlen einer Population.
Erfahrungsgemäss unterschätzt die Stichprobenvarianz mit Divisor \(n\) die Varianz in der Population . Das kann
sogar mathematisch bewiesen werden und wer sich das antun will, kann das
hier im schlauen Wikipedia:
Bessel’s correction nachlesen. Aber ehrlich gesagt, wer will sich
das antun? Vielleicht hilft folgende Überlegung: Die Populationsvarianz
spielt in der Inferenzstatistik eine enorm wichtige Rolle, daher ist es
von Bedeutung, dass sie möglichst genau aus einer Stichprobe geschätzt
werden kann. Wenn ich den Divisor \(n\)
durch \(n - 1\) ersetze, erhalte ich
generell immer eine etwas grössere Stichprobenvarianz, weil der Dividend
(die Quadratsumme der Abweichungen in der Stichprobe … schon wird’s
kompliziert) durch eine etwas kleinere Zahl geteilt wird. Wenn ich
demnach \(n - 1\) verwende, korrigiere
ich für die Erfahrung, dass eine Stichprobe die Varianz im Durchschnitt
unterschätzt.
Dass dieses Vorgehen in der Regel eine etwas genauere Schätzung der
Varianz erlaubt, können wir anhand einer einfachen Simulation am
Computer zeigen.
Hier nochmals die Formeln für die Berechnung der Varianzen:
Populationsvarianz (var.pop)
\[\sigma^2 = \frac{\Sigma_{x=1}^N(x_i -
\mu)}{N}\]
Stichprobenvarianz (var.n, mit Divisor n)
\[s^2_n = \frac{\Sigma_{x=1}^n(x_i -
\bar{x})}{n}\]
Stichprobenvarianz (var.unbiased, mit Divisor n-1)
\[s^2_{n-1} = \frac{\Sigma_{x=1}^n(x_i -
\bar{x})}{n-1}\]
Simulation 1
Wir simulieren eine Population mit N = 10000, \(\mu = 100\) und \(s = 15\)

Stichproben
Wir ziehen 25 Zufallsstichproben im Umfang von n = 50 aus der
Population und berechnen die Varianz der Stichprobe var.n
und die unbiased Varianz var.unbiased. var.pop
= Populationsvarianz = 219.4013.
25 samples, n = 30
|
var.pop
|
var.n
|
var.unbiased
|
|
219.4013
|
237.8697
|
246.0721
|
|
219.4013
|
160.1286
|
165.6503
|
|
219.4013
|
260.1223
|
269.0920
|
|
219.4013
|
217.8190
|
225.3300
|
|
219.4013
|
248.1862
|
256.7444
|
|
219.4013
|
164.4608
|
170.1319
|
|
219.4013
|
161.7295
|
167.3064
|
|
219.4013
|
230.0103
|
237.9417
|
|
219.4013
|
200.3658
|
207.2750
|
|
219.4013
|
156.3968
|
161.7898
|
|
219.4013
|
285.1506
|
294.9834
|
|
219.4013
|
122.5163
|
126.7410
|
|
219.4013
|
196.6853
|
203.4676
|
|
219.4013
|
238.3174
|
246.5352
|
|
219.4013
|
202.8883
|
209.8845
|
|
219.4013
|
274.2226
|
283.6786
|
|
219.4013
|
174.9522
|
180.9850
|
|
219.4013
|
161.1676
|
166.7251
|
|
219.4013
|
167.2376
|
173.0044
|
|
219.4013
|
171.9593
|
177.8889
|
|
219.4013
|
211.1690
|
218.4507
|
|
219.4013
|
242.6332
|
250.9998
|
|
219.4013
|
245.0741
|
253.5250
|
|
219.4013
|
303.6018
|
314.0709
|
|
219.4013
|
180.6703
|
186.9003
|
Zusammenfassung
|
var.pop
|
mean.var.n
|
mean.var.ub
|
|
219.4013
|
208.6134
|
215.807
|
Simulation mit 1000 Stichproben mit n = 100
Die Stichproben ziehen wir aus der gleichen Population wie bei
Simulation 1.
Erste 10 Samples von 1000, n = 100
|
var.pop
|
var.n
|
var.unbiased
|
|
219.4013
|
195.2076
|
197.1794
|
|
219.4013
|
242.2348
|
244.6816
|
|
219.4013
|
258.6176
|
261.2299
|
|
219.4013
|
171.6173
|
173.3508
|
|
219.4013
|
258.1406
|
260.7481
|
|
219.4013
|
169.8716
|
171.5874
|
|
219.4013
|
237.3372
|
239.7345
|
|
219.4013
|
198.7594
|
200.7670
|
|
219.4013
|
259.4138
|
262.0341
|
|
219.4013
|
223.0196
|
225.2724
|
Zusammenfassung
|
var.pop
|
mean.var.n
|
mean.var.ub
|
|
219.4013
|
216.8871
|
219.0779
|
Wir sehen bei beiden Simulationen, dass beide Arten, die
Stichprobenvarianz zu berechnen, die Populationsvarianz unterschätzen.
Allerdings liegt die Berechnung der Varianz mit dem Divisor \(n - 1\) (mean.var.ub) im
Durchschnitt näher bei der wahren Populationsvarianz als die Berechnung
mit dem Divisor \(n\)
(mean.var.n).
LS0tDQp0aXRsZTogIlVuYmlhc2VkIFNhbXBsZSBWYXJpYW5jZSINCmF1dGhvcjogIkx1a2FzIFN0YW1tbGVyIg0KZGF0ZTogImByIFN5cy5EYXRlKClgIg0Kb3V0cHV0Og0KICBodG1sX2RvY3VtZW50Og0KICAgIGZpZ19oZWlnaHQ6IDQNCiAgICBmaWdfd2lkdGg6IDQNCiAgICBmaWdfYWxpZ246ICJjZW50ZXIiDQogICAgaGlnaGxpZ2h0OiBweWdtZW50cw0KICAgIHRoZW1lOiB5ZXRpDQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQ0KLS0tDQoNCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQ0Kcm0obGlzdCA9IGxzKCkpDQoNCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gRkFMU0UsIG1lc3NhZ2UgPSBGQUxTRSwgd2FybmluZyA9IEZBTFNFKQ0KDQpsaWJyYXJ5KHRpZHl2ZXJzZSkNCmxpYnJhcnkoa25pdHIpDQpsaWJyYXJ5KGthYmxlRXh0cmEpDQpgYGANCg0KDQojIFBvcHVsYXRpb25zdmFyaWFueiB2cy4gU3RpY2hwcm9iZW52YXJpYW56IA0KDQpFaW5lIMO2ZnRlciB3aWVkZXJrZWhyZW5kZSBGcmFnZSBpc3QsIHdlc2hhbGIgYmVpIGRlciBWYXJpYW56IGVpbmVyIFN0aWNocHJvYmUgYWxzIERpdmlzb3IgbmljaHQgJG4kIHNvbmRlcm4gJG4gLSAxJCBlaW5nZXNldHp0IGlzdC4gTWl0IGVpbmVyIFN0aWNocHJvYmUgc2Now6R0emVuIHdpciBhdWYgZGllIEtlbm56YWhsZW4gZWluZXIgUG9wdWxhdGlvbi4gRXJmYWhydW5nc2dlbcOkc3MgdW50ZXJzY2jDpHR6dCBkaWUgU3RpY2hwcm9iZW52YXJpYW56IG1pdCBEaXZpc29yICRuJCBkaWUgVmFyaWFueiBpbiBkZXIgUG9wdWxhdGlvbiBeW0JlZ3LDvG5kdW5nOiBEaWUgQWJ3ZWljaHVuZyB2b24gRXh0cmVtd2VydGVuIHZvbSBNaXR0ZWx3ZXJ0IHdpcmQgaW0gUXVhZHJhdCBpbiBkaWUgQmVyZWNobnVuZyBkZXIgUG9wdWxhdGlvbnN2YXJpYW56IGVpbmJlem9nZW47IGR1cmNoIGRpZSBRdWFkcmllcnVuZyBkaWVzZXIgQWJ3ZWljaHVuZyBlcmhhbHRlbiBFeHRyZW13ZXJ0ZSBlaW4gZ3Jvc3NlcyBHZXdpY2h0IGJlaSBkZXIgQmVyZWNobnVuZyBkZXIgUG9wdWxhdGlvbnN2YXJpYW56LiBEYSBFeHRyZW13ZXJ0ZSB3ZXNlbnRsaWNoIHNlbHRlbmVyIHZvcmtvbW1lbiBhbHMgV2VydGUgaW0gWmVudHJ1bSBkZXIgVmVydGVpbHVuZywgaXN0IGRpZSBXYWhyc2NoZWlubGljaGtlaXQsIGRhc3MgRXh0cmVtd2VydGUgaW4gZWluZXIgWnVmYWxsc3N0aWNocHJvYmUgdm9ya29tbWVuIGVoZXIga2xlaW4sIHdvZHVyY2ggZGllIFN0aWNocHJvYmVudmFyaWFueiB0eXBpc2NoZXJ3ZWlzZSBrbGVpbmVyIGlzdCwgYWxzIGRpZSBQb3B1bGF0aW9uc3ZhcmlhbnouIDxicj4gXS4gRGFzIGthbm4gc29nYXIgbWF0aGVtYXRpc2NoIGJld2llc2VuIHdlcmRlbiB1bmQgd2VyIHNpY2ggZGFzIGFudHVuIHdpbGwsIGthbm4gZGFzIGhpZXIgaW0gc2NobGF1ZW4gW1dpa2lwZWRpYTogQmVzc2VsJ3MgY29ycmVjdGlvbl0oaHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvQmVzc2VsJTI3c19jb3JyZWN0aW9uKSBuYWNobGVzZW4uIEFiZXIgZWhybGljaCBnZXNhZ3QsIHdlciB3aWxsIHNpY2ggZGFzIGFudHVuPyBWaWVsbGVpY2h0IGhpbGZ0IGZvbGdlbmRlIMOcYmVybGVndW5nOiBEaWUgUG9wdWxhdGlvbnN2YXJpYW56IHNwaWVsdCBpbiBkZXIgSW5mZXJlbnpzdGF0aXN0aWsgZWluZSBlbm9ybSB3aWNodGlnZSBSb2xsZSwgZGFoZXIgaXN0IGVzIHZvbiBCZWRldXR1bmcsIGRhc3Mgc2llIG3DtmdsaWNoc3QgZ2VuYXUgYXVzIGVpbmVyIFN0aWNocHJvYmUgZ2VzY2jDpHR6dCB3ZXJkZW4ga2Fubi4gV2VubiBpY2ggZGVuIERpdmlzb3IgJG4kIGR1cmNoICRuIC0gMSQgZXJzZXR6ZSwgZXJoYWx0ZSBpY2ggZ2VuZXJlbGwgaW1tZXIgZWluZSBldHdhcyBncsO2c3NlcmUgU3RpY2hwcm9iZW52YXJpYW56LCB3ZWlsIGRlciBEaXZpZGVuZCAoZGllIFF1YWRyYXRzdW1tZSBkZXIgQWJ3ZWljaHVuZ2VuIGluIGRlciBTdGljaHByb2JlIC4uLiBzY2hvbiB3aXJkJ3Mga29tcGxpemllcnQpIGR1cmNoIGVpbmUgZXR3YXMga2xlaW5lcmUgWmFobCBnZXRlaWx0IHdpcmQuIFdlbm4gaWNoIGRlbW5hY2ggJG4gLSAxJCB2ZXJ3ZW5kZSwga29ycmlnaWVyZSBpY2ggZsO8ciBkaWUgRXJmYWhydW5nLCBkYXNzIGVpbmUgU3RpY2hwcm9iZSBkaWUgVmFyaWFueiBpbSBEdXJjaHNjaG5pdHQgdW50ZXJzY2jDpHR6dC4gICANCg0KRGFzcyBkaWVzZXMgVm9yZ2VoZW4gaW4gZGVyIFJlZ2VsIGVpbmUgZXR3YXMgZ2VuYXVlcmUgU2Now6R0enVuZyBkZXIgVmFyaWFueiBlcmxhdWJ0LCBrw7ZubmVuIHdpciBhbmhhbmQgZWluZXIgZWluZmFjaGVuIFNpbXVsYXRpb24gYW0gQ29tcHV0ZXIgemVpZ2VuLiAgDQoNCkhpZXIgbm9jaG1hbHMgZGllIEZvcm1lbG4gZsO8ciBkaWUgQmVyZWNobnVuZyBkZXIgVmFyaWFuemVuOg0KDQpQb3B1bGF0aW9uc3ZhcmlhbnogKHZhci5wb3ApDQoNCiQkXHNpZ21hXjIgPSBcZnJhY3tcU2lnbWFfe3g9MX1eTih4X2kgLSBcbXUpfXtOfSQkDQoNClN0aWNocHJvYmVudmFyaWFueiAodmFyLm4sIG1pdCBEaXZpc29yIG4pIA0KDQokJHNeMl9uID0gXGZyYWN7XFNpZ21hX3t4PTF9Xm4oeF9pIC0gXGJhcnt4fSl9e259JCQNCg0KU3RpY2hwcm9iZW52YXJpYW56ICh2YXIudW5iaWFzZWQsIG1pdCBEaXZpc29yIG4tMSkgDQoNCiQkc14yX3tuLTF9ID0gXGZyYWN7XFNpZ21hX3t4PTF9Xm4oeF9pIC0gXGJhcnt4fSl9e24tMX0kJA0KDQojIFNpbXVsYXRpb24gMQ0KDQpXaXIgc2ltdWxpZXJlbiBlaW5lIFBvcHVsYXRpb24gbWl0IE4gPSAxMDAwMCwgJFxtdSA9IDEwMCQgdW5kICRzID0gMTUkDQoNCmBgYHtyLCBmaWcuZGltPWMoNiwgNSksIGZpZy5hbGlnbj0nY2VudGVyJ30NCnNldC5zZWVkKDEyMzQpDQpwb3AgPC0gcm5vcm0oMTAwMDAsIG1lYW4gPSAxMDAsIHNkID0gMTUpDQptdSA8LSByb3VuZChtZWFuKHBvcCksIDIpDQpzaWdtYSA8LSByb3VuZChzZChwb3ApLCAyKQ0KdGl0ZWwgPC0gcGFzdGUoIlBvcHVsYXRpb24gbWl0IG11ID0iLCBtdSwgIiwgc2lnbWEgPSAiLCBzaWdtYSwgIiwgTiA9IDEwJzAwMCIgKQ0KDQpoaXN0KHBvcCwNCiAgICAgbWFpbiA9IHRpdGVsLA0KICAgICB5bGFiID0gIkjDpHVmaWdrZWl0IiwNCiAgICAgeGxhYiA9ICIiLA0KICAgICBjb2wgPSAic3RlZWxibHVlIikNCg0KdmFyLnBvcCA8LSBzdW0oKHBvcCAtIG1lYW4ocG9wKSleMikvbGVuZ3RoKHBvcCkNCnZhci5wb3AgPC0gcm91bmQodmFyLnBvcCwgNCkNCmBgYA0KDQojIyBTdGljaHByb2Jlbg0KDQpXaXIgemllaGVuIDI1IFp1ZmFsbHNzdGljaHByb2JlbiBpbSBVbWZhbmcgdm9uIG4gPSA1MCBhdXMgZGVyIFBvcHVsYXRpb24gdW5kIGJlcmVjaG5lbiBkaWUgDQpWYXJpYW56IGRlciBTdGljaHByb2JlIGB2YXIubmAgdW5kIGRpZSB1bmJpYXNlZCBWYXJpYW56IGB2YXIudW5iaWFzZWRgLiBgdmFyLnBvcGAgPSBQb3B1bGF0aW9uc3ZhcmlhbnogPSBgciB2YXIucG9wYC4NCg0KYGBge3J9DQp2YXIubi5mdW4gPC0gZnVuY3Rpb24oeCkgIHsNCiAgdmFyLm4gPC0gc3VtKCh4IC0gbWVhbih4KSleMikvbGVuZ3RoKHgpDQogIHJldHVybih2YXIubikNCn0NCiMgdmFyLm4uZnVuKHgpDQogIA0KdmFyLnVuYmlhc2VkLmZ1biA8LSBmdW5jdGlvbih4KSB7DQogIHZhci51bmJpYXNlZCA8LSBzdW0oKHggLSBtZWFuKHgpKV4yKS8obGVuZ3RoKHgpIC0gMSkNCiAgcmV0dXJuKHZhci51bmJpYXNlZCkNCn0NCiMgdmFyLnVuYmlhc2VkLmZ1bih4KQ0KDQp2YXIubiA8LSB2ZWN0b3IoKQ0KdmFyLnVuYmlhc2VkIDwtIHZlY3RvcigpDQoNCmZvciAoaSBpbiAxOjI1KSB7DQogIHkgPC0gc2FtcGxlKHBvcCwgc2l6ZSA9IDMwKQ0KICB2YXIubltpXSA8LSB2YXIubi5mdW4oeSkNCiAgdmFyLnVuYmlhc2VkW2ldIDwtIHZhci51bmJpYXNlZC5mdW4oeSkNCn0NCg0KcmVzdWx0IDwtIHRpYmJsZSgNCiAgdmFyLnBvcCA9IHJlcCh2YXIucG9wLCAyNSksDQogIHZhci5uID0gdmFyLm4sDQogIHZhci51bmJpYXNlZCA9IHZhci51bmJpYXNlZA0KKQ0KDQoNCmthYmxlKHJlc3VsdCwgY2FwdGlvbiA9ICIyNSBzYW1wbGVzLCBuID0gMzAiKSAlPiUgDQogIGthYmxlX3N0eWxpbmcoZnVsbF93aWR0aCA9IEZBTFNFKQ0KDQptLnZhci5uIDwtIG1lYW4ocmVzdWx0JHZhci5uKQ0KbS52YXIudWIgPC0gbWVhbihyZXN1bHQkdmFyLnVuYmlhc2VkKQ0KDQpyZXN1bHQuc3VtbWFyeSA8LSB0aWJibGUoDQogIHZhci5wb3AgPSB2YXIucG9wLA0KICBtZWFuLnZhci5uID0gbS52YXIubiwNCiAgbWVhbi52YXIudWIgPSBtLnZhci51Yg0KKQ0KDQpyZXN1bHQuc3VtbWFyeSAlPiUgDQogIGthYmxlKGNhcHRpb24gPSAiWnVzYW1tZW5mYXNzdW5nIikgJT4lIA0KICBrYWJsZV9zdHlsaW5nKGZ1bGxfd2lkdGggPSBGQUxTRSkNCmBgYA0KDQojIFNpbXVsYXRpb24gbWl0IDEwMDAgU3RpY2hwcm9iZW4gbWl0IG4gPSAxMDANCg0KRGllIFN0aWNocHJvYmVuIHppZWhlbiB3aXIgYXVzIGRlciBnbGVpY2hlbiBQb3B1bGF0aW9uIHdpZSBiZWkgU2ltdWxhdGlvbiAxLg0KDQpgYGB7cn0NCnZhci5uIDwtIHZlY3RvcigpDQp2YXIudW5iaWFzZWQgPC0gdmVjdG9yKCkNCg0KZm9yIChpIGluIDE6MTAwMCkgew0KICB5IDwtIHNhbXBsZShwb3AsIHNpemUgPSAxMDApDQogIHZhci5uW2ldIDwtIHZhci5uLmZ1bih5KQ0KICB2YXIudW5iaWFzZWRbaV0gPC0gdmFyLnVuYmlhc2VkLmZ1bih5KQ0KfQ0KDQpyZXN1bHQgPC0gdGliYmxlKA0KICB2YXIucG9wID0gcmVwKHZhci5wb3AsIDEwMDApLA0KICB2YXIubiA9IHZhci5uLA0KICB2YXIudW5iaWFzZWQgPSB2YXIudW5iaWFzZWQNCikNCg0KDQprYWJsZShyZXN1bHRbMToxMCxdLCBjYXB0aW9uID0gIkVyc3RlIDEwIFNhbXBsZXMgdm9uIDEwMDAsIG4gPSAxMDAiKSAlPiUgDQogIGthYmxlX3N0eWxpbmcoZnVsbF93aWR0aCA9IEZBTFNFKQ0KDQptLnZhci5uIDwtIG1lYW4ocmVzdWx0JHZhci5uKQ0KbS52YXIudWIgPC0gbWVhbihyZXN1bHQkdmFyLnVuYmlhc2VkKQ0KDQpyZXN1bHQuc3VtbWFyeSA8LSB0aWJibGUoDQogIHZhci5wb3AgPSB2YXIucG9wLA0KICBtZWFuLnZhci5uID0gbS52YXIubiwNCiAgbWVhbi52YXIudWIgPSBtLnZhci51Yg0KKQ0KDQpyZXN1bHQuc3VtbWFyeSAlPiUgDQogIGthYmxlKGNhcHRpb24gPSAiWnVzYW1tZW5mYXNzdW5nIikgJT4lIA0KICBrYWJsZV9zdHlsaW5nKGZ1bGxfd2lkdGggPSBGQUxTRSkNCmBgYA0KDQpXaXIgc2VoZW4gYmVpIGJlaWRlbiBTaW11bGF0aW9uZW4sIGRhc3MgYmVpZGUgQXJ0ZW4sIGRpZSBTdGljaHByb2JlbnZhcmlhbnogenUgYmVyZWNobmVuLCBkaWUgUG9wdWxhdGlvbnN2YXJpYW56IHVudGVyc2Now6R0emVuLiBBbGxlcmRpbmdzIGxpZWd0IGRpZSBCZXJlY2hudW5nIGRlciBWYXJpYW56IG1pdCBkZW0gRGl2aXNvciAkbiAtIDEkIChgbWVhbi52YXIudWJgKSBpbSBEdXJjaHNjaG5pdHQgbsOkaGVyIGJlaSBkZXIgd2FocmVuIFBvcHVsYXRpb25zdmFyaWFueiBhbHMgZGllIEJlcmVjaG51bmcgbWl0IGRlbSBEaXZpc29yICRuJCAoYG1lYW4udmFyLm5gKS4gDQoNCjxicj4NCjxicj4NCg==