Populationsvarianz vs. Stichprobenvarianz

Eine öfter wiederkehrende Frage ist, weshalb bei der Varianz einer Stichprobe als Divisor nicht \(n\) sondern \(n - 1\) eingesetzt ist. Mit einer Stichprobe schätzen wir auf die Kennzahlen einer Population. Erfahrungsgemäss unterschätzt die Stichprobenvarianz mit Divisor \(n\) die Varianz in der Population 1. Das kann sogar mathematisch bewiesen werden und wer sich das antun will, kann das hier im schlauen Wikipedia: Bessel’s correction nachlesen. Aber ehrlich gesagt, wer will sich das antun? Vielleicht hilft folgende Überlegung: Die Populationsvarianz spielt in der Inferenzstatistik eine enorm wichtige Rolle, daher ist es von Bedeutung, dass sie möglichst genau aus einer Stichprobe geschätzt werden kann. Wenn ich den Divisor \(n\) durch \(n - 1\) ersetze, erhalte ich generell immer eine etwas grössere Stichprobenvarianz, weil der Dividend (die Quadratsumme der Abweichungen in der Stichprobe … schon wird’s kompliziert) durch eine etwas kleinere Zahl geteilt wird. Wenn ich demnach \(n - 1\) verwende, korrigiere ich für die Erfahrung, dass eine Stichprobe die Varianz im Durchschnitt unterschätzt.

Dass dieses Vorgehen in der Regel eine etwas genauere Schätzung der Varianz erlaubt, können wir anhand einer einfachen Simulation am Computer zeigen.

Hier nochmals die Formeln für die Berechnung der Varianzen:

Populationsvarianz (var.pop)

\[\sigma^2 = \frac{\Sigma_{x=1}^N(x_i - \mu)}{N}\]

Stichprobenvarianz (var.n, mit Divisor n)

\[s^2_n = \frac{\Sigma_{x=1}^n(x_i - \bar{x})}{n}\]

Stichprobenvarianz (var.unbiased, mit Divisor n-1)

\[s^2_{n-1} = \frac{\Sigma_{x=1}^n(x_i - \bar{x})}{n-1}\]

Simulation 1

Wir simulieren eine Population mit N = 10000, \(\mu = 100\) und \(s = 15\)

Stichproben

Wir ziehen 25 Zufallsstichproben im Umfang von n = 50 aus der Population und berechnen die Varianz der Stichprobe var.n und die unbiased Varianz var.unbiased. var.pop = Populationsvarianz = 219.4013.

25 samples, n = 30
var.pop var.n var.unbiased
219.4013 237.8697 246.0721
219.4013 160.1286 165.6503
219.4013 260.1223 269.0920
219.4013 217.8190 225.3300
219.4013 248.1862 256.7444
219.4013 164.4608 170.1319
219.4013 161.7295 167.3064
219.4013 230.0103 237.9417
219.4013 200.3658 207.2750
219.4013 156.3968 161.7898
219.4013 285.1506 294.9834
219.4013 122.5163 126.7410
219.4013 196.6853 203.4676
219.4013 238.3174 246.5352
219.4013 202.8883 209.8845
219.4013 274.2226 283.6786
219.4013 174.9522 180.9850
219.4013 161.1676 166.7251
219.4013 167.2376 173.0044
219.4013 171.9593 177.8889
219.4013 211.1690 218.4507
219.4013 242.6332 250.9998
219.4013 245.0741 253.5250
219.4013 303.6018 314.0709
219.4013 180.6703 186.9003
Zusammenfassung
var.pop mean.var.n mean.var.ub
219.4013 208.6134 215.807

Simulation mit 1000 Stichproben mit n = 100

Die Stichproben ziehen wir aus der gleichen Population wie bei Simulation 1.

Erste 10 Samples von 1000, n = 100
var.pop var.n var.unbiased
219.4013 195.2076 197.1794
219.4013 242.2348 244.6816
219.4013 258.6176 261.2299
219.4013 171.6173 173.3508
219.4013 258.1406 260.7481
219.4013 169.8716 171.5874
219.4013 237.3372 239.7345
219.4013 198.7594 200.7670
219.4013 259.4138 262.0341
219.4013 223.0196 225.2724
Zusammenfassung
var.pop mean.var.n mean.var.ub
219.4013 216.8871 219.0779

Wir sehen bei beiden Simulationen, dass beide Arten, die Stichprobenvarianz zu berechnen, die Populationsvarianz unterschätzen. Allerdings liegt die Berechnung der Varianz mit dem Divisor \(n - 1\) (mean.var.ub) im Durchschnitt näher bei der wahren Populationsvarianz als die Berechnung mit dem Divisor \(n\) (mean.var.n).




  1. Begründung: Die Abweichung von Extremwerten vom Mittelwert wird im Quadrat in die Berechnung der Populationsvarianz einbezogen; durch die Quadrierung dieser Abweichung erhalten Extremwerte ein grosses Gewicht bei der Berechnung der Populationsvarianz. Da Extremwerte wesentlich seltener vorkommen als Werte im Zentrum der Verteilung, ist die Wahrscheinlichkeit, dass Extremwerte in einer Zufallsstichprobe vorkommen eher klein, wodurch die Stichprobenvarianz typischerweise kleiner ist, als die Populationsvarianz.
    ↩︎

LS0tDQp0aXRsZTogIlVuYmlhc2VkIFNhbXBsZSBWYXJpYW5jZSINCmF1dGhvcjogIkx1a2FzIFN0YW1tbGVyIg0KZGF0ZTogImByIFN5cy5EYXRlKClgIg0Kb3V0cHV0Og0KICBodG1sX2RvY3VtZW50Og0KICAgIGZpZ19oZWlnaHQ6IDQNCiAgICBmaWdfd2lkdGg6IDQNCiAgICBmaWdfYWxpZ246ICJjZW50ZXIiDQogICAgaGlnaGxpZ2h0OiBweWdtZW50cw0KICAgIHRoZW1lOiB5ZXRpDQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQ0KLS0tDQoNCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQ0Kcm0obGlzdCA9IGxzKCkpDQoNCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gRkFMU0UsIG1lc3NhZ2UgPSBGQUxTRSwgd2FybmluZyA9IEZBTFNFKQ0KDQpsaWJyYXJ5KHRpZHl2ZXJzZSkNCmxpYnJhcnkoa25pdHIpDQpsaWJyYXJ5KGthYmxlRXh0cmEpDQpgYGANCg0KDQojIFBvcHVsYXRpb25zdmFyaWFueiB2cy4gU3RpY2hwcm9iZW52YXJpYW56IA0KDQpFaW5lIMO2ZnRlciB3aWVkZXJrZWhyZW5kZSBGcmFnZSBpc3QsIHdlc2hhbGIgYmVpIGRlciBWYXJpYW56IGVpbmVyIFN0aWNocHJvYmUgYWxzIERpdmlzb3IgbmljaHQgJG4kIHNvbmRlcm4gJG4gLSAxJCBlaW5nZXNldHp0IGlzdC4gTWl0IGVpbmVyIFN0aWNocHJvYmUgc2Now6R0emVuIHdpciBhdWYgZGllIEtlbm56YWhsZW4gZWluZXIgUG9wdWxhdGlvbi4gRXJmYWhydW5nc2dlbcOkc3MgdW50ZXJzY2jDpHR6dCBkaWUgU3RpY2hwcm9iZW52YXJpYW56IG1pdCBEaXZpc29yICRuJCBkaWUgVmFyaWFueiBpbiBkZXIgUG9wdWxhdGlvbiBeW0JlZ3LDvG5kdW5nOiBEaWUgQWJ3ZWljaHVuZyB2b24gRXh0cmVtd2VydGVuIHZvbSBNaXR0ZWx3ZXJ0IHdpcmQgaW0gUXVhZHJhdCBpbiBkaWUgQmVyZWNobnVuZyBkZXIgUG9wdWxhdGlvbnN2YXJpYW56IGVpbmJlem9nZW47IGR1cmNoIGRpZSBRdWFkcmllcnVuZyBkaWVzZXIgQWJ3ZWljaHVuZyBlcmhhbHRlbiBFeHRyZW13ZXJ0ZSBlaW4gZ3Jvc3NlcyBHZXdpY2h0IGJlaSBkZXIgQmVyZWNobnVuZyBkZXIgUG9wdWxhdGlvbnN2YXJpYW56LiBEYSBFeHRyZW13ZXJ0ZSB3ZXNlbnRsaWNoIHNlbHRlbmVyIHZvcmtvbW1lbiBhbHMgV2VydGUgaW0gWmVudHJ1bSBkZXIgVmVydGVpbHVuZywgaXN0IGRpZSBXYWhyc2NoZWlubGljaGtlaXQsIGRhc3MgRXh0cmVtd2VydGUgaW4gZWluZXIgWnVmYWxsc3N0aWNocHJvYmUgdm9ya29tbWVuIGVoZXIga2xlaW4sIHdvZHVyY2ggZGllIFN0aWNocHJvYmVudmFyaWFueiB0eXBpc2NoZXJ3ZWlzZSBrbGVpbmVyIGlzdCwgYWxzIGRpZSBQb3B1bGF0aW9uc3ZhcmlhbnouIDxicj4gXS4gRGFzIGthbm4gc29nYXIgbWF0aGVtYXRpc2NoIGJld2llc2VuIHdlcmRlbiB1bmQgd2VyIHNpY2ggZGFzIGFudHVuIHdpbGwsIGthbm4gZGFzIGhpZXIgaW0gc2NobGF1ZW4gW1dpa2lwZWRpYTogQmVzc2VsJ3MgY29ycmVjdGlvbl0oaHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvQmVzc2VsJTI3c19jb3JyZWN0aW9uKSBuYWNobGVzZW4uIEFiZXIgZWhybGljaCBnZXNhZ3QsIHdlciB3aWxsIHNpY2ggZGFzIGFudHVuPyBWaWVsbGVpY2h0IGhpbGZ0IGZvbGdlbmRlIMOcYmVybGVndW5nOiBEaWUgUG9wdWxhdGlvbnN2YXJpYW56IHNwaWVsdCBpbiBkZXIgSW5mZXJlbnpzdGF0aXN0aWsgZWluZSBlbm9ybSB3aWNodGlnZSBSb2xsZSwgZGFoZXIgaXN0IGVzIHZvbiBCZWRldXR1bmcsIGRhc3Mgc2llIG3DtmdsaWNoc3QgZ2VuYXUgYXVzIGVpbmVyIFN0aWNocHJvYmUgZ2VzY2jDpHR6dCB3ZXJkZW4ga2Fubi4gV2VubiBpY2ggZGVuIERpdmlzb3IgJG4kIGR1cmNoICRuIC0gMSQgZXJzZXR6ZSwgZXJoYWx0ZSBpY2ggZ2VuZXJlbGwgaW1tZXIgZWluZSBldHdhcyBncsO2c3NlcmUgU3RpY2hwcm9iZW52YXJpYW56LCB3ZWlsIGRlciBEaXZpZGVuZCAoZGllIFF1YWRyYXRzdW1tZSBkZXIgQWJ3ZWljaHVuZ2VuIGluIGRlciBTdGljaHByb2JlIC4uLiBzY2hvbiB3aXJkJ3Mga29tcGxpemllcnQpIGR1cmNoIGVpbmUgZXR3YXMga2xlaW5lcmUgWmFobCBnZXRlaWx0IHdpcmQuIFdlbm4gaWNoIGRlbW5hY2ggJG4gLSAxJCB2ZXJ3ZW5kZSwga29ycmlnaWVyZSBpY2ggZsO8ciBkaWUgRXJmYWhydW5nLCBkYXNzIGVpbmUgU3RpY2hwcm9iZSBkaWUgVmFyaWFueiBpbSBEdXJjaHNjaG5pdHQgdW50ZXJzY2jDpHR6dC4gICANCg0KRGFzcyBkaWVzZXMgVm9yZ2VoZW4gaW4gZGVyIFJlZ2VsIGVpbmUgZXR3YXMgZ2VuYXVlcmUgU2Now6R0enVuZyBkZXIgVmFyaWFueiBlcmxhdWJ0LCBrw7ZubmVuIHdpciBhbmhhbmQgZWluZXIgZWluZmFjaGVuIFNpbXVsYXRpb24gYW0gQ29tcHV0ZXIgemVpZ2VuLiAgDQoNCkhpZXIgbm9jaG1hbHMgZGllIEZvcm1lbG4gZsO8ciBkaWUgQmVyZWNobnVuZyBkZXIgVmFyaWFuemVuOg0KDQpQb3B1bGF0aW9uc3ZhcmlhbnogKHZhci5wb3ApDQoNCiQkXHNpZ21hXjIgPSBcZnJhY3tcU2lnbWFfe3g9MX1eTih4X2kgLSBcbXUpfXtOfSQkDQoNClN0aWNocHJvYmVudmFyaWFueiAodmFyLm4sIG1pdCBEaXZpc29yIG4pIA0KDQokJHNeMl9uID0gXGZyYWN7XFNpZ21hX3t4PTF9Xm4oeF9pIC0gXGJhcnt4fSl9e259JCQNCg0KU3RpY2hwcm9iZW52YXJpYW56ICh2YXIudW5iaWFzZWQsIG1pdCBEaXZpc29yIG4tMSkgDQoNCiQkc14yX3tuLTF9ID0gXGZyYWN7XFNpZ21hX3t4PTF9Xm4oeF9pIC0gXGJhcnt4fSl9e24tMX0kJA0KDQojIFNpbXVsYXRpb24gMQ0KDQpXaXIgc2ltdWxpZXJlbiBlaW5lIFBvcHVsYXRpb24gbWl0IE4gPSAxMDAwMCwgJFxtdSA9IDEwMCQgdW5kICRzID0gMTUkDQoNCmBgYHtyLCBmaWcuZGltPWMoNiwgNSksIGZpZy5hbGlnbj0nY2VudGVyJ30NCnNldC5zZWVkKDEyMzQpDQpwb3AgPC0gcm5vcm0oMTAwMDAsIG1lYW4gPSAxMDAsIHNkID0gMTUpDQptdSA8LSByb3VuZChtZWFuKHBvcCksIDIpDQpzaWdtYSA8LSByb3VuZChzZChwb3ApLCAyKQ0KdGl0ZWwgPC0gcGFzdGUoIlBvcHVsYXRpb24gbWl0IG11ID0iLCBtdSwgIiwgc2lnbWEgPSAiLCBzaWdtYSwgIiwgTiA9IDEwJzAwMCIgKQ0KDQpoaXN0KHBvcCwNCiAgICAgbWFpbiA9IHRpdGVsLA0KICAgICB5bGFiID0gIkjDpHVmaWdrZWl0IiwNCiAgICAgeGxhYiA9ICIiLA0KICAgICBjb2wgPSAic3RlZWxibHVlIikNCg0KdmFyLnBvcCA8LSBzdW0oKHBvcCAtIG1lYW4ocG9wKSleMikvbGVuZ3RoKHBvcCkNCnZhci5wb3AgPC0gcm91bmQodmFyLnBvcCwgNCkNCmBgYA0KDQojIyBTdGljaHByb2Jlbg0KDQpXaXIgemllaGVuIDI1IFp1ZmFsbHNzdGljaHByb2JlbiBpbSBVbWZhbmcgdm9uIG4gPSA1MCBhdXMgZGVyIFBvcHVsYXRpb24gdW5kIGJlcmVjaG5lbiBkaWUgDQpWYXJpYW56IGRlciBTdGljaHByb2JlIGB2YXIubmAgdW5kIGRpZSB1bmJpYXNlZCBWYXJpYW56IGB2YXIudW5iaWFzZWRgLiBgdmFyLnBvcGAgPSBQb3B1bGF0aW9uc3ZhcmlhbnogPSBgciB2YXIucG9wYC4NCg0KYGBge3J9DQp2YXIubi5mdW4gPC0gZnVuY3Rpb24oeCkgIHsNCiAgdmFyLm4gPC0gc3VtKCh4IC0gbWVhbih4KSleMikvbGVuZ3RoKHgpDQogIHJldHVybih2YXIubikNCn0NCiMgdmFyLm4uZnVuKHgpDQogIA0KdmFyLnVuYmlhc2VkLmZ1biA8LSBmdW5jdGlvbih4KSB7DQogIHZhci51bmJpYXNlZCA8LSBzdW0oKHggLSBtZWFuKHgpKV4yKS8obGVuZ3RoKHgpIC0gMSkNCiAgcmV0dXJuKHZhci51bmJpYXNlZCkNCn0NCiMgdmFyLnVuYmlhc2VkLmZ1bih4KQ0KDQp2YXIubiA8LSB2ZWN0b3IoKQ0KdmFyLnVuYmlhc2VkIDwtIHZlY3RvcigpDQoNCmZvciAoaSBpbiAxOjI1KSB7DQogIHkgPC0gc2FtcGxlKHBvcCwgc2l6ZSA9IDMwKQ0KICB2YXIubltpXSA8LSB2YXIubi5mdW4oeSkNCiAgdmFyLnVuYmlhc2VkW2ldIDwtIHZhci51bmJpYXNlZC5mdW4oeSkNCn0NCg0KcmVzdWx0IDwtIHRpYmJsZSgNCiAgdmFyLnBvcCA9IHJlcCh2YXIucG9wLCAyNSksDQogIHZhci5uID0gdmFyLm4sDQogIHZhci51bmJpYXNlZCA9IHZhci51bmJpYXNlZA0KKQ0KDQoNCmthYmxlKHJlc3VsdCwgY2FwdGlvbiA9ICIyNSBzYW1wbGVzLCBuID0gMzAiKSAlPiUgDQogIGthYmxlX3N0eWxpbmcoZnVsbF93aWR0aCA9IEZBTFNFKQ0KDQptLnZhci5uIDwtIG1lYW4ocmVzdWx0JHZhci5uKQ0KbS52YXIudWIgPC0gbWVhbihyZXN1bHQkdmFyLnVuYmlhc2VkKQ0KDQpyZXN1bHQuc3VtbWFyeSA8LSB0aWJibGUoDQogIHZhci5wb3AgPSB2YXIucG9wLA0KICBtZWFuLnZhci5uID0gbS52YXIubiwNCiAgbWVhbi52YXIudWIgPSBtLnZhci51Yg0KKQ0KDQpyZXN1bHQuc3VtbWFyeSAlPiUgDQogIGthYmxlKGNhcHRpb24gPSAiWnVzYW1tZW5mYXNzdW5nIikgJT4lIA0KICBrYWJsZV9zdHlsaW5nKGZ1bGxfd2lkdGggPSBGQUxTRSkNCmBgYA0KDQojIFNpbXVsYXRpb24gbWl0IDEwMDAgU3RpY2hwcm9iZW4gbWl0IG4gPSAxMDANCg0KRGllIFN0aWNocHJvYmVuIHppZWhlbiB3aXIgYXVzIGRlciBnbGVpY2hlbiBQb3B1bGF0aW9uIHdpZSBiZWkgU2ltdWxhdGlvbiAxLg0KDQpgYGB7cn0NCnZhci5uIDwtIHZlY3RvcigpDQp2YXIudW5iaWFzZWQgPC0gdmVjdG9yKCkNCg0KZm9yIChpIGluIDE6MTAwMCkgew0KICB5IDwtIHNhbXBsZShwb3AsIHNpemUgPSAxMDApDQogIHZhci5uW2ldIDwtIHZhci5uLmZ1bih5KQ0KICB2YXIudW5iaWFzZWRbaV0gPC0gdmFyLnVuYmlhc2VkLmZ1bih5KQ0KfQ0KDQpyZXN1bHQgPC0gdGliYmxlKA0KICB2YXIucG9wID0gcmVwKHZhci5wb3AsIDEwMDApLA0KICB2YXIubiA9IHZhci5uLA0KICB2YXIudW5iaWFzZWQgPSB2YXIudW5iaWFzZWQNCikNCg0KDQprYWJsZShyZXN1bHRbMToxMCxdLCBjYXB0aW9uID0gIkVyc3RlIDEwIFNhbXBsZXMgdm9uIDEwMDAsIG4gPSAxMDAiKSAlPiUgDQogIGthYmxlX3N0eWxpbmcoZnVsbF93aWR0aCA9IEZBTFNFKQ0KDQptLnZhci5uIDwtIG1lYW4ocmVzdWx0JHZhci5uKQ0KbS52YXIudWIgPC0gbWVhbihyZXN1bHQkdmFyLnVuYmlhc2VkKQ0KDQpyZXN1bHQuc3VtbWFyeSA8LSB0aWJibGUoDQogIHZhci5wb3AgPSB2YXIucG9wLA0KICBtZWFuLnZhci5uID0gbS52YXIubiwNCiAgbWVhbi52YXIudWIgPSBtLnZhci51Yg0KKQ0KDQpyZXN1bHQuc3VtbWFyeSAlPiUgDQogIGthYmxlKGNhcHRpb24gPSAiWnVzYW1tZW5mYXNzdW5nIikgJT4lIA0KICBrYWJsZV9zdHlsaW5nKGZ1bGxfd2lkdGggPSBGQUxTRSkNCmBgYA0KDQpXaXIgc2VoZW4gYmVpIGJlaWRlbiBTaW11bGF0aW9uZW4sIGRhc3MgYmVpZGUgQXJ0ZW4sIGRpZSBTdGljaHByb2JlbnZhcmlhbnogenUgYmVyZWNobmVuLCBkaWUgUG9wdWxhdGlvbnN2YXJpYW56IHVudGVyc2Now6R0emVuLiBBbGxlcmRpbmdzIGxpZWd0IGRpZSBCZXJlY2hudW5nIGRlciBWYXJpYW56IG1pdCBkZW0gRGl2aXNvciAkbiAtIDEkIChgbWVhbi52YXIudWJgKSBpbSBEdXJjaHNjaG5pdHQgbsOkaGVyIGJlaSBkZXIgd2FocmVuIFBvcHVsYXRpb25zdmFyaWFueiBhbHMgZGllIEJlcmVjaG51bmcgbWl0IGRlbSBEaXZpc29yICRuJCAoYG1lYW4udmFyLm5gKS4gDQoNCjxicj4NCjxicj4NCg==