Käesoleva kirjatüki eesmärk on tutvustada Monty Halli probleemi ja pakkuda välja võimalik lahendus. Monty Halli probleem on lihtne. Oled mängus, kus sul on valida kolme kinnise ukse vahel. Ühe ukse taga on peaauhind - auto (midagi uhket, näiteks ferrari). Ülejäänud kahe ukse taga on lambad (või midagi muud, mida sa väga ei ihalda). Sina pead valima ühe ukse (kuid ei ava seda).
Nüüd läheb asi põnevaks. Mängujuht avab ühe ukse (ühe neist, mida sina ei valinud). Selle ukse taga on lammas.
Siit küsimus: kas sul on suurem võimalus võita, kui sa jääd oma esialgsele valiku juurde või siis kui valid teise (avamata) ukse? Või vahet pole (tõenäosus võita on ikka sama)?
(allikas: Here’s the Best Explanation of the Monty Hall Problem Yet)
Näiteks valisid ukse 1, mängujuht avas ukse 2. Kas valides nüüd ukse 3 on suurem tõenäosus võita?
See küsimus on tekitanud poleemikat ning ka helgemaid päid segadusse ajanud. Vast kõige kuulsam näide on Marilyn vos Savanti juhtum. Marilyn on tuntud selle poolest, et tema IQ on kõigi aegade mõõdetutest kõige kõrgem (Guinnessi rekordite raamatu järgi 228). Tal oli oma nurk ajakirjas Parade, kus vastas eeltooduga sarnastele küsimustele.
Tema vastus oli, et suurem tõenäosus võita on neil, kes muudavad oma algset valikut. Marilyni vastus tekitas paraja tormi: ajalehele kirjutas ligi 10 000 inimest (neist umbes 1000 doktorikraadiga), et Marylin eksib. Mis sellest ikka, ka kõige vägevamad eksivad (nende eksimused hakkavad lihtsalt rohkem silma).
Loogiline ju oleks, et see, kas ma muudan oma esialgset valikut, ei muuda tõenäosust võita auto. Midagi muud ju ei muudeta (lambaid ja autot uste taga ei liigutata).
Probleemi lahendamiseks teen väikese simulatsiooni:
#teeme vektori, kus on 10000 korda juhuslikult valitud uks 1-3, mille taga on auto
auto=sample(3, 10000, replace=T)
#teeme teise vektori, kus on 10000 korda juhuslikult valitud suvaline uks
#ehk uks, mille mängija algselt valib
#tulemus ei muutu, kui valida uksi ka mingi mustri alusel, nt iga kord 2. uks
uks_valitud=sample(3, 10000, replace=T)
#vektor, mis näitab kas võitsime, kui jääme esialgsele uksele kindlaks
võit_esialgne_uks=(auto==uks_valitud)
#vektor, mis näitab kas võitsime, kui vahetame ust
võit_vahetab_uks=(auto!=uks_valitud)
#tõenäosus, et võidame, kui jääme algsele valikule kindlaks
prob_algne=sum(võit_esialgne_uks)/10000
#tõenäosus, et võidame, kui vahetame ust
prob_vahetame=sum(võit_vahetab_uks)/10000
Vaatame tulemusi. Tõenäosus, et me võidame auto, kui jääme esialgsele uksele kindlaks (prob_algne) on 0.3312 (33.12%). Ehk siis umbes 1/3, mis on loogiline tõenäosus võita juhuslikult kolme ukse vahel valides.
Tõenäosus, et võidame, kui vahetame ust (prob_vahetame) on 0.6688 (66.88%). Oot-oot, nüüd kisub kraavi. Kui ma vahetan ust, siis on mul 2 korda suurem tõenäosus võita! See pole ju loogiline.
Tegelikult on see loogiline. Koodiga pole manipuleeritud. See on väga hea näide, kuidas kõhutunne ja doktorikraad võib sind alt vedada (statistika osas on inimestel üldsiselt väga halb intuitsioon). Seega oli tegelikult Marylinil õigus.
Lahenduskäiku illustreerib järgnev joonis (allikas: Monty Hall problem):
Arutame asja nüüd lahti:
Tõenäosus, et minu esialgu valitud ukse taga asub auto, on 1/3 (33%).
Ühe ukse taga peab auto olema seega kõik uksed avades on tõenäosus võita 1 (100%).
Järelikult on tõenäosus, et auto asub ülejäänud kahe ukse taga: 1 - 1/3 = 2/3 (100% - 33% = 66%). Hetkel oleva info põhjal tundub mulle, et tõenäosus, et auto asub ükskõik millise ukse taga, on 1/3.
Kui nüüd ülejäänud 2-st avamata uksest avatakse üks (kus pole autot), jääb tõenäosus, et auto on nende kahe ukse taga, mida ma ei valinud, endiselt samaks (endiselt 2/3 ehk 66%).
Avatud ukse puhul on tõenäosus, et seal asub auto, 0 (seal on alati lammas, kui mängujuht avaks autoga ukse, lastakse ta lahti). Seega nüüd enam pole kõikide uste puhul võidu tõenäosus 1/3. Ukse avamine andis meile lisainfot.
Kuna kokku on tõenäosus võita endiselt 1 (ehk 100%, kui lubatakse avada kõik uksed), ning minu esmase valiku võidu tõenäosus on endiselt 1/3 (ja avatud ukse puhul 0), siis on tõenäosus, et auto asub teise avamata ukse taga 1 - 1/3 - 0 = 2/3 (66%). Muidu ei oleks tõenäosus võita kokku 1 (100%).
Pealtnäha lihtne probleem osutus parajaks ajude ragistamise ülesandeks. See on hea näide, milliseid vigu oma kõhutundega võime teha, kui seda reaalsete andmetega üle ei kontrolli. Ja enamik, kes pole sellest probleemist enne kuulnud, on surmtõsiselt kindlad, et uksi vahetades tõenäosus võita ei muutu.