2024

Valószínűségszámítás

  • A valószínűségszámítás a „lehet” pontosításának a tudománya.

  • „Lehet, de lehet az is, hogy nem…” – akkor mégis melyikre számítsak?

  • A legostobább elgondolás a „nem tudom, hogy melyik, tehát 50-50%”. Ezt kell – és némi fáradsággal szinte mindig lehet is – pontosítani.

  • Három kimenetel esetén hasonló a helyzet, akkor is csak a butaság vagy a lustaság magyarázza a „nem tudom, tehát 1/3 – 1/3 – 1/3” elgondolást.

  • Valószínűségekkel operálunk akkor is, amikor azt mondjuk, hogy „pechünk volt” vagy „szerencsénk volt”.

  • Pech:

    • bekövetkezik valami rossz, amit kis valószínűségűnek gondoltunk, vagy
    • elmarad valami jó, amire számítottunk, vagy
    • a nyereség a vártnál kevesebb, vagy
    • a veszteség a vártnál nagyobb.
  • Szerencse: értelemszerűen az ellenkezője

Események

  • Alapfogalom, nem definiáljuk (mint pl. a halmaz)

  • Bármi, ami a kísérlet vagy megfigyelés során előfordulhat (vagy bekövetkezik, vagy nem), és érdekel minket.

    • Például, ha egy laboreredmény lehet pozitív, negatív vagy kétes, akkor mi döntjük el, hogy ez utóbbit eseménynek tekintjük-e vagy nem.

    • Ha úgy döntünk, hogy nem, akkor a kétes eredményt úgy vesszük, hogy nem is tettünk megfigyelést.

Fogalmak, elnevezések

  • Biztos esemény: mindig bekövetkezik, valószínűsége 1.

  • Lehetetlen esemény: sohasem következik be, valószínűsége 0.

  • Az \(A\) esemény \(A^C\) komplementere a „nem \(A\)” esemény.

  • Az \(A\) és \(B\) események \(A+B\) (vagy \(A\cup B\)) összege az „\(A\) vagy \(B\)” esemény („megengedő vagy”: akár \(A\), akár \(B\), akár mindkettő).

  • Az \(A\) és \(B\) események \(A\cdot B\) (vagy \(A\cap B\)) szorzata az „\(A\) és \(B\)” esemény.

  • Az \(A\) és \(B\) események kizárják egymást, ha ugyanabban a kísérletben nem következhetnek be egyszerre, vagyis ha \(A\cap B\) a lehetetlen esemény \(A\cap B=\emptyset\).

  • Az \(A\) esemény maga után vonja \(B\)-t, ha az \(A\) bekövetkezése esetén biztos, hogy \(B\) is bekövetkezik (\(A\subseteq B\)).

Valószínűség

  • Egy véletlentől függő esemény bekövetkezésének valószínűségét hogyan fejezzük ki számszerűen?

  • Egy E esemény valószínűsége, \(P(E)\) egy 0 és 1 közötti valós szám, amely az E bekövetkezésének esélyét fejezi ki:

  • Nem a valószínűség az egyetlen lehetséges mérőszám az esélyek kvantifikálására. Később meg fogunk ismerkedni még két gyakran használt mérőszámmal, az oddsszal és a logittal.

  • A valószínűségszámítás azzal foglalkozik, hogy bizonyos (egyszerű) események valószínűségét ismertnek feltételezve hogyan számíthatjuk ki más (bonyolultabb) események valószínűségét.

    • Például feltételezve, hogy egy dobókockán a 6-os dobás valószínűsége 1/6 (ez a valószínűségi modellünk), hogyan határozhatjuk meg annak a valószínűségét, hogy 10 dobásból egyszer sem jön ki hatos.

Példa: tehén ellése

  • Tegyük fel, hogy egy tehén ellése a jövő hétre várható, minden nap ugyanakkora eséllyel (ez a valószínűségi modell).

  • Mi a valószínűsége, hogy az ellés hétfőn vagy kedden lesz?

  • P(ellés hétfőn) = P(ellés kedden) = … = P(ellés vasárnap) = 1/7

    • Az összes „elemi esemény” valószínűségének összege 1.
  • P(ellés hétfőn vagy kedden) = P(ellés hétfőn) + P(ellés kedden) = 1/7 +1/7 = 2/7 \(\approx\) 0.29

    • Akkor adhatjuk össze a valószínűségeket, ha az események egymást kizárják!
  • P(ellés NEM (hétfőn vagy kedden)) = 1 – 2/7 = 5/7 \(\approx\) 0.71

    • A komplementer esemény valószínűsége = 1 – az esemény valószínűsége.

Honnan tudjuk az események valószínűségét?

  • Nem tudjuk, hanem modellezzük!

  • A fenti példában a klasszikus valószínűségi modellt használtuk: ebben véges sok elemi esemény van, és mindnek ugyanakkora a valószínűsége.

  • A klasszikus modellben bármely esemény valószínűsége a hozzá tartozó elemi események száma („kedvező esetek száma”) osztva az összes lehetséges elemi esemény számával.

  • A gyakorlatban általában ésszerűtlen egyenlő esélyeket feltételezni!
  • A statisztikában sokszor éppen azért tételezzük fel ezt, hogy kimutassuk, hogy az adatok ellentmondanak neki!

Valószínűségek tapasztalati meghatározása

  • A gyakorlatban az elemi események valószínűségét empirikusan (tapasztalati úton, megfigyelésekből, kísérletekből) próbáljuk meghatározni. Ez az empirikus valószínűségi modell.

  • Példa: „…azért nem válaszoltam az e-mailedre, mert a múlt héten autóbalesetet szenvedtem. Amikor szüleimtől jöttem hazafelé, egy teherautó elém kanyarodott…”

  • Melyik nap történhetett a baleset?

  • Az elemi események: H, K, Sz, Cs, P, Szo, V

  • A valószínűségeket az érintett útszakaszon a teherautós balesetek gyakoriságából tudjuk megbecsülni: (fiktív adatok)

Valószínűségek tapasztalati meghatározása

  • Ha az elemi események valószínűsége már megvan, egy esemény valószínűségét úgy kapjuk, hogy összeadjuk a hozzá tartozó elemi események valószínűségét.

  • \[P(H \text{ vagy } K) = 0.35\]

  • Az empirikus modell alkalmazásának legegyszerűbb esete, amikor egy esemény valószínűségét kell kísérleti úton meghatározni (megbecsülni).

  • Ehhez N egymástól független megfigyelést végzünk azonos körülmények között.

  • Ha az esemény K alkalommal következik be, akkor szokásosan a K/N hányadost (neve: relatív gyakoriság, vagy empirikus vagy tapasztalati valószínűség) tekintjük az elméleti (vagy populációs) valószínűség becslésének.

Példa

  • 200 tyúktojást keltetünk, 160 csibe kel ki, a relatív gyakoriság 160/200 = 0.8.

  • Ennek alapján azt mondhatjuk, hogy a vizsgált telepen a kikelési valószínűség 0.8.

  • (ez egy becslés 200 elemű mintából)

  • Mennyire pontos a becsült valószínűség?

  • Ha mind az N-szer bekövetkezik az esemény, akkor biztos?

  • Ha egyszer sem, akkor meg lehetetlen?

A nagy számok törvénye

  • Ha a kísérletek N számát növeljük, akkor a K/N relatív gyakoriság egyre jobban megközelíti az esemény elméleti valószínűségét.
  • Ez nem pontos matematikai megfogalmazás, de hétköznapi használatra jó.
  • Illusztráció: számítógépes szimulációval (R-rel) egy 0.3 elméleti valószínűségű eseményre kapott relatív gyakoriságok:

    • 10 kísérletből 0.2
    • 1000 kísérletből 0.284
    • 100000 kísérletből 0.30079
    • 10000000 kísérletből 0.3001292
  • Százszoros minta – tízszeres pontosság (1 tizedes javulás)

A nagy számok törvénye

## 
## Listening on http://127.0.0.1:4143

(Jakob Bernoulli, Ars Conjectandi, 1713)

Összeadási szabály

Tetszőleges A és B eseményekre igaz a következő összefüggés:

\[P(A+B) = P(A) + P(B)-P(A \cdot B)\]

Halmazok elemszámai esetén:

\(|A\cup B| = |A| + |B| - |A\cap B|\)

Ha A és B kizárják egymást, az azt jelenti, hogy \(P(A\cdot B) = 0\).

Ekkor:

\[P(A+B) = P(A) + P(B)\]

Példa: nem és hajszín együttes eloszlása

P(szőke) = 25/96; P(férfi) = 34/96; P(szőke és férfi) = 10/96

P(szőke vagy férfi) = 49/96 (a sárga háttérrel megjelölt számokból)

P(szőke vagy férfi) \(\neq\) P(szőke) + P(férfi)

(mert így a szőke férfiakat kétszer számolnánk. Csak akkor lenne igaz, ha az évfolyamon nem lenne szőke férfi.)

Így helyes: P(szőke vagy férfi) = P(szőke) + P(férfi) – P(szőke és férfi)

Ha nincs szőke férfi (azaz a „szőke” és a „férfi” kizáró események), akkor P(szőke és férfi) = 0, tehát a harmadik tag elhagyható.

Valószínűség és feltételes valószínűség

Valószínűség

  • Az esetek hány százalékában várhatjuk, hogy…

  • Találomra kiválasztva egy egyedet a populációból, milyen eséllyel várhatjuk, hogy…

Feltételes valószínűség

  • Azoknak az eseteknek, amikor … [feltétel] …, hány %-ában várhatjuk, hogy

  • Találomra kiválasztva egy egyedet a populációnak abból a részéből, amely … [feltétel] …, milyen eséllyel várhatjuk, hogy…

Feltételes valószínűség

A feltételes valószínűség valószínűség egy leszűkített eseménytérben vagy részpopulációban, amelyből a feltételnek nem megfelelő elemi eseményeket (ill. a populációnak a feltételt nem kielégítő egyedeit) elhagyjuk.

Jelölése: \(P(E|F)\) (olvasd: ,,P E feltéve F’’), ahol \(E\) az esemény, aminek a valószínűségére kíváncsiak vagyunk, és \(F\) a feltétel.

A feltételes valószínűség kiszámítása

Intuitívan: Az összes elemi kimenetelek halmazából elhagyjuk azokat, amelyek nem felelnek meg a feltételnek, utána a szokásos módon számolunk valószínűséget.

Feltételes valószínűség matematikai definíciója:

\[P(E|F) =\frac{P(E\cdot F)}{P(F)},\]

ahol \(E|F\): \(E\) feltéve \(F\), \(E\cdot F\) = \(E\) és \(F\)

A feltételes valószínűség tehát csak akkor van értelmezve, ha \(P(F)\neq 0\), azaz a feltétel nem 0 valószínűségű.

A matematikai definícióval számolva is ugyanazt az eredményt kapjuk, mint amikor intuitíve, az eseménytér leszűkítésével számolunk.

Példa: színtévesztés

Egy populációban a színtévesztők megoszlása a következő:

Férfi Összesen
Színtévesztő 4% 1% 5%
Színlátó 48% 47% 95%
Összesen 52% 48% 100%

Mennyi a valószínűsége, hogy

  • egy találomra kiválasztott férfi színtévesztő?
    • P(színtévesztő | férfi) = 0.04 / 0.52 = 0.077 = 7.7%
  • egy találomra kiválasztott nő színtévesztő?
    • P(színtévesztő | nő) = 0.01 / 0.48 = 0.021 = 2.1%
  • egy, a színtévesztők közül találomra kiválasztott személy nő?
    • P(nő | színtévesztő) = 0.01 / 0.05 = 0.20 = 20%
  • \(P(S|N)\neq P(N|S)\), és ez általában is így van: \(P(E|F) \neq P(F|E)\)

Példa: színtévesztés

P(színtévesztő | férfi) = P(színtévesztő és férfi) / P(férfi) = SF/F (SF aránya az F-ben)

P(színtévesztő | nő) = SN/N (SN aránya az N-ben)

P(nő | színtévesztő) = SN/S =SN/(SF+SN) (SN aránya az S-ben)

Függetlenség

A fenti populációban a színtévesztők aránya függ a nemtől:

P(színtévesztő | férfi) = 7.7% \(\neq\) P(színtévesztő | nő) = 2.1%

A nem ismerete információval szolgál a színtévesztésről, és fordítva.

Ha a két feltételes valószínűség egyenlő lenne, azt mondhatnánk, hogy a színtévesztés független a nemtől.

Általában is, ha \(P(A | B) = P(A | B^C)\), akkor azt mondjuk, hogy az \(A\) és \(B\) események függetlenek. Ekkor az, hogy \(B\) bekövetkezett-e vagy nem, nem szolgál információval az \(A\) bekövetkezésének esélyeiről.

Az is igaz, hogy \[P(A\cdot B) = P(A)\cdot P(B)\]

Ez az ún szorzási szabály, a függetlenség matematikai definíciója.