Ez a feladat amiatt tetszik nekem, mert egyszerűsége ellenére valójában rendkívül bonyolult. A megoldásnak igazán jó, közérthető levezetésével nem találkoztam. Az alábbi oldalakt találtam:
Itt igyekszem úgy elmagyarázni, hogy lehetőleg ne maradjon ki egyetlen lépés sem. Fokozatosan haladunk a megoldás felé.
Egy metró 3 perces követési idővel
Ha összesen egy metró van, 3 perces követési távolsággal, akkor a várható várakozási idő másfél perc. De miért is?
Elméleti kitérő
A feladat megoldása szempontjából meg kell értenünk néhány valószínűségszámítási alapfogalmat és módszert.
A valószínűségi változókat két fő csoportba oszthatjuk: diszkrét és folytonos. Diszkrét pl. a kockadobás, folytonos pl. az, hogy mennyit várunk a metróra. A diszkrét valószínűségi változókkal valójában egyszerűbb bánni, ebben a feladatban viszont meg kell ismerkednünk mélyebben a folytonossal.
Talán a legkönnyebb megérteni azokat a diszkrét eseteket, ahol a lehetséges kimenetek száma véges. Pl. egy kockadobás esetén 6 lehetséges eredmény van, ugyanakkora, egyenként $\frac{1}{6}$ eséllyel. Az eredeti feladathoz nagyon hasonló lenne az, hogy dobunk egyet egy hatoldalú és egy négyoldalú dobókockával és felírjuk a kisebbet. Mi ennek a várható értéke? Most nem oldjuk meg, de a megoldás adja magát: összesen 24 féle lehetséges eredmény van ugyanakkora valószínűséggel; felírjuk mindet, és a kisebbik számokat átlagoljuk.
Csakhogy folytonos esetben annak a valószínűsége, hogy a valószínűségi változó egy adott értéket vegyen fel, nulla. Itt intervallumoknak van értelmük, pl. annak, hogy mekkora eséllyel kell legalább 20 és legfeljebb 30 másodpercet várni. Csakhogy ha a valószínűség nem lineáris (az egy metróra történő várakozás lineáris, de a kettőre való várakozás már nem az), akkor csak közelíteni tudjuk ezzel a módszerrel. Lehet a 10 másodperces intervallumot 1-re vagy akár egytizedre venni, és azokat átlagolni; a számolás hosszadalmas lesz, de tökéletesen pontos eredményt így sem kapunk.
Folytonos esetben - ellentétben a diszkrét esettel - nem egy adott lehetséges érték bekövetkezési valószínűségét vesszük alapul, hanem azt, hogy mekkora az esélye annak, hogy az eredmény egy adott értéknél kisebb. Például mekkora eséllyel kell kevesebbet várni, mint egy perc. A 3 perces követési idejű metró esetben ennek a valószínűsége $\frac{1}{3}$, az 5 perces követési idejűé pedig $\frac{1}{5}$. A kettő együtt már trükkösebb: valójában úgy érdemes kiszámolni, hogy külön-külön meghatározzuk azt, hogy mekkora eséllyel kell legalább 1 percet várni, azt összeszorozzuk (hiszen a két esemény független), majd egyből kivonjuk az eredményt: $1 - \frac{2}{3}\cdot\frac{5}{6} = \frac{4}{9}$, tehát valamivel kevesebb mint 50% az esélye annak, hogy egy percen belül metróra tudunk szállni. (Ez már kijelöli a megoldás közelítő értékét.)
Persze ezt a módszert diszkrét esetben is alkalmazhatjuk, és ott már van jelentősége annak, hogy szigorú egyenlőtlenséget követelünk meg. Tehát pl. annak a valószínűsége, hogy egy szabályos 6 oldalú kockával 3-nál kisebbet dobunk, $\frac{1}{3}$.
Lássuk most, hogy hogyan jelöljük az említett fogalmakat!
- A valószínűségi változót tipikusan nagybetűvel jelöljük, az ábécé végéről, pl. $X$, $Y$. Diszkrét esetben ez pl. a kockadobás, folytonos esetben pl. a metró érkezéséig eltelt idő.
- A valószínűségi változó által felvehető lehetséges értékeket a fenti betű kisbetűs változatával jelöljük, pl. $x$, $y$. Pl. kockadobás esetén ezek az 1, 2, 3, 4, 5 és 6 értékeket jelentik, a metróra való várakozás esetén pedig egy 0 és 3 közötti tetszőleges érték. Valójában itt általánosíthatunk (mindkét esetben) úgy, hogy az x értéke mínusz végtelentől plusz végtelenig terjedhet, mert végül is van annak a kérdésnek értelme, hogy mekkora eséllyel dobunk 10-nél kisebbet a dobókockával, vagy mennyi eséllyel várunk legfeljebb 10 percet (100%), vagy fordítva, mekkora eséllyel dobunk -2-nél kevesebbet, ill. mekkora eséllyel szállunk fel a metróra azelőtt, hogy odaérnénk (0%).
- A valószínűség jelölése $P$, és itt zárójelben adjuk meg azt, hogy mire vonatkozik. Pl. diszkrét esetben jelölje $A$ azt az eseményt, hogy páros számú lesz a dobás eredménye, akkor $P(A) = 0.5$. Folytonos esetben a metróra történő várakozást formálisan felírva ezt kapjuk $P(x<1) = \frac{1}{3}$.
- Ha felírjuk minden x-re, mínusz végtelentől plusz végtelenig azt, hogy mekkora eséllyel lesz az eredmény kisebb az adott értéknél, akkor az adott valószínűségi változó eloszlásfüggvényét kapjuk eredményül. Ennek a jelölése $F$, ill. mivel függvényről van szó, zárójelben az értelmezési tartományt adjuk meg: $F(x)$. Néhány fontos tulajdonsága:
- Mínusz végtelenben az értéke 0.
- Plusz végtelenben az értéke 1.
- Nem csökkenő.
Abban a példában, amelyben egy metró van, a várakozás egyenletes, tehát ugyanakkora eséllyel kell a szerelvényre várni legalább 20, legfeljebb 30 másodpercet, mint amekkora eséllyel kell legalább 130, legfeljebb 140 másodpercet. Ez nem mindegyik folytonos valószínűségi változó esetén van így, pl. az alapfeladatban sincs így, és ez adja a nehézségét. Valahogyan jó lenne kifejezni azt is, hogy adott érték "körül" kb. mekkora ez a valószínűség. Azt, hogy milyen értékek mentén kisebb ill. nagyobb a valószínűségi változó értéke, sűrűségfüggvénynek nevezzük, és $f$-fel, egészen pontosan $f(x)$-szel jelöljük. A sűrűségfüggvénynek a következő fontos tulajdonságai vannak:
- Nem lehet negatív.
- A görbe alatti terület értéke pontosan 1.
Ez utóbbi formálisan kifejezve:
$\int_{-\infty}^{\infty}f(x)dx = 1$
Összefüggés az eloszlásfüggvény és sűrűségfüggvény között; az eloszlásfüggvény a sűrűségfüggvény integrálásából adódik:
$F(x) = \int_{-\infty}^{x}f(t)dt$
A sűrűségfüggvény pedig az eloszlásfüggvény deriváltja:
$f(x) = F'(x)$
Próbáljuk meg most "kitalálni" az egy metrós feladat eloszlásfüggvényét és sűrűségfüggvényét! Az eloszlás egyenletesen növekszik úgy, hogy 0 percnél 0, 3 percnél 1, azaz $\frac{x}{3}$, ha $0 \le x \le 3$, $0$ ha $x < 0$ és 1, ha $x > 3$.
A sűrűségfüggvény már trükkösebb. 0 alatt és 3 fölött nem lehet, azaz ott 0 lesz, a kettő között pedig egyenletes. Tudva azt, hogy a görbe alatti terület 1, a görbe egy téglalapot ír le, melynek szélessége 3 egység, így ahhoz, hogy kijöjjön területre az 1, a téglalap magassága $\frac{1}{3}$. A sűrűségfüggvény tehát $\frac{1}{3}$, ha $0 \le x \le 3$, $0$ ha $x < 0$ és ugyancsak 0, ha $x > 3$.
Ez persze az eloszlásfüggvény deriválásával is gyakorlatilag közvetlenül adódik, mivel $\frac{1}{3}\cdot x$ deriváltja $\frac{1}{3}$.
A várható érték adja általában a feladatok végeredményét. Ennek szokásos jelölése $E[X]$. Itt is induljunk ki először a diszkrét esetből! Mekkora a kockadobás várható értéke? Nyilván 3,5, ami úgy adódik, hogy összeadjuk a lehetséges dobásokat, majd elosztjuk 6-tal, mert mindegyiknek $\frac{1}{6}$ a valószínűsége. Valami hasonló kellene folytonos esetben is, csakhogy ott nem tudjuk venni az összes lehetséges értéket, megszorozni annak valószínűségével és összeadni, ahogy tennénk diszkrét esetben, hanem - sajnos - itt is integrálnunk kell.
$E[X] = \int_{-\infty}^{\infty}x\cdot f(x)dx$
Általában a folytonos valószínűségszámítási feladatokban a legegyszerűbb az eloszlásfüggvényt felírni (ezt a feladatot is így fogjuk megoldani), így azt felhasználva $dF(x)$-szel jelölve az $F(x)$ deriváltját, adódik a következő képlet (amit a leírások többnyire levezetés nélkül adnak meg):
$E[X] = \int_{-\infty}^{\infty}x\cdot dF(x)dx$
Két metró, egyenként 3 perces követési idővel
Közelítés a megoldás felé
Talán ez az a legegyszerűbb eset, amin jól láthatjuk, hogy a feladat mennyire nem egyszerű, aminek az oka az "egymástól függetlenül" kitétel. Számunkra az a legkedvezőbb, ha egymástól pontosan másfél perc elcsúsztatással indulnak, és a legkedvezőtlenebb, ha ugyanakkor. (Ha ez nem nyilvánvaló, akkor gondoljunk arra, hogy ha egy faluból naponta összesen két buszjárat van, akkor mi a jobb, ha mindkettő reggel 8-kor indul, agy az egyik reggel 8-kor, a másik este 8-kor.) Az előbbi eset gyakorlatilag felfogható úgy, hogy van egy metrójárat másfél perc követési idővel (nagyjából így működik a budapesti 4-es és 6-os villamos), míg ez utóbbi felfogható kétszeres kapacitású metrójáratként, 3 perces követési idővel. De vannak köztes esetek is, pl. az, hogy a két járat között fél perc eltérés van, vagy hogy egy perc, és valójában végtelen sok ilyen lehetőség létezik.
De vajon mennyi lehet a várakozási idő ez esetben? A problémát a végtelen sok lehetőség okozza. Próbáljuk először megsaccolni! Először tegyük fel, hogy a metró indulási ideje csak 30 másodpercre kerekített lehet! Ez esetben ha az első metró a 0, 180, 360 stb. másodpercben indul, akkor a második az alábbi eltolásokban indulhat, egyenlő valószínűségekkel:
- 0 másodperc: ez esetben olyan, mintha csak egy lenne, és a várható érték - mint fent láthattuk - 75 másodperc.
- 30 másodperc: ez esetben $\frac{1}{6}$ eséllyel futunk bele abba, hogy 30 másodpercen belül jön a következő metró, azaz 15 másodperc a várható várakozási idő, $\frac{5}{6}$ eséllyel pedig abba, hogy 150 másodpercen belül érkezik, azaz ez esetben a várható várakozási idő 75 másodperc. Összesen: $\frac{1}{6}\cdot 15 + \frac{5}{6}\cdot 75 = \frac{15 + 375}{6} = \frac{390}{6} = 65$, tehát a várható várakozási idő 65 másodperc.
- 60 másodperc: a fentihez hasonlóan, $\frac{1}{3}$ eséllyel lesz a várakozási idő átlagosan 30 másodperc és $\frac{2}{3}$ eséllyel 60 másodperc, ami összesen $\frac{1}{3}\cdot 30 + \frac{2}{3}\cdot 60 = 50$, tehát 50 másodpercet eredményez.
- 90 másodperc: ez ekvivalens azzal, mintha egy járat lenne másfél perces követési idővel, azaz 45 másodperc ez esetben a várható várakozási idő.
- 120 másodperc: ez a 60 másodperc fordítottja, ugyancsak 50 másodperc várható várakozási idővel.
- 150 másodperc: ez a 30 másodperc fordítottja, szintén 65 másodperc várható várakozási idővel.
A 180 másodperctől ismétlődik. A fenti 6 eset valószínűsége a feltevésünk szerint egyforma, így adódik a teljes várható várakozási idő:
$\frac{1}{6}\cdot 75 + \frac{1}{6}\cdot 65 + \frac{1}{6}\cdot 50 + \frac{1}{6}\cdot 45 + \frac{1}{6}\cdot 50 + \frac{1}{6}\cdot 65 = 58\frac{1}{3}$
Az eredmény tehát közel 1 perc. Valójában minél jobban "finomítjuk" a beosztást (pl. 10 másodperc többszörösével kiszámoljuk, vagy akár minden másodpercre), annál jobban közelítjük az 1 percet. Talán már "érezzük" azt, hogy az eredmény kerek egy perc lesz, de vajon hogyan jön ez ki?
Pontos megoldás integrállal
Eloszlásfüggvény
Először írjuk fel az eloszlásfüggvényt! Azt kell megadnunk, hogy mekkora eséllyel lesz kisebb egy adott értéknél a valószínűségi változó, jelen esetben az, hogy ha két metró jár egymástól függetlenül, egyenként 3-3 perces menetidővel, akkor mekkora eséllyel kell kevesebbet várni adott értéknél. 0 alatti értékekre nyilván ez 0%, 3 feletti értékekre pedig 100%, de mennyi mondjuk 20 másodpercre, egy percre vagy 2,5 percre?
Már ez sem egyszerű! Ezt úgy érdemes megoldani, hogy kiszámoljuk, mekkora eséllyel kell legalább adott ideig várni. Korábban már láthattuk, hogy ezt úgy tudjuk kiszámolni, hogy külön-külön vesszük a két metróra várás várható értékét, és összeszorozzuk. Végül - mivel pont az ellenkezőjét keressük - kivonjuk 1-ből.
Az $X$ valószínűségi változó most a két egymástól független, egyenként 3 perces menetidejű metróra történő várakozást jelenti, $X_1$ az egyikre, $X_2$ pedig a másikra történő várakozást külön-külön. A fenti gondolatmenetet formalizálva:
$F(x) = P(X < x) = 1 - P(X\ge x) = 1 - P(X_1\ge x)\cdot P(X_2\ge x) = 1 - (1 - P(X_1 < x))\cdot (1 - P(X_2 < x)) = 1 - (1 - \frac{x}{3})\cdot(1 - \frac{x}{3}) = 1 - \frac{3 - x}{3}\cdot\frac{3 - x}{3} = 1 - \frac{9 - 6x + x^2}{9} = \frac{6x - x^2}{9}$
Tehát:
$F(x) = \frac{6x - x^2}{9}$
Mindez persze úgy, hogy $0 \le x \le 3$.
Sűrűségfüggvény
A sűrűségfüggvény az eloszlásfüggvény deriváltja, tehát:
$f(x) = F'(x) = \left(\frac{6x - x^2}{9}\right)' = \frac{1}{9}\cdot(6x - x^2)' = \frac{1}{9}\cdot(6 - 2x) = \frac{6 - 2x}{9}$
Tehát:
$f(x) = \frac{6 - 2x}{9}$
Továbbra is $0 \le x \le 3$; más esetben $f(x) = 0$.
Várható érték
A várható érték kiszámítása:
$E[X] = \int_{-\infty}^{\infty}x\cdot f(x)dx = \int_{0}^{3}x\cdot \frac{6 - 2x}{9} dx$
Az $f(x)$ függvényértéke $x < 0$ és $x > 3$ esetén konstans 0, így a határozott integrál ottani része is 0 lesz, emiatt elég csak 0 és 3 között integrálni.
Számoljuk ki az integrál primitív függvényét:
$\int x\cdot\frac{6 - 2x}{9}dx = \int\frac{6x - 2x^2}{9} = \frac{6\cdot\frac{x^2}{2} - 2\cdot\frac{x^3}{3}}{15} = \frac{3x^2 - \frac{2}{3}x^3}{9}$
Az eredeti képletbe visszahelyettesítve és alkalmazva a Newton-Leibniz formulát:
$\int_{0}^{3}x\cdot \frac{6 - 2x}{9}dx = \left[\frac{3x^2 - \frac{2}{3}x^3}{9}\right]^3_0 = \left(\frac{3\cdot 3^2 - \frac{2}{3}\cdot 3^3}{9}\right) - \left(\frac{3\cdot 0^2 - \frac{2}{3}\cdot 0^3}{9}\right) = \frac{27 - 18}{9} - 0 = 1$
Tehát:
$E[X] = 1$
Ez a megoldás: ha van két 3 perc menetidejű, egymástól független metró, akkor várhatóan egy percet kell a gyorsabbra várni.
Az eredeti feladat visszavezetése az előzőre
Az eredeti feladatot a következőképpen tudjuk visszavezetni az imént megoldottra. Induljunk ki abból, hogy tetszőleges pillanatban odaérve mekkora az esélye annak, hogy at 5 perc menetidejű metró 3 percen belül ill. 3 percen túl érkezik:
- $\frac{3}{5}$ eséllyel érkezik 3 percen belül. Ez esetben visszavezettük a problémát az előzőre, azaz ez esetben 1 perc lesz a várható várakozási idő.
- $\frac{2}{5}$ eséllyel érkezik 3 percen túl. Ez ekvivalens azzal az esettel, hogy csak egy metró van, 3 perces követési idővel, és ez esetben másfél perc a várható várakozási idő.
Összegezve (ez esetben $X$ az eredeti feladat valószínűségi változója, $E[X]$ pedig annak várható értéke):
$\frac{3}{5}\cdot 1 + \frac{2}{5}\cdot 1,5 = \frac{6}{5}$
A feladatnak tehát a megoldása $\frac{6}{5}$ perc, azaz 1 perc 12 másodperc.
Az eredeti feladat közvetlen megoldása
Ennyi bevezetéssel most már közvetlenül is megoldhatjuk! Jelölje $X$ az eredeti feladat valószínűségi változóját, $X_1$ a 3 perc követési idejű metróra történő várakozás időtartamát, $X_2$ pedig az 5 percesét. A fenti gondolatmenettel az eloszlásfüggvény:
$F(x) = 1 - \frac{3 - x}{3}\cdot\frac{5 - x}{5} = 1 - \frac{15 - 8x + x^2}{15} = \frac{8x - x^2}{15}$
Természetesen itt is $0 \le x \le 3$, ugyanis semmiképpen sem kell többet várni 3 percnél. A sűrűségfüggvény:
$f(x) = \left(\frac{8x - x^2}{15}\right)' = \frac{8 - 2x}{15}$
A várható érték:
$E[X] = \int_{0}^{3}x\cdot \frac{8 - 2x}{15}dx = \int_{0}^{3}\frac{8x - 2x^2}{15}dx = \left[\frac{4x^2 - \frac{2}{3}\cdot x^3}{15}\right]^3_0 = \frac{36 - 18}{15} = \frac{6}{5}$
A feladat megoldása tehát $\frac{6}{5}$ perc.
Megjegyzés: figyeljük meg, hogy az elején belinkelt megoldások nagyjából ennyire részletesek, a fenti magyarázat nélkül.
A különböző fogalmak magyarázata diagramokkal
Idáig túl sok volt a szöveg, és talán sokak nehezen tudják követni a fogalmakat, képleteket. Az eredeti feladat megoldása már kellően általános ahhoz, hogy érdemes legyen diagramokkal is illusztrálni.
Lássuk először az eloszlásfüggvényt!
Ez a fenti definíció alapján azt jelenti, hogy mekkora eséllyel lesz a várakozás kevesebb egy adott $x$ értéknél. A diagramból kiolvashatjuk, hogy kb. 30% esélyünk van arra, hogy fél percen belül érkezzen az előbb odaérő szerelvény, és közel 90% arra, hogy 2 percen belül megérkezzen.
A sűrűségfüggvény az alábbi:
Ennek az értelmezése már kicsit nehezebb. Diszkrét esetben kb. azt jelentené, hogy egy-egy értéknek mekkora az esélye. Folytonos esetben ilyen közvetlen értelmezést nehéz adni. Függvény alatti terület 1. Minél kisebb egy adott érték, annál kisebb annak az esélye, hogy az érték közelében következik be az esemény. A diagramból azt olvassuk le hogy a rövidebb várakozási idők valószínűbbek, mint a hosszabbak, és a várható várakozási idő lineárisan csökken. Egy ehhez hasonló diagramok kapnál egyébként akkor, ha intervallumokra osztanánk, pl. max. 10 másodperc várakozási idő, 10-20 másodperc közötti várakozási idő stb., és nagyon sok embert megkérdeznénk, hogy pontosan mennyit várt, ezeknek vennénk az arányát, finomítanánk (pl. 10 másodperces intervallum helyett egy másodpercet vennénk stb.), és a végén úgy rajzolnánk meg a függvényt, hogy az az alatti terület egység legyen.
A várható érték az alábbi függvény alatti terület:
Az értelmezéséhez vegyük ismét a finomodó diszkrét esetet. Ez olyan, mintha a fenti intervallumos példát folytatva felírnánk azt, hogy a pontosan adott ideig váró utasok összesen mennyit vártak (majd azt valahogy normalizáljuk). A sűrűségfüggvény alapján a kis értékek ugyan gyakran fordulnak elő, viszont ott a várakozás mennyiség is kicsi. A nagy értékek viszont ritkán fordulnak elő, így a függvény értéke emiatt alacsony ott. A függvény maximum pontja másfél percnél van, aminek a magyarázata az, hogy még elég valószínű és már elég nagy értéket jelent. A feladat megoldása a függvény alatti terület.
A fenti függvény primitív függvénye az alábbi:
Ennek a függvénynek a deriváltja az előző. Az ábrázolt két végpont a lényeges a mi szempontunkból, melyek különbsége adja a végeredményt.
Megoldás integrálás, deriválás és valószínűségszámítás nélkül?
Hosszasan gondolkodtam, hogy vajon meg lehet-e ezt oldani felső szintű matematika nélkül, de egyelőre nem sikerült ilyen megoldást találnom. A legnagyobb esélyét annak látom, hogy valahogy be tudjuk bizonyítani, hogy két, egyenként 3 perc követési idejű metró esetén a várható várakozási idő 1 perc, de még nem sikerült ezt megoldanom. Ha valakinek van ötlete, kérem, írja meg!