
285. feladvány: A filantróp kockajátéka
Tegyük fel, hogy MrBeast a következő játékot ajánlja fel két matematikusnak.
Mindketten egy szabályos hatoldalú kockával dobnak. Ha valaki 1-est dob, az eredménye 0. Ha viszont nem 1-est dob, akkor dönthet, hogy elfogadja a dobott értéket mint eredményt, vagy újradob. Újradobni bármennyiszer lehet, de 1-es után mindenképpen meg kell állni, és az eredmény 0. Miután mindketten befejezték a dobásukat, MrBeast annyiszor tízezer dollárt tesz egy táskába, amennyi a dobásaik végső eredményeinek összege. A játék végén ha valaki a másiknál többel járult hozzá a táska tartalmához, az elsétálhat a táskával.
A két játékos egymástól függetlenül dönt, azaz nem látják egymás dobását, és annak sincsenek tudatában, hogy a másik hányszor dob újra, de a játék előtt mindkét matematikussal külön beszélgetnek. Az egyiküknek nagyon rossz napja volt, reggel kiszakadt a nadrágja, magára öntötte a kávét, és lekéste a buszt, ezért ő elmondja, hogy abban az esetben, ha nem 1-est dob, akkor biztos azonnal megáll, nem akar kockáztatni ezen a szerencsétlen napon, nehogy másodszorra esetleg 1-est dobjon.
A másik matematikus elmondja a kamerába, hogy ő már kiszámította, hogy a végső dobás várható értékének maximalizálásához mi az optimális stratégia, és aszerint fog játszani.
A Youtube-on nézi ezt a kollégájuk, aki szintén matematikus. Hallva, hogy mik a stratégiák, azt mondja, hogy hiába nagyobb a végső dobás várható értékét maximalizáló stratégiával játszó matematikus végső dobásának várható értéke a másik játékos végső dobásának várható értékénél, mégsem fogja 50%-nál nagyobb valószínűséggel megnyerni a pénzt. Igaza van?
Ebben a játékban nem igaz, hogy ha veszítesz, akkor a másik biztosan nyer. Mi következik ebből?
Hogy lehet az, hogy az egyik matematikus átlagosan jobb eredményt ér el a végső dobásával, mégsem nyer többet, mint az esetek fele? Úgy, hogy többször nyer ugyan, mint a másik játékos, de nem többször, mint az esetek fele, ugyanis előfordulhat döntetlen, amikor senki nem viszi el a táskát! Nézzük meg ebben az esetben mi a helyzet.
Vizsgáljuk meg először, hogy mi a várható értéket optimalizáló stratégia. Fontos megállapítás, hogy abban az esetben, ha újra dobunk, ugyanolyan helyzetbe kerülünk vissza, tehát az optimális stratégia nem függhet attól, hogy előtte hányszor dobtunk már újra, hiszen a kockának nincs emlékezete.
Ha egy adott értéket érdemes elfogadni, akkor nyilván minden nagyobbat is érdemes elfogadni. Egy adott stratégiát tehát az jellemez, hogy mekkora kockadobás az, amit már elfogadunk és nem dobunk újra. Eszerint ötféle stratégia lehet: csak a 6-ost fogadjuk el, vagy 5-öt és fölötte, és így tovább. Ezekre az esetekre külön-külön végigszámolhatnánk a várható értékeket, és megnézhetnénk, hogy melyik a legjobb.
De nem kell mindegyiket végigszámolni. Tegyük fel, hogy V az optimális stratégia szerinti várható nyeremény, ami definíció szerint a lehetséges kimenetelek értékeinek valószínűségekkel súlyozott átlaga. Az egyik lehetséges kimenetel a 0 nyeremény 1/6 eséllyel. A többi esetben, amikor k > 1 a dobás értéke, akkor kiszállhatunk k-val, vagy továbbmehetünk, és akkor a várható nyeremény V. Hogy érdemes-e továbbmenni azt, az határozza meg, hogy melyik nagyobb, amit max(k,V)-vel jelölünk. Ilyen módon kihasználva azt, hogy a dobás elvetése esetén ugyanolyan helyzetbe kerülünk vissza, V-re ezt az egyenletet írhatjuk fel:
V = (1/6)·0 + (1/6)·max(2,V) + (1/6)·max(3,V) + (1/6)·max(4,V) + (1/6)·max(5,V) + (1/6)·max(6,V).
Ha feltesszük, hogy V értéke 3 és 4 közé esik, akkor a max-os részeket egyértelműen be tudjuk írni: V = (1/6)·V + (1/6)·V + (1/6)·4 + (1/6)·5 + (1/6)·6, amiből V-re a feltett feltétellel konzisztens V = 15/4 = 3,75 eredményt kapunk. Amiből tehát az adódik, hogy a végső dobás értékét maximalizáló stratégia szerint 2-nél és 3-nál újradobunk, afölött elfogadjuk a dobást.
Mármost nézzük, hogy ez a stratégia hogyan teljesít a játékban az újradobást nem forszírozó stratégiával szemben? Az újradobást nem forszírozó matematikus esetében minden dobásnak 1/6 a valószínűsége. A másik matematikus viszont 2-nél és 3-nál soha nem áll meg, a maradék lehetőségekből viszont egyik se kitüntetett a kocka számára, ezért 1/4 valószínűséggel 0, 4, 5, vagy 6 lesz a végső eredmény.
Ha ezután a lehetséges párosításokat végigszámoljuk, akkor azt találjuk, hogy 50 százalékban nyer az optimális stratégia, 1/3-ban veszít, és 1/6 a valószínűsége a döntetlennek. Nézzük részletesen a nyerést: 0-val nem lehet nyerni; 4-gyel akkor lehet, ha a másik 4 alatt dob; 5-tel akkor, ha 5 alatt; 6-tal akkor, ha 6 alatt. Ezen esetek valószínűségeinek az összege (1/4)·(3/6) + (1/4)·(4/6) + (1/4)·(5/6), ami együtt pont (3+4+5)/24 = 1/2.
A félős stratégia tehát valóban rosszabb, de ettől még a jobb stratégiával játszó matematikus nem fog tudni 50 százaléknál nagyobb valószínűséggel elsétálni a pénzzel teli bőrönddel.
Ha szereted a fejtörőket, tekintsd meg korábbi feladványainkat is! Ha megjegyzésed lenne, vagy feladványt javasolnál, írj az eszventura@qubit.hu e-mail címre! Ha pedig tetszik a rovat, ezt a Vendégkönyvben kifejezésre juttathatod.
Az Ész Ventura feladványügyi rovat gazdája: Gáspár Merse Előd fizikus, kognitív kutató, társasjáték-fejlesztő és bűvész.








