Cím: Egy reklámfogás, és ami mögötte van
Szerző(k):  Velkeyné Gréczi Alice 
Füzet: 2003/március, 131 - 138. oldal  PDF  |  MathML 
Témakör(ök): Szakmai cikkek

A szöveg csak Firefox böngészőben jelenik meg helyesen. Használja a fenti PDF file-ra mutató link-et a letöltésre.

Manapság eléggé elterjedt, hogy a különböző cégek úgy igyekeznek növelni termékük fogyasztását‐vásárlását, hogy a termékben elrejtenek valamit, és ajándékot ígérnek annak, aki ezekből meghatározott számút összegyűjt és visszaküld. Az alábbiakban ehhez kapcsolódóan fogalmazunk meg egy konkrét feladatot, és megvizsgáljuk, hogy a valószínűségszámítás eszközeit alkalmazva hogyan oldható meg.
A feladat: ,,Tegyük fel, hogy egy bizonyos fajta üdítőitalban a gyártó minden kupak belsejében egy színes négyzetet helyezett el. Ha össze akarjuk gyűjteni mind a hat különböző színű négyzetet (mondjuk azért, mert jutalom jár érte), előreláthatólag hány darab üdítőt kell vennünk?'' (Játékos kedvű olvasóink megtippelhetik a választ!) A megoldás során fontosak lesznek az alábbi feltételek: minden termékben van pontosan egy színes négyzet, ,,nagyon sok'' van a termékből, és a színek eloszlása egyenletes.
A cikkünkben előforduló, a valószínűségszámítás témaköréhez kapcsolódó fogalmak jelentését igyekszünk megmagyarázni, de terjedelmi okokból ezeket nem tárgyalhatjuk részletesebben. (Ha valaki többre kíváncsi, annak ajánljuk például [2]-t vagy [3]-at.)
Az első, amiről szólnunk kell, az a valószínűségi változó. Nos, megtévesztő neve ellenére ez egy függvény, amely egy véletlen esemény minden lehetséges kimeneteléhez egy-egy valós számot rendel. Diszkrét valószínűségi változóról beszélünk akkor, ha egy valószínűségi változó véges sok vagy legfeljebb megszámlálhatóan végtelen sok értéket vehet csak fel. (Cikkünkben kizárólag ilyen valószínűségi változók fordulnak majd elő.) A valószínűségi változót a továbbiakban X-szel jelöljük. Azt, hogy egy valószínűségi változó az egyes értékeit mekkora valószínűséggel veszi fel, a valószínűségi változó eloszlásának nevezzük. Vegyünk például egy szabályos alakú dobókockát, írjunk egyik lapjára 3-ast, két lapjára 6-ost, a maradék három lapra pedig 8-ast. Az X valószínűségi változó értéke legyen kockadobás esetén a felül levő szám. X értékeit és eloszlását a következő táblázatból olvashatjuk le:

A valószínűségi változó értékei368A valószínűségi változó eloszlása161312

Ha nagyszámú kísérletet végzünk, akkor az X valószínűségi változó megfigyelt értékeinek a számtani közepe egy adott szám körül ingadozik, ez a valószínűségi változó várható értéke, amit általában E(X)-szel jelölünk. A várható érték definíciója diszkrét valószínűségi változó esetén a következőképpen szól:
Ha az X diszkrét valószínűségi változó értékei x1,x2,...,xn,..., és ezeket rendre p1,p2,...,pn,... valószínűséggel veszi fel, akkor a várható érték E(X)=ipixi, amennyiben az összeg értéke véges.
Fenti dobókockás példánknál eszerint a várható érték
E(X)=316+613+812=6,5.
Ha a kísérletnek végtelen sok kimenetele lehetséges ‐ például egy érmét dobálva azt figyeljük, hányadik dobásra kapunk először fejet ‐, akkor a fenti definícióban végtelen tagú összeg, úgynevezett végtelen sor szerepel. A várható érték akkor létezik, ha ez a sor az analízis kritériumai szerint konvergens, a várható érték pedig a sor összege. A pozitív tagú konvergens sorok ugyanúgy kezelhetők, mint a véges összegek, ilyen sor tagjai átrendezhetők, csoportosíthatók, a sor tagonként szorozható egy számmal, ilyen sorok összege tagonként összegezhető. A cikkben ezeket az átalakításokat hivatkozás nélkül használjuk.
Nem minden valószínűségi változónak van várható értéke; ha van, akkor sem feltétlenül egyezik meg valamelyik xi értékkel, és ha mégis, egyáltalán nem biztos, hogy az egyúttal a legvalószínűbb érték is.
Térjünk most vissza az eredeti problémához.
 
Az 1. megoldásban az X valószínűségi változó jelentse azt, hogy hányadik üdítőt megvásárolva kapjuk meg először mind a hat különböző színt. Nyilván legalább hat üdítőt kell vennünk, így X lehetséges értékei: 6,7,8,9,.... A kérdés az volt, hogy előreláthatólag hány üdítőt kell vásárolnunk. Mit is jelent majd az a szám, amit kapunk? Nyilván nem azt, hogy akárhányszor megismételve a vásárlást, mindig pontosan ennyi üdítőt megvéve jutunk hozzá a hat színhez. A kapott szám jelentése az, hogy ha nagyon sokszor kezdünk a gyűjtéshez, vagy ‐ ami ugyanaz ‐ nagyon sokan vásárolják a színes palackokat, akkor a szükséges vásárlások átlaga e szám körüli érték lesz. Nem mást keresünk tehát, mint az X valószínűségi változó várható értékét. A várható érték meghatározásához ismernünk kell az X valószínűségi változó eloszlását, azaz azt, hogy az egyes konkrét értékek (6,7,8,9,...) milyen valószínűséggel állnak elő. Általánosan megfogalmazva: mennyi annak a valószínűsége, hogy pontosan az n-edik üdítőt megvéve jutunk hozzá először mind a hat különböző színű négyzethez? Ezt úgy határozzuk meg, hogy a kedvező esetek számát elosztjuk az összes eset számával. Az n helyre 6 különböző színt 6n-féleképpen választhatunk ‐ ez az összes eset. A kedvező esetekben az első (n-1) vásárlásnál csak 5-féle szín fordul elő, de mind az 5 legalább egyszer.
Hogy hány ilyen eset van, azt a szitaformula1 segítségével számoljuk össze. A szitaformula a következőképpen szól:
Ha van N darab tárgyunk, amelyek az a1,a2,...,an tulajdonságok némelyikével rendelkezhetnek, és N(xyz...)-vel jelöljük az x,y,z,... tulajdonsággal rendelkező tárgyaknak a számát, akkor az adott tárgyak közül azoknak a száma (N*), amelyek a felsorolt tulajdonságok közül egyikkel sem rendelkeznek, a következő:
N*=N-(N(a1)+N(a2)+...+N(an))+(N(a1a2)+...+N(an-1an))--(N(a1a2a3)+...+N(an-2an-1an))+...+(-1)nN(a1a2...an).

Hogyan alkalmazható ez a mi esetünkben? Ha a vásárláskor kapott színeket bejelöljük egy papíron (mondjuk megfelelő színű pöttyöket rajzolunk egymás mellé), akkor (n-1) vásárlás után kapunk egy (n-1) darab színes pöttyből álló láncot ‐ egy ilyen lánc lesz a szitaformulában említett tárgy. Mivel 5 színből (n-1) helyre 5n-1-féleképpen történhet a választás, N értéke 5n-1. Az ai tulajdonság (i=1,2,3,4,5) jelentse azt, hogy az i-edik szín nem szerepel a láncban (az aij jelentse azt, hogy az i-edik és a j-edik szín sem szerepel, és így tovább). Ezen értelmezések alapján N* a mi esetünkben azon láncok számát jelenti, amelyeknél mind az 5 szín előfordul. (Ez az, amit keresünk.) N(a1)+N(a2)+...+N(a5) azon láncok száma, amelyekben 1 szín nem szerepel. Hogy melyik, azt az 5 szín közül (51)=5-féleképpen választhatjuk ki, a maradék 4 színből pedig 4n-1-féleképpen történhet a választás. Tehát az ilyen láncok száma 54n-1.
N(a1a2)+...+N(a4a5) azon láncok száma, amikor 2 szín nem szerepel. Azt, hogy melyik 2 szín marad ki, (52)=10-féleképpen választhatjuk ki, a maradék 3 színből 3n-1-féleképpen választhatunk, tehát 103n-1 ilyen láncot kapunk.
Hasonlóképpen folytatva, azon láncok száma, amelyeknél 3 szín nem szerepel 102n-1, és 5 olyan lánc van, amelyből 4 szín is hiányzik.
Így N*=5n-1-54n-1+103n-1-102n-1+5. Mivel azonban az első (n-1) vételnél elő nem forduló színt 6-féleképpen választhatjuk meg, a kedvező esetek száma: 6(5n-1-54n-1+103n-1-102n-1+5).
A keresett valószínűséget pn-nel jelölve tehát
pn=6(5n-1-54n-1+103n-1-102n-1+5)6n==(56)n-1-5(46)n-1+10(36)n-1-10(26)n-1+5(16)n-1.
Nézzük ezek után a várható érték kiszámítását:
E(X)=n=6npn=n=6n(56)n-1-5n=6n(46)n-1++10n=6n(36)n-1-10n=6n(26)n-1+5n=6n(16)n-1.
Az együtthatóktól eltekintve hasonló szerkezetű végtelen sorokat látunk, amelyek n=6nqn-1 alakban írhatóak fel általában. Jelöljük ezt a kifejezést S-sel és szorozzuk be az egyenlőséget q-val:
qS=6q6+7q7+8q8+9q9+10q10+...+nqn+.
Vonjuk ki egymásból a két egyenlőséget:
(1-q)S=6q5+q6+q7+q8+q9+...+qn+...==6q5+q6(1+q+q2+q3+...+qn+).
Felhasználjuk, hogy ha |q|<1, akkor az 1+q+q2+...+qn+ végtelen mértani sor konvergens, és összege 11-q. Így (1-q)S=6q5+q611-q. Ebből S-et kifejezve,
S=q56-5q(1-q)2.

A q helyébe most már beírhatjuk az 56, 46, 36, 26, 16 számokat (amelyekre |q|<1 teljesül), így a várható érték:
E(X)=66(56)5-120(46)5+140(36)5-97,5(26)5+37,2(16)5=14,7
Ugyanezt a várható értéket másképpen is meghatározhatjuk.
 

2. megoldás a várható érték additivitására épül, ugyanis könnyen igazolható, hogy ha az X valószínűségi változó az X1,X2,...,Xn valószínűségi változók összegeként áll elő, azaz X=X1+X2+...+Xn, akkor E(X)=E(X1)+E(X2)+...+E(Xn) is teljesül.
Az X1 valószínűségi változó jelentse azt, hogy hány üdítőt megvásárolva jutunk hozzá az első színhez, X2 azt, hogy ezután hány üdítőt kell vennünk, hogy a második színhez is hozzájussunk, és így tovább. Nyilvánvaló, hogy az Xi-k összege (i=1,2,3,4,5,6) éppen az X valószínűségi változó. (Az is jól látható, hogy az Xi-k értéke egymástól független. A függetlenség a várható érték additivitásának nem szükséges feltétele, de később fontos szerepe lesz.)
Az első üdítő megvásárlásával a kupakban olyan színes négyzetet találunk, amilyen még nincs a birtokunkban, tehát E(X1)=1. A következő megvásárolt üdítő kupakjában 56 valószínűséggel lesz olyan színű négyzet, amely különbözik az elsőtől.
Mennyi a második szín megszerzéséhez szükséges vásárlások várható értéke, azaz E(X2)?
Ez az alábbi módon határozható meg (a várható érték definíciója alapján):
1-szer annak a valószínűsége, hogy csak egy vásárlás kell + 2-szer annak a valószínűsége, hogy két vásárlás szükséges és így tovább a végtelenségig, hiszen elvileg semmi nem zárja ki, hogy mindig az első színű négyzetet találjuk a kupakban. Tehát
E(X2)=1(56)+2(16)(56)+3(16)2(56)+4(16)3(56)+...==(56)[1+2(16)+3(16)2+4(16)3+...].
A szögletes zárójelben lévő végtelen sor összege (65)2, ez az 1. megoldásban alkalmazott átalakításokkal könnyen igazolható. Ha már van két különböző színű négyzetünk, 46 valószínűséggel találunk egy újabbat bármely üdítőital kupakjában. Az előzőekhez teljesen hasonlóan belátható, hogy a harmadik szín megszerzéséhez szükséges vásárlások számának várható értéke 64, és ugyanígy, a negyedik színé 63, az ötödiké 62 és az utolsóé 61.
Az összes különböző színű négyzet megszerzéséhez szükséges vásárlások számának várható értéke eszerint
1+65+64+63+62+61=14,7.

A 2. megoldás persze egyszerűbbé válik egy hivatkozással: az Xi-k eloszlását geometriai eloszlásnak2 nevezzük, aminek várható értéke a ,,siker'' valószínűségének a reciproka.
Megkaptuk tehát a várható értéket (többféleképpen is), de ez csak egy ,,elméleti'' érték, amely körül a ténylegesen szükséges vásárlások száma ingadozik. Így hiába 14,7 a várható érték, lehet, hogy 50-nél is több üdítőt kell vennünk, hogy hozzájussunk a hat színhez, míg ha szerencsések vagyunk, akár 6 vásárlás is elég. De vajon mennyi az esélye, hogy ilyen sok (vagy ilyen kevés) üdítőt kell vennünk? (Józan eszünkre hallgatva azt mondanánk, hogy nem sok!) Hogy mégis mekkora, arról akkor tudunk többet mondani, ha meghatározzuk, hogy a valószínűségi változó tényleges értékei hogyan ingadoznak a várható érték körül. Ezt az ingadozást méri a szórás, amelynek négyzete a szórásnégyzet, melyet a továbbiakban D2(X)-szel jelölünk. A szórásnégyzet azt mutatja meg, hogy mennyi az X valószínűségi változó és az E(X) várható érték eltérése négyzetének a várható értéke, azaz:
D2(X)=E([X-E(X)]2).
D2(X)=E(X2)-(E(X))2 összefüggés segítségével a szórásnégyzet sok esetben egyszerűbben számolható ki, az első megoldásban bevezetett X valószínűségi változó szórásnégyzetének meghatározásakor is érdemes alkalmazni. Mivel azonban ez hosszadalmas (bár nem nehéz) számolgatást igényel, így terjedelmi okokból ezt nem közöljük. Dobókockás példánk szórásnégyzete az összefüggés alapján:
D2(X)=(916+3613+6412)-6,52=3,25.
A második megoldásban említett geometriai eloszlás szórását használva egyszerűen megkaphatjuk a szórást, a szórásnégyzetek additivitására építve. (A szórásnégyzetek additivitásához szükséges a valószínűségi változók függetlensége, és ez a 2. megoldásban bevezetett Xi-kre teljesül is.) A geometriai eloszlású X valószínűségi változó szórásnégyzete általában: D2(X)=1-pp2, ahol p annak az eseménynek a valószínűsége, amelynek első előfordulását a kísérlet során figyeljük.
A mi esetünkben az első színig a szórásnégyzet 0; (mert mindig az első húzás adja az első színt, tehát p=1); a továbbiakban:
  a második szín húzásáig a szórásnégyzet:0,24, p=56  a harmadik szín húzásáig a szórásnégyzet:0,75, p=46  a negyedik szín húzásáig a szórásnégyzet:2, p=36  az ötödik szín húzásáig a szórásnégyzet:6, p=26  a hatodik szín húzásáig a szórásnégyzet:30, p=16.  
Innen tehát a szórásnégyzetek összege:
D2(X)=0+0,24+0,75+2+6+30=38,99.
A szórás ennek a négyzetgyöke, azaz 6,2442.
Tehát a várható érték 14,7, és most már azt is tudjuk, hogy ettől a valószínűségi változó értékei átlagosan kb. 6,2-del térnek el. Ez önmagában még mindig nem sokat mond, hiszen egy konkrét esetben a szükséges vásárlások száma sokkal többel is eltérhet a várható értéktől, mint a szórás. A ,,túlságosan nagy'' eltérésnek azonban kicsi a valószínűsége, és ezt a Csebisev-egyenlőtlenség segítségével becsülni is tudjuk. A Csebisev-egyenlőtlenség a következőképpen szól:
Ha b egy tetszőleges 1-nél nagyobb valós szám, akkor annak a valószínűsége, hogy a valószínűségi változó a várható értéktől a szórásnak több mint b-szeresével eltér, nem nagyobb, mint a b négyzetének reciproka.
Ugyanez ,,formálisan'':
P(|X-E(X)|bD(X))1b2.
Ennek segítségével például megállapíthatjuk, hogy 27-nél több üdítőt (ami a várható értéktől kb. kétszórásnyira tér el) legfeljebb 0,25 valószínűséggel kell majd vásárolnunk. Ha a bD(X) kifejezést ε-nal helyettesítjük, akkor az egyenlőtlenséget a következő alakban is írhatjuk: P(|X-E(X)|ε)D2(X)ε2.
Ezt a formát alkalmazva arra tudunk felső korlátot adni, hogy a tényleges vásárlások milyen valószínűséggel esnek a várható érték körüli szimmetrikus intervallumon kívülre, illetve: legalább mekkora valószínűséggel esnek egy adott szimmetrikus intervallum belsejébe. Az egyenlőtlenségnek ez az alakja bizonyos esetekben kedvezőbb lehet. Legfeljebb mennyi a valószínűsége például annak, hogy legalább 50 üdítőt kell vásárolnunk? Az 50 a várható értéktől 50-14,7=35,3-del tér el, és mivel most az X valószínűségi változó nem vehet fel 6-nál kisebb értéket, alkalmazhatjuk a Csebisev-egyenlőtlenséget ε=35,3-re: P(|X-14,7|50)38,9935,32, ami körülbelül 0,03. Így nem nagy, legfeljebb 3 százalék a valószínűsége annak, hogy 50-nél több üdítő kell. (Vajon mennyi a valószínűsége annak, hogy 6 darab üdítő is elég? Ennek kiszámolásához nem kell a Csebisev-egyenlőtlenség!)
A Csebisev-egyenlőtlenséget alkalmazva meghatározható, hogy 6 és 27 között lesz a szükséges vásárlások legalább 74%-a, s minimum 89% biztonsággal állíthatjuk, hogy elég 34 üdítőt vásárolni ahhoz, hogy meglegyen mind a hat szín. (A Csebisev-egyenlőtlenség előnye, hogy igen egyszerű és gyors számolással kaphatunk becsléseket a valószínűségre. Természetesen egy komolyabb (például grafikus) számológéppel viszonylag egyszerűen a pontos értékeket is megkaphatjuk. Így jelen esetben ,,igazából'' már több mint 0,95 a valószínűsége annak, hogy 28-nál kevesebb üdítő megvásárlásával jutunk hozzá a hat színhez!) Most már válaszolhatunk az eredeti kérdésre: átlagosan 15 üdítőt kell vásárolnunk, ha mind a hat színhez szeretnénk hozzájutni, és csak nagyon ritkán haladja meg a 27-et a szükséges vásárlások száma. (Ennek az esélye kisebb, mint 0,05.)
Felvetődhet még az a kérdés, hogy milyen n-re lesz az 1. megoldásban bevezetett pn valószínűség a legnagyobb. Vajon a várható érték, azaz 14,7 közelében, vagy egészen máshol? Aki már valaha kiszámolta azt, hogy egy szabályos dobókockával dobálva hányadik dobásnál a legvalószínűbb például az első 6-os szám dobása ‐ az elsőnél, bármennyire is hihetetlen ez annak, aki Ki nevet a végén-t szokott játszani! ‐ az sejtheti, hogy n értéke nem lehet túl nagy. Ha kiszámoljuk pn néhány értékét (n=6-tól kezdve) azt tapasztaljuk, hogy n=11-ig egyre nő a valószínűség, onnantól pedig csökken. Bebizonyítjuk, hogy ha n>10, akkor pn>pn+1, így tényleg n=11-nél van pn maximuma.
Állításunk azt jelenti, hogy minden 10-nél nagyobb n-re:
(56)n-1-5(46)n-1+10(36)n-1-10(26)n-1+5(16)n-1>>(56)n-5(46)n+10(36)n-10(26)n+5(16)n.
Szorozzuk be 6n-nel az egyenlőtlenséget:
65n-1-304n-1+603n-1-602n-1+30>5n-54n+103n-102n+5.
A jobb oldalon az rn=rrn-1 felbontások után rendezzük a bizonyítandó egyenlőtlenséget:
5n-1-104n-1+303n-1-402n-1+25>0.
Az n számításba jövő legkisebb értéke 11, ezt behelyettesítve a bal oldalon pozitív számot kapunk. Ha n>11, vezessünk be új változót, legyen n=k+12, ahol k természetes szám. Így n-1=k+11. Ezt beírva és alkalmazva a hatványozás azonosságát, az egyenlőtlenség a következőképpen alakul:
5115k-104114k+303113k-402112k+25>0.
Mivel 511>10411 és 30311>40211, és a nagyobb együtthatókat mindkét esetben nagyobb szám hatványával szorozzuk, az egyenlőtlenség bal oldalán pozitív szám áll. Mivel ekvivalens átalakításokat végeztünk, az eredeti állítás is igaz, tehát pn maximuma valóban n=11-nél van.
 
Nem csak szubjektív érzéseinkre kell tehát hagyatkoznunk, ha nyerési esélyeinket latolgatjuk. (És egy cég korrektségét is tudjuk mérni az eredmények birtokában, hiszen ha a tényleges tapasztalatok ellentmondanak a kiszámított értékeknek, akkor lehet, hogy a színek eloszlása nem egyenletes. Ezért persze nem feltétlenül a gyártó hibáztatható; ha mindig ugyanazon a helyen vásároltunk, a szállítás is felelős lehet.)
 
Irodalom
 

[1] B. P. Gyemidovics: Matematikai analízis feladatgyűjtemény, Tankönyvkiadó, 1974.
[2] Hajnal ‐ Nemetz ‐ Pintér ‐ Urbán: Matematika IV. (B fakt), Tankönyvkiadó, 1982.
[3] Solt György: Valószínűségszámítás, Műszaki Könyvkiadó, 1997.
[4] http://www.mste.uiuc.edu/reese/cereal/intro.html.

1 bizonyítása megtalálható [2]-ben vagy a KöMaL 2001/1-es számában.

2 lásd [3], 230. oldal