Počítačová simulace turnajů
Simulátor turnajov nájdete na tejto adrese. Podrobnosti simulovaného modelu sú v tomto článku.
Jeden z hráčov klubu označil hranie klubových barometrov za nezmysel, keď pri danom počte párov možno hrať plný Howell - systém každý s každým.
Barometre pri plnom počte stolov 6 alebo 5 som navrhol organizovať v utorky (ak sa nás nezíde dostatok párov na skupinovku) hlavne z troch dôvodov:
· pri 6 stoloch by sme odohrali iba 22 rozdaní
· tak či tak máme namiešané dve sady rozdaní a pri klasickom turnaji jedna sada bola miešaná zbytočne
· chcem mať otestovaný program na vyhodnocovanie Barometrov, aby som ho vedel bez problémov použiť, ak by som niekde barometer rozhodoval
Jedným z argumentov, prečo hrať Howell bolo tvrdenie, že Howell je spravodlivejší systém, ako barometer. Rozhodol som sa tvrdenie, ktorý systém organizácie turnaja je "spravodlivejší" matematicky otestovať. Jedným z prístupov by bol matematický dôkaz, zvolil som však simuláciou s využitím metódy Monte Carlo.
Ako merať spravodlivosť / nespravodlivosť výsledného poradia?
Zaviedol som dve miery nespravodlivosti poradia. Majme 12 párov, ktorých poradie objektívnej výkonnosti je od najlepšieho po najhorší 1 až 12. Najspravodlivejšie možné poradie je také, ktoré úplne presne korešponduje s touto výkonnosťou, teda 1 je 1., 2 je 2. až 12 je 12.
Lineárna miera nespravodlivosti je súčtom absolútnych hodnôt rozdielov medzi očakávaným a výsledným poradím, čiže ak si 1 a 2 vymenia miesta, LN je 2, ak bude poradie 2, 3, 1 a ostatní budú na svojich miestach LN je 4, atď. LN pokladá za rovnako nespravodlivé poradia 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11 a 12, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 1. S tým by možno mnohí súhlasili, ale opačné poradie, než je očakávané 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 LN pokladá za rovnako nespravodlivé, ako je poradie 7, 8, 9, 10, 11, 12, 1, 2, 3, 4, 5, 6. Ak však prvé poradie pokladáme za nespravodlivejšie, mala by sa zadefinovať nejaká iná miera nespravodlivosti. Takouto mierou je napríklad kvadratická nespravodlivosť KN: súčet druhých mocnín rozdielov medzi očakávaným a výsledným poradím.
Dali by sa zadefinovať aj iné miery nespravodlivosti, v simulácii som pracoval s týmito dvoma.
Výsledky simulácie
Na začiatku som testoval rôzne druhy prvotných nasadení do prvého kola barometra. Iba z hľadiska spravodlivého výsledného a očakávaného poradia vyšlo ako najspravodlivejšie nasadenie B6: 1-12, 11-2, 3-10, 9-4, 5-8, 7-6, druhé najspravodlivejšie vyšlo nasadenie B4: 1-7, 8-2, 3-9, 10-4, 5-11, 12-6 a tretie najspravodlivejšie vyšlo náhodné nasadenie párov do prvého kola.
Hoci je nasadenie B6 z pohľadu takto definovanej spravodlivosti najspravodlivejšie, zo športového hľadiska je neprípustné. Nasadenie B4 sa napríklad používa v šachu a pokiaľ by sme vedeli dobre odhadnúť výkonnosť párov, mohli by sme ho používať. Problémom však je, že vlastne nemáme objektívne meradlo výkonnosti párov. Mohol by ním byť klubový rebríček, ale ten meria výkonnosť jednotlivcov a nie hráčov, nehovoriac o tom, že mnohí kvalitní hráči chodia do klubu len v utorok, takže v rebríčku sú oveľa nižšie, než je ich reálna výkonnosť. Keďže simulácie svedčia o tom, že ostatné nasadenia do barometra zohľadňujúce výkonnosť, spravodlivosť výsledného poradia znižujú, asi budeme do barometrov nasadzovať losom.
Po otestovaní barometrov som implementoval aj simuláciu systému Howell. Pre 11 kolový Howell po 2 rozdania v sade po nasimulovaní 1000 turnajov vyšlo, že spravodlivosť výsledného poradia oproti očakávanému poradiu je výrazne nižšia, než spravodlivosť výsledného poradia po 7 kolách barometra po 4 rozdania. B7 - KN=53.912, LN=18.854; H22 - KN=59,594, LN=20.036 KN je +10% a LN je +6%.
Pre objektívnosť treba spomenúť, že keď sa Howell zmenil na turnaj s 33 rozdaniami a barometer sa zmenil tiež na 11 kôl po 3 rozdania, tak Howell vyšiel trošičku lepšie.
Vo verzii 1.4 som implementoval aj Mitchell, ale s pohybom kariet, ako je to na BBO - v danom kole hrajú všetci naraz tie isté rozdania. Je možné, že toto zavádza do simulácie systematickú chybu. Pri 6 stoloch sa však klasický Mitchell vlastne ani hrať nedá. Všetky druhy nasadení do M vyšli ako výrazne horšie z hľadiska nespravodlivosti KN a LN a až na náhodné nasadenie neboli neutrálne vo vzťahu k priemernému umiestneniu párov.
Závery
· Barometer 7 kôl po 4 rozdania je, podľa vyššie definovaných mier spravodlivosti, spravodlivejší, než Howell na 22 rozdaní.
· Ak by sa B alebo H hrali na 33 rozdaní, oba spôsoby organizácie turnaja sú približne rovnako spravodlivé.
· Do barometra budeme nasadzovať losom. Simulácia síce nepreukázala priame zvýhodnenie/znevýhodnenie žiadneho páru prvotným nasadením, ale nasadenie losom je podľa simulácie spravodlivejšie, než nasadenia podľa zle odhadnutej výkonnosti.
· Simulácia jasne ukázala, že nevyrovnané pole generuje silne znáhodnené poradie, lepšie páry síce figurujú štatisticky vyššie, ale môžu napriek nadpriemernému výkonu, skončiť na dne tabuľky.
· Mitchell je z hľadiska očakávaného a výsledného poradia najmenej spravodlivý systém (pri 6 stoloch, ale možno predpokladať, že to bude podobné, aj pri vyššom počte stolov).
· V zápornej kvadratickej nespravodlivosti Mitchell s vyváženými linkami vychádza, ako najspravodlivejší. Zásadným problémom naďalej je, či možno dobre odhadnúť výkonnosť párov a zostáva problém s neutralitou systému vo vzťahu k priemernému poradiu jednotlivých párov.
Viete zadefinovať iné miery spravodlivosti výsledného poradia?
Mňa napríklad napadli:
· diagonálna spravodlivosť - súčet počtov umiestnení párov rovných očakávanému umiestneniu (tieto počty sa nachádzajú na diagonále štvorca výsledných poradí párov) Poradie kde si vymenia miesta susediace páry však bude mať spravodlivosť rovnú nule.
· diagonálna semispravodlivosť - diagonálna spravodlivosť plus polovica z počtu umiestnení párov +- jedno miesto oproti očakávaniu
· záporná kvadratická nespravodlivosť - započítajú sa len kvadratické nespravodlivosti párov, ktoré sú nižšie než sa očakávalo (subjektívne pár vníma ako nespravodlivé len poradie horšie než sa očakáva, lepšie poradie nepokladá za nespravodlivosť)
· vážená nespravodlivosť - lineárna nespravodlivosť, v ktorej pár 1 má váhu 12, 2 - 11, až 12 má váhu 1 (ak preferujeme, aby najlepší boli približne na svojich miestach a nevadí nám, ak slabší pár je výrazne inde, než sa papierovo očakáva)
· záporná vážená nespravodlivosť - to isté, ale by sa započítali len umiestnenia nižšie než sa očakáva
Literatúra:
J. R. Manning: Mathematics of Duplicate Bridge Tournaments
|