ŁS 1995
|
Strategie mieszane (1)
|
z Pikiera 15 |
Dawno temu... gdy byłem jeszcze chłopcem...
pewien stary chłop na wsi pokazał mi następującą sztuczkę:
Narysował
na ścianie trzy kółka – jedno nad drugim – następnie odwrócił się i
zapowiedział, że odgadnie którego dotknąłem. I odgadł – ale nie chciał
ani wyjawić sposobu ani odgadywać ponownie.
Po latach doszedłem do przekonania, że
polegało to na próbie oceny mojej sylwetki psychicznej, i jako takie musiało
być rzecz jasna jednorazowe. Aby to sprawdzić, przeprowadzałem później ten
test wielokrotnie, najczęściej wśród brydżystów:
Testowany
siedzi przy stole, a przed nim leżą 3 karty w rzędzie, prostopadle do krawędzi.
Odwracam się i proszę, aby dotknął dokładnie jednej. Następnie próbuję ocenić
osobowość: chciwiec chce zagarnąć wszystko dla siebie, więc wyciągnie rękę jak
najdalej i dotknie karty najdalszej; skromna i cicha kobietka wyciągnie rękę
nieśmiało i trafi w najbliższą; podejrzliwy mędrek zacznie kombinować i
zdecyduje się na środkową.
Jest zdumiewające, że tak skromny zasób
reguł daje olbrzymi procent trafień. Oczywiście pod warunkiem, że nie powtarza
się testu z tą samą osobą, i – najlepiej – nie uprzedza się że
będziemy odgadywać.
Umiejętność taka – przewidywanie decyzji jaką podejmie przeciwnik
– przydatna jest oczywiście każdemu graczowi. Jak jednak to robić ? Jakiej
metody używać do odgadnięcia myśli przeciwnika ?
Edgar Allan Poe
pokazuje w noweli „Skradziony list” metodę następującą:
Znałem pewnego ośmioletniego chłopca,
którego powodzenia w odgadywaniu przy grze w „para, nie para” wywoływały
podziw powszechny. Gra ta jest łatwa, używa się do niej krągłych kamyczków.
Jeden z graczy trzyma w garści pewną ilość tych kamyczków i zapytuje
drugiego, czy liczba ich jest parzysta, czy nieparzysta. Jeśli zgadujący
odpowie trafnie, to zyskuje jeden kamyczek, jeśli zaś się pomyli, to jeden
traci. Chłopczyk, o którym nadmieniłem, wygrał wszystkie kamyczki w całej
szkole. Odgadywał on według pewnej zasady, która polega tylko na
spostrzegawczości i na przystosowaniu się do bystrości swych przeciwników.
Kiedy, na przykład, przeciwnik jego był skończonym głuptasem i podniósłszy
rękę, pytał: „Para, czy nie para ?”, dzieciak odpowiadał:
„Nie para” i przegrywał. Wszelako za następnym razem już
wygrywał, gdyż powiadał sobie w duszy: „Głuptas przy pierwszej kolejce
wziął w rękę parzystą ilość kamyczków, ale jego przebiegłość sięga zaledwie
tak daleko, iż za drugą kolejką weźmie nieparzystą, powiadam zatem nie
para”; mówi tak i wygrywa. Natomiast mając do czynienia z
przeciwnikiem nie tak ograniczonym, rozumował w ten sposób: „Ten
chłopiec wie, iż za pierwszym razem powiedziałem: „nie para”,
kiedy więc kolej przyjdzie na drugi, zaświta mu w pierwszej chwili myśl
najprostszej odmiany, mianowicie, by po parze wziąć nie parę, jak to uczynił
pierwszy głuptas; wszelako później pomyśli sobie, że ta odmiana jest zbyt
prosta, i ostatecznie weźmie ilość parzystą, jak poprzednio. Będę zatem
zgadywał: para. Powiada: „para”, i wygrywa. Otóż ten sposób
rozumowania, który koledzy uczniaka nazwali „szczęściem” – czymże jest, gdy go wyłuskamy do
ostatka ? |
Wynikałoby stąd – jeśli wierzyć
Poemu – że brydżysta powinien być dobrym aktorem, i – aby zagrać
swojego przeciwnika i w następstwie tego odgadnąć jego myśli – powinien
bacznie mu się przyglądać (przegroda na stole w rozgrywkach wysokiego szczebla
metodę tę zupełnie ukraca).
Czy przeciwnik
owego chłopca może uchronić się przed jego przenikliwością ? Jeśli zauważy że w pojedynku na odgadywanie
myśli jest gorszy, powinien... wogóle nie myśleć. Decyzję – czy wziąć parzystą czy
nieparzystą ilość kamyków? – powinien przekazać przypadkowi (losowi).
Oczywiście tak, by szansa parzystości była równa szansie nieparzystości (czyli
obie po 50%), bo przecież brak równowagi zostanie zauważony.
Niełatwo naśladować przypadek; najlepiej posłużyć się jakimś niezależnym
od nas mechanizmem. Można np sprawdzić do jakiej godziny zbliża się wskazówka
sekundnika: parzystej czy nieparzystej ?
Zbigniew Szurig spróbował kiedyś wylosować decyzję stukając w kartę
wystającą za brzeg stołu. Przeciwnik zaprotestował – najprawdopodobniej
ze złości że zmarnują się jego dotychczasowe mylące zrzutki – twierdząc
z głębokim przekonaniem, że Prawo Brydżowe zabrania losować. Szurig pomyślał
więc, i... nie trafił.
W ówczesnym Prawie Brydżowym nic jednak na ten temat nie było. Obecnie przypisek do Przepisu 40E2 stwierdza:
Gracz
nie ma prawa korzystać, ani podczas licytacji ani podczas rozgrywki, z żadnych środków
wspomagających jego pamięć, kalkulację lub technikę.
Czy losowanie należy zaliczyć do
kalkulacji ? Nie słuchać o żadnym
precedensowym orzeczeniu w tej kwestii. Kto spróbuje pierwszy ?
Co ma zrobić nasz ośmiolatek, gdy
zauważy, że jego przeciwnik przeszedł na losowanie ? Nic !
Może obstawiać najzupełniej dowolnie, np stale parzyste bądź stale
nieparzyste. O wyniku zdecyduje losowanie przeciwnika, a w dystansie wynik pojedynku
będzie zerowy.
Jeśli jednak przeciwnik zauważy regularność, to zrezygnuje z losowania i
zacznie wygrywać. Aby tego uniknąć, nasz ośmiolatek też musi przejść na
losowanie. Ostatecznie obaj będą losować (50%:50%), przez co gra stanie się
oczywiście nieciekawa, a końcowa kwota wypłaty zbliżona do zera.
Gra powyższa to najprostszy przypadek
gry ze strategiami
mieszanymi. Każdy gracz ma dwie decyzje (tj strategie, a dokładniej
– strategie czyste), które powinien podejmować z tą samą frekwencją równą
50%. Postępowanie takie nazywa się
strategią mieszaną (bo miesza się strategie czyste) i jest optymalne. Próba
odejścia od niego spowoduje w dystansie przegraną.
Łatwo się domyśleć, że istnieją gry w których należy mieszać strategie
czyste w innej proporcji niż 50%:50%, że mamy częstokroć więcej niż dwie
decyzje do wyboru, i że problematyka ta jest niezmiernie fascynująca.
Czy jednak może dotyczyć to brydża ?
Czy zdarzają się w brydżu sytuacje kiedy trzeba mieszać strategie ?
Zauważmy, że tzw palcówki (kiedy tyle samo przemawia „za” co
„przeciw” – bardzo często li tylko wskutek naszej niewiedzy)
nie są strategiami mieszanymi! Decyzje
obstawiamy wprawdzie mniej więcej po równo (może i po 50%), ale nie dlatego że
tak jest optymalnie, lecz wyłącznie dlatego że jest zupełnie wszystko jedno.
Równie dobrze moglibyśmy stale obstawiać „za” (bądź
„przeciw”), a ilość sukcesów w dystansie byłaby ta sama (50%).
Prawdziwa strategia mieszana – kiedy trzeba wybierać np jedno z
częstotliwością 70%, a drugie z częstotliwością 30% (albo np: 65%:35%, 20%80%
lub akurat 50%:50%) – może się zdarzyć (ale nie musi) tylko wtedy, gdy
nasz sukces zależy od tego co wybrał przeciwnik.
W brydżu mamy niestety dodatkową komplikację, bo oprócz przeciwnika jest
posługująca się przypadkiem natura – aktualny rozkład kart.
Jak więc jest w
brydżu ze strategiami mieszanymi ?
Gra w blokowanie
Rozważmy
blokowanie naturalnym otwarciem 3 w kolor. Niech będzie to – dla
ustalenia uwagi – otwarcie 3©, a rzecz cała niech toczy się w meczu brydżowym, w założeniach
„obie strony przed partią”.
Współczesne
typowe 3© to długi kolor i około 6 lew do wzięcia (w tym średnio 1 defensywna). Modelowa ręka: xx KDW10xxx xx xx
Niech
będzie tak, że partner blokującego ma nakazaną dużą wstrzemięźliwość w przedłużaniu
bloku bądź natychmiastowym wchodzeniu w obronę („Blok zrobił swoje”
– co zresztą jest przez wielu usilnie zalecane i stosowane).
Współczesna
typowa reakcja przeciwników na takie 3© polega na preferowaniu gry własnej – kontra jest dawana
najchętniej z czwórką pik, karny pas na kontrę z czwórką pik w zasadzie się
nie zdarza, a nad przeciwnikami wyraźnie ciąży strach, że wpadka z kontrą
będzie nieopłacalna – w sumie karność kontry wydaje się być nieco poniżej
50%.
Uznajmy,
że typowy blok i typowa reakcja są w stanie równowagi, tzn że w dystansie meczowym
saldo z takiego rozdania wynosi 0 impów. Sądzę, że odrobinę lepszy jest styl
bardziej karcący (pełne 50%), ale – wygrywanie lub obalanie końcówki budzi zazwyczaj daleko
większy entuzjazm niż mniej efektowna walka przy kontrakcie 3© (gdy pary dzielą
się lewami mniej więcej po równo), a wiadomo że mistrzowie muszą wzbudzać
podziw publiczności (tj licytować „ofensywnie”).
Podobne zjawisko opisał ongiś w „Brydżu” Krzysztof
Waśniewski: jeśli nie „dopychał” 3BA, to pogardliwie wytykano mu
bojaźliwość; jeśli natomiast wpadał na takie 3BA bez dwóch z kontrą, to nikt
nie miał większych pretensji, bo „poległ w walce”.
Skoro
wiesz jak przeciwnicy licytują przeciwko blokowi 3©, to możesz wpaść na pomysł, by od czasu do czasu zastawić na nich
pułapkę: otworzyć 3© nadal na 6 lewach, ale z dużą defensywą, np: Axx AWxxxx xx Kx, a następnie kontrować. Powinieneś na tym zarabiać,
ponieważ kontrlicytacja przeciwników jest nastawiona bardziej na grę własną niż
na ukarnianie (niekoniecznie z kontrą), a partner – przypominamy –
ma nakazaną wstrzemięźliwość.
Takie właśnie pułapki (zresztą w wielu sekwencjach skaczących)
stosują z powodzeniem „bezpasowcy” (w SSO jest oczywiście o wiele więcej
okazji do bloków, a zatem i pułapek). Dawniej – powodzenie było
olbrzymie, potem – oswojeni przeciwnicy zaczęli przeciwko SSO reagować
wstrzemięźliwiej.
Czy
powinieneś uprzedzić przeciwników, że Twoje 3© będzie od czasu
do czasu pułapką ?
Jeśli nie uprzedzisz partnera, to nie musisz ! Jeśli on sam to
zauważy i zmodyfikuje swój styl licytacji po 3© – to powinniście przeciwników uprzedzać (bo inaczej
zostaniecie oszustami). Załóżmy jednak – dla uproszczenia – że
wszyscy będą wiedzieć, że 3© jest czasem pułapkowe, a licytacja partnera nie ulega zmianie
(przypominamy o nakazanej mu wstrzemięźliwości).
Jak
mają licytować przeciwnicy ? Przeciwko pułapce powinni stosować styl bardziej
karcący (niekoniecznie z kontrą – można skarcić także wypasowaniem), ale
nie wiedzą przecież – jakie jest konkretne 3©? typowe czy pułapkowe ?
Czy mają opracować styl wypośrodkowany
między typowym a karcącym ? Jeśli pułapka będzie stosowana np raz na 10 otwarć 3©, to nawet najstarsi teoretycy nie będą w stanie wyobrazić sobie,
jak takie wypośrodkowanie ma wyglądać.
Mogą więc przeciwnicy przyjąć inną
strategię: wzorując się na Tobie zaczną sporadycznie stosować styl karcący.
Wprawdzie jeśli trafią na 3© typowe to nieco stracą, ale jeśli trafią na pułapkę – odbiją
sobie straty z nawiązką.
Pytanie
teraz – czy to wszystko Tobie się opłaca ?
Jeśli na drugim stole (grasz w meczu!)
zaczną licytować tak samo, to oczywiście saldo będzie zerowe. Załóżmy więc, że
zarówno 3© jak i reakcja na 3© będą na drugim stole typowe (uprzedziłeś wprawdzie, ale nie są
przekonani do Twojego pomysłu), i teraz dopiero zapytajmy:
Jak często masz stosować pułapkę, aby to Ci
się opłacało ? (a może nigdy!?) Jak często
przeciwnicy mają stosować styl karcący, aby zminimalizować swoją stratę ? I wreszcie – ile na tym zarobisz ?
Rozwiązywanie gry
Sporządźmy
tzw tabelę wypłat – ile impów średnio zarobisz w każdym z czterech możliwych
zdarzeń:
|
Reakcja przeciwników |
||||
Twoje 3© |
Typowa |
Karcąca |
|||
|
Typowe |
|
0 |
+ |
1 |
|
Pułapka |
+ |
4 |
– |
5 |
|
0 |
= |
bez
zysku i straty (choćby dlatego, że tak samo będzie na drugim stole) |
+ |
1 |
= |
zarobisz,
bo Reakcja Karcąca jest gorsza przeciwko 3© Typowym |
+ |
4 |
= |
zarobisz
na wpędzeniu przeciwników w wpadkę z kontrą
|
– |
5 |
= |
ale
stracisz, gdy akurat zastosują Reakcję Karcącą. |
Liczby są oczywiście w dużej mierze „wzięte z
sufitu”, ale – narazie je zaakceptuj
(a potem powtórz obliczenia z innymi i sprawdź co wyjdzie).
Przystąpmy do nieco zawikłanego
rozwiązania powyższej gry:
Obliczanie
MaxyMina (dolnej wartości gry)
Z każdego wiersza wybierz liczbę najmniejszą (będą to: 0 i
–5),
a z nich następnie największą (będzie to 0):
MaxyMin = 0
Jest to największy zysk jaki możesz sobie zagwarantować przy
jakiejkolwiek strategii przeciwników. Jeśli chcesz grać jak najostrożniej (co
nie zawsze jest równoważne grze na maxymalny zysk!), powinieneś więc stosować
tylko 3© Typowe.
Obliczanie MiniMaxa
(górnej wartości gry)
Z każdej kolumny wybierz liczbę największą (będą to: +4 i +1),
a z nich następnie najmniejszą (będzie to +1):
MiniMax = +1
Jest to najmniejsza strata jaką mogą sobie zagwarantować
przeciwnicy przy jakiejkolwiek Twojej strategii. Jeśli chcą grać jak najostrożniej
(co nie zawsze jest równoważne grze na maxymalny zysk!), powinni więc stosować
tylko Reakcję Karcącą.
Porównanie
Jeśli MaxyMin >
MiniMax:
Pomyliłeś się !
(zacznij od początku).
Jeśli MaxyMin = MiniMax:
W tej grze naogół (bo jest specyficzny wyjątek) nikomu
nie opłaca się mieszać strategii ! (przykład pokażemy później).
Jeśli MaxyMin < MiniMax:
W tej grze jest mieszanie strategii !
Jak mieszać strategie ( tylko dla gier typu 2 na 2 ! )
Oblicz
odległości dwóch liczb z każdego wiersza i każdej kolumny (np dla wiersza drugiego:
odległość między +4 a –5 wynosi 9, dla kolumny pierwszej odległość między
0 a +4 wynosi 4), i dopisz je przy tabeli:
|
Reakcja przeciwników |
|
||||
Twoje 3© |
Typowa |
Karcąca |
|
|||
|
Typowe |
|
0 |
+ |
1 |
1 |
|
Pułapka |
+ |
4 |
– |
5 |
9 |
|
|
4 |
|
6 |
|
Odległości
dopisane z prawej wskazują (po przestawieniu!!) – jak często powinieneś
stosować swoje strategie:
9 razy na 10 (90%) – 3© Typowe
1 raz na 10 (10%) – 3© Pułapkowe.
Odległości
dopisane pod spodem wskazują (po przestawieniu!!) – jak często powinni
stosować swoje strategie przeciwnicy:
6 razy na 10 (60%) – reakcję typową
4 razy na 10 (40%) – reakcję karcącą.
Jeśli
którakolwiek ze stron zmieni swoje częstotliwości, to w dystansie zacznie
osiągać gorszy rezultat (oczywiście jeśli strona przeciwna to zauważy i w
ripoście swoje częstotliwości odpowiednio zmieni). Tak więc nikomu nie opłaca
się od powyższych częstotliwości odstępować.
Obliczmy
teraz – jaki jest Twój średni zysk (a może strata ?) z każdego takiego
rozdania:
Jeśli otworzysz 3© Typowe:
w 60% zyskasz 0 (bo w tyluż %% natrafisz na reakcję typową),
w 40% zyskasz 1 (bo w tyluż %% natrafisz na reakcję karcącą),
co łącznie da ci średnio:
60% * 0 + 40% * 1 = 0,4 impa.
Sprawdź,
że tyle samo wyjdzie Ci dla 3© Pułapkowych ! Nie jest to wcale dziwne, jeśli uzmysłowisz sobie,
że częstotliwości zostały wyznaczone optymalnie dla obu stron konfliktu (punkt
równowagi).
Jeśli znasz algebrę i podstawy analizy, to
możesz rozwiązywać gry (nie tylko 2x2) badając swój łączny średni zysk jako
funkcję częstotliwości strategii.
W każdym takim rozdaniu zyskujesz więc średnio 0,4 impa !
Oznacza
to, że Twój pomysł z pułapką jest lepszy niż 3© zawsze typowe
(gdy wyszła liczba ujemna, byłby gorszy). Jeśli więc drużyna przeciwników nie
chce przegrywać, musi zacząć licytować tak samo jak Ty !!
Kwestie prawne
Zdecydowałeś że raz na 10 rozdań Twoje 3© będzie pułapkowe.
Czy powinieneś powiedzieć to przeciwnikom ? jeśli nie powiedziałeś
partnerowi (a jeśli powiedziałeś ?). Czy
przynajmniej powinieneś ich uprzedzić, że 3© jest
czasem pułapką ? A jeśli partner
zmodyfikuje nieco swoją licytację po 3© ?
Wydaje się, że należy wszystko ujawnić wszystkim !
Odzywki mieszane
Ongiś
na Kongresie w Sopocie pojawiła się para z następującą kartą konwencyjną:
1¨ = 10–15 1© = 12–16 1♠
= 14–18
przy
czym to wszystko było z układem dowolnym !!! (dziwne, ale prawdziwe: dopiero w
połowie turnieju ktoś wezwał sędziego).
Na czym to polegało – tego niestety
nie udało się wyjaśnić. Jest jednak możliwe, że otwarcie wybierali losowo, i że
istnieją tego rodzaju licytacje systemowe, które są opłacalne!
Wyobraźmy
sobie następującą modyfikację otwarć Słabe 2S:
2© = w 70% na kierach, w 30%
na pikach
2♠
=
w 70% na pikach, w 30% na kierach
z
odpowiednio ustawioną dalszą licytacją.
Jeśli nawet nie jest to opłacalne, to nie
widać powodu (jeśli nie jesteśmy World Bridge Fustiness) dla którego miałoby
być zabraniane.
Jak losować ?
Czy
wolno Ci korzystać z jakiegoś mechanizmu do losowania ? (np z sekundnika na Twoim zegarku). Jeśli
uznamy że Prawo (brydżowe) tego nie dopuszcza, pojawiają się spore kłopoty.
Losowanie „w umyśle” jest bardzo
niedoskonałe. Mimo woli pamiętasz swoje ostatnie decyzje i mimowoli starasz się
postąpić odmiennie (a przypadek nie pamięta przecież swojej historii).
Pamiętają je również przeciwnicy i w jeszcze większym stopniu partner (bo
zmieniamy go znacznie rzadziej). Tak więc Twoje decyzje będą odgadywane
częściej niż wynikałoby to ze statystyki – nawet gdyby wszyscy jak
najusilniej starali się tego uniknąć. Ponadto – jeśli będziesz miał za
dużo szczęścia, możecie narazić się na podejrzliwe spojrzenia przeciwników.
Jeśli wolno Ci będzie korzystać z mechanizmu
losującego, to z kolei pojawią się inne kłopoty, gdy będziesz to czynić jawnie
(na oczach wszystkich). Fakt losowania (bądź nielosowania!) zdradzi Twój
problem, podobnie jak zdradza go namysł (bądź brak namysłu). Musiałbyś więc dla
kamuflażu losować także gdy nie trzeba (ostrzegając przeciwników tak jak to
zaproponowano w „Cogito ergo...” w „Przeglądzie brydżowym”
2–3/1995) albo... losować zawsze.
W każdym razie liczba prawdziwa liczba
wylosowana powinna być znana tylko losującemu, bo inaczej dojdzie do
zdradzenia jego decyzji. Np jeśli otwierający rzuca kością, to nikt nie powinien
wiedzieć jakie decyzje przyporządkowane są poszczególnym wynikom (np że dwójka
oznacza zdecydowanie się na 3© Pułapkowe).
Gra w blefowanie
Rozważmy
opłacalność blefowania naturalnym otwarciem, dajmy na to 1♠:
|
Reakcja przeciwników |
|
|||
Twój 1♠ |
Normalna |
Czujna |
|
||
Normalny |
|
0 |
+ |
3 |
67% |
Blefowy |
+ |
1 |
– |
5 |
33% |
|
89 |
% |
11 |
% |
|
Wychodzi
(oblicz to sam wg podanej wcześniej recepty) – że powinieneś blefować z
częstotliwością 33%, a przeciwnicy w 11% powinni licytować
„czujnie” (np zaczajać się z silniejszą kartą, by nieświadomy
partner „powiózł” Cię do kontraktu wyższego).
Założyłeś,
że gdy przeciwnicy akurat zareagują „normalnie”, to na blefie coś
zyskujesz – zaledwie 1 imp. Bardzo powściągliwie, ale i tak przesadnie
– jest przecież partner, który bardzo często wszystko popsuje. Saldo
prawie na pewno jest więc ujemne. Przyjmij więc tylko 1 imp straty i zobacz co
się dzieje:
|
Reakcja przeciwników |
|
|||
Twój 1♠ |
Normalna |
Czujna |
|
||
Normalny |
|
0 |
+ |
3 |
|
Blefowy |
– |
1 |
– |
5 |
|
MaxyMin = 0 (większa
liczba spośród 0 i –5)
MiniMax = 0 (mniejsza liczba spośród 0 i +3)
Skoro
są równe, to – jak już nadmieniliśmy wcześniej – nikomu tym
razem nie opłaca się strategia
mieszana. Dla każdej strony optymalne
jest stałe (w 100%) stosowanie strategii znajdującej się w tym samym wierszu
(kolumnie) co liczba 0 (wspólna wartość MaxyMina i MiniMaxa). Powinieneś więc zawsze otwierać normalnie, a
przeciwnicy nigdy nie powinni stosować czujności (pozycja z liczbą 0 nazywana
jest punktem siodłowym).
W takim przypadku gra może być „jawna”, tzn Ty możesz
poinformować że otworzyłeś „normalnie”, a oni że reagują
„normalnie”. Ale bez pokazania kart.
Jeśli
uważasz że 1 imp straty był zbytnim pesymizmem, sprawdź co się dzieje przy
saldzie zerowym:
|
Reakcja przeciwników |
|
|
|||
Twój 1♠ |
Normalna |
Czujna |
|
|
||
Normalny |
|
0 |
+ |
3 |
63% |
5/8 |
Blefowy |
|
0 |
– |
5 |
37% |
3/8 |
|
100 |
% |
0 |
% |
|
|
|
8/8 |
0/8 |
|
|
Wychodzi to samo co poprzednio, z tym
że 0 znajduje się także w wierszu drugim, co oznacza zachodzenie sytuacji
szczególnej (w które obliczanie %% jest przydatne):
Nie musisz w 100% otwierać normalnie, lecz dysponujesz pewnym luzem
– możesz blefować z częstotliwością od 0% do 37%. Masz więc do wyboru
wiele strategii mieszanych (tzw przedział siodłowy). Przeciwko każdej
przeciwnicy powinni zawsze licytować normalnie, ale... jeśli wybrałeś akurat 37% oni z kolei
dysponują luzem – mogą stosować dowolną strategię mieszaną (mają luz
całkowity). Większa częstotliwość blefu jest nieopłacalna – przeciwnicy
zaczną stale stosować czujność, co zmniejszy Twoją średnią wygraną.
Najkorzystniejsze
wydaje się jednak nieblefowanie. Chociażby dlatego, że od czasu do czasu
przeciwnicy mogą jednak zareagować czujnie i zarobisz 3 impy. Z drugiej strony – przy Twoich 37%
przeciwnicy (jeśli o tym wiedzą) stają przed problemem, jak mieszać swoje
strategie. Niby wszystko jedno, ale... osiołkowi w żłoby dano (ponadto –
a nuż przekroczysz trochę te 37%).
Kto wie – może to jest właśnie
prawda o blefach ?
Zauważ
na koniec (jak to ładnie napisano w „Bez impasu”), że najłatwiej
zarobisz na ... rozpropagowaniu siebie jako blefiarza. Po kilku głośnych blefach (niekoniecznie
udanych!) przeciwnicy zasiadający przeciwko Tobie skłonni będą do licytacji
czujnej i zarobisz 3 impy bez żadnego ryzyka (bo przecież już się
nablefowałeś).
Coś jeszcze w licytacji ?
W omówionych przykładach nie poruszałem
kwestii natury – rozkładów przydzielanych z określonymi
prawdopodobieństwami przez los. To jest dodatkowa strona biorąca udział w grze
– na szczęście nie jest niczyim przeciwnikiem, ale i tak powoduje spore
komplikacje.
Jedyny znany mi przykład gry
licytacyjnej (z naturą, bardzo skomplikowany) jest w książce „Bez impasu”
(Macieszczak–Mikke, 1980, strona 75). Niestety, oparty jest na tak sztucznych
założeniach („wydumany”), że nie ma żadnej wartości użytkowej
(wyłącznie pokaz). Na oko wydaje się być bez zarzutu, ale... nie weryfikowałem.
W obszernym artykule Krzysztofa Sokołowskiego
pt „Teoria gier a brydż”
(„Problemy brydżowe”, 1992, PZBS) jest tylko odrobinka o
strategiach mieszanych (bez przykładu i algorytmu). Zresztą cały artykuł
sprawia wrażenie przeznaczonego dla erudytów (do „mówienia o”).
Zauważmy
że przykłady które podałem nie są bynajmniej nieskazitelne.
Kto wie – może strategie mieszane wogóle nie zdarzają się w
licytacji ?
Zanim ktoś poda przykład dobitniejszy,
przejdźmy do rozgrywki–wistu...
Gra w „Łapanie
Damy”
Jak przedstawić problem rozgrywkowo–wistowy jako grę w
której bierze udział także natura (tj przydzielane przez los rozkłady) pokazali
(chyba jako pierwsi) Macieszczak–Mikke w książce „Bez Impasu”
(1980) (na stronie 71):
S chce wziąć 4 lewy w
kolorze Axxx–KWxx. Gra oczywiście z ręki Asa, a następnie blotkę, i po
dodaniu blotki przez W musi podjąć decyzję – impas czy z góry.
Pytanie: Czy E powinien dorzucać dziesiątkę z
jakąś określoną częstotliwością ?
Dla
prostoty Autorzy rozważają 10 jednakowo prawdopodobnych podziałów podzielonych
na 4 grupy:
|
K W x x |
|
|
Poniżej: Wielkość
wygranej podawana jest jako średnia ilość lew branych przez WE w
10 takich rozdaniach: |
D 10 x |
N W E S |
x x |
3
podziały |
|
D x x |
10 x |
3
podziały |
||
10 x x |
D x |
3
podziały |
||
x x x |
D 10 |
1
podział |
||
|
A x x x |
|
|
|
|
Rozgrywka S |
Wist E |
||||
|
Zawsze impas |
po 10
od E z góry |
E
z 10x dokłada: |
||||
2/3 |
67% |
|
4 |
|
3 |
x |
|
1/3 |
33% |
|
4 |
|
6 |
10 |
|
|
100 |
% |
0 |
% |
|
||
|
3/3 |
0/3 |
|
Ponieważ
wygrane są podane dla WE, przy obliczaniu MaxyMina i MiniMaxa powinieneś
„czuć się” graczem E.
Jest
to ten sam przypadek co w ostatniej wersji „Gry w blefowanie"
(Czytelnik łatwo sprawdzi to i procenty), zatem:
S powinien zawsze
impasować, E natomiast z dubletona 10x powinien dokładać 10
z częstotliwością dowolną, byleby wynosiła conajmniej 1/3.
Wygląda to bardzo dziwnie ! Skoro tak wyszło dla 10x, to to samo wyjdzie
dla 7x ! Jaką strategię przyjąć więc dla
dubletona 107 ? Stawiamy 100% na 7, i jest to strategia optymalna (jedna z
wielu). Ale wówczas nic nie pozostaje dla 10.
Więc jednak nie jest optymalnie, bo dla 10 powinna być conajmniej 1/3.
Sprzeczność !
W konstrukcji gry tkwi więc gdzieś
błąd, ale bodźcem do jego odnalezienia stało się dla mnie (nawet) dopiero
pisanie niniejszego tekstu. Błąd ten jest bardzo trudny do wykrycia, więc dla
ambitniejszych Czytelników robię tutaj przerwę...
P R Z E R W A
Tabelka
gry nie uwzględnia oczywiście wszystkich możliwych rozgrywek gracza S.
Niektóre – np zawsze z góry – z góry odrzucamy jako w widoczny
sposób gorsze dla S, ale powinniśmy baczyć by nie przeoczyć żadnej
konkurencyjnej.
Autorzy „Bez impasu” założyli,
że S nie zwraca uwagi na dokładane blotki, poza jednym przypadkiem gdy E
dokłada (bądź nie dokłada) 10. Tymczasem: skoro 10 jest kartą wyróżnioną, to S
powinien zwracać na nią uwagę zawsze – także gdy pojawia się (bądź nie
pojawia) u W ! (w każdym razie nic na tym nie traci, więc co mu
szkodzi). Lapsus ten spowodował przeoczenie równie dobrej (co druga)
strategii: „Zawsze impasuj, chyba
że nikt nie ujawni 10 (w takim razie graj górą)”.
Nowa
strategia ma bardzo ciekawą własność przy podziałach: 10xx–Dx. W
może ujawnić dwie ze swoich trzech blotek trojako, z czego: 2 razy ujawni 10, 1
raz jej nie ujawni (proszę to obejrzeć np dla 1043–D2). Wobec tego S odniesie przy tych
podziałach średnio: gdy E nigdy nie dokłada 10 – 1 sukces, gdy E
zawsze dokłada 10 – 2 sukcesy (przy innych podziałach obliczenie
sukcesów jest trywialne). Wzbogaćmy więc tabelkę o tę strategię:
Rozgrywka S |
Wist E |
||
zawsze impas |
zawsze
impas, chyba że: |
E z 10x |
|
10 od E |
brak 10 |
||
4 |
3 |
6 |
x |
4 |
6 |
3 |
10 |
Tak jak poprzednio
– liczby w tabelce to średnie ilości lew branych przez WE w 10 rozpatrywanych
podziałach.
Spróbujmy
tę grę rozwiązać...
Najmniejsza liczba w wierszu pierwszym to 3, a w drugim też 3;
największa z nich (MaxyMin) wynosi więc 3.
Największe liczby w poszczególnych kolumnach to: 4 6 6;
najmniejsza z nich (MiniMax) to 4.
Ponieważ
MaxyMin jest mniejszy od MiniMaxa, więc gra nie ma punktu równowagi (siodłowego).
Łatwo to zresztą sprawdzić przyglądając się tabelce i badając – co zrobi
jedna strona, gdy druga uprze się przy jakiejś strategii (wyjątek: gdy S
uprze się przy impasowaniu, E może grać dowolnie).
W tej grze jest zatem mieszanie strategii !
ale do obliczenia częstotliwości nie możemy użyć metody opisanej
poprzednio,
ponieważ nie jest to gra 2 na 2 (lecz 2 na 3).
Łatwo
jednak spostrzec (bez żadnych obliczeń), że jeśli E będzie równie często
zrzucać 10 co x (50%:50%), to S najmniej lew oddaje przy grze stale na
impas (mianowicie 4). Pozostałe strategie dają mu bowiem wówczas średnią
stratę 4,5 (połowa sumy 3 + 6) każda, więc nie opłaca mu się ich stosowanie.
Jeśli E zacznie stopniowo
uprzywilejowywać jedną ze swoich strategii – np zrzucać 10 coraz
częściej: 55%, 60%, 65%,... itd – to strata S po przejściu na
strategię „Zawsze impas, chyba że nie ujawnili 10” zacznie
stopniowo maleć (od 4,5 poczynając) – aż w końcu spadnie do 3 gdy E
zacznie zrzucać 10 zawsze. Przez jakiś czas będzie więc większa od 4 – i
do tego momentu S musi jednak stale grać stale na impas, a WE
niezmiennie inkasują średnio 4 lewy; gdy spadnie równo na 4 – E
będzie zrzucał 10 z częstotliwością ileśtam, a dla S każda strategia
będzie jednakowo opłacalna (4 lewy straty).
To ileśtam można dość łatwo obliczyć: proszę
sprawdzić, że wynosi 2/3 (gdy E próbuje dokładać coraz rzadziej –
1/3). Oznacza to, że rozwiązanie gry
jest następujące:
E – zrzuca
10 z dowolną częstotliwością w zakresie od 1/3 do 2/3
(nieskończenie wiele strategii mieszanych)
S –
gra zawsze na impas.
Oczywiście
odstępstwo E od częstotliwości 1/2 daje rozgrywającemu dodatkową informację
(jak wszelkie zrzutki nielosowe), ale – dopóki częstotliwość mieści się w
zakresie od 1/3 do 2/3, dopóty gra na impas pozostaje strategią optymalną.
Podobnie – gdy rozgrywający zabiera się do
zgrywania AKD atu, możemy zupełnie spokojnie zrzucać od najniższej (i ogólnie:
losować je z dowolną częstotliwością w zakresie od 0% do 100%). Nawet gdy
rozgrywający będzie o tym wiedział, i tak będzie musiał dokończyć atutowania.
* * *
Nie
zawsze więc traci się na nielosowości zrzutek, a gra powyższa pokazuje –
być może po raz pierwszy w brydżu – sytuację kiedy odstępstwo od
nielosowości jest ograniczone i ściśle określone. Może E np przez całe
życie zrzucać 10 np w 60% (tj wyraźnie częściej niż gdyby losował), a nic na
tym nie straci – S nadal musi grać na impas.
Sytuacji takich znajdzie się jeszcze zapewne
sporo – może nawet mnóstwo. Im więcej tym lepiej dla... praktyki (bo
można będzie nie martwić się niedokładnością losowania swoich blotek).
Po
raz pierwszy opublikowane w „Przeglądzie Brydżowym” 2–3/1995
cd tej
problematyki – patrz Entropia
|
||||
brydż, brydz, bridge, brydż sportowy, brydz
sportowy, bridge sportowy, Pikier, Sławiński, Slawinski, Łukasz Sławiński,
Lukasz Slawinski, |
||||