ŁS 1995

Strategie mieszane  (1)

z Pikiera 15

Dawno temu... gdy byłem jeszcze chłopcem... pewien stary chłop na wsi pokazał mi nastę­pującą sztuczkę:

Narysował na ścianie trzy kółka – jedno nad drugim – następnie odwrócił się i zapo­wiedział, że odgadnie którego dotknąłem. I odgadł – ale nie chciał ani wyjawić spo­sobu ani odgadywać ponownie.

Po latach doszedłem do przekonania, że polegało to na próbie oceny mojej sylwetki psy­chicznej, i jako takie musiało być rzecz jasna jednorazowe. Aby to sprawdzić, przeprowa­dzałem później ten test wielokrotnie, najczęściej wśród brydżystów:

Testowany siedzi przy stole, a przed nim leżą 3 karty w rzędzie, prostopadle do kra­wędzi. Od­wracam się i proszę, aby dotknął dokładnie jednej. Następnie próbuję oce­nić osobowość: chciwiec chce zagarnąć wszystko dla siebie, więc wyciągnie rękę jak najdalej i dotknie karty najdalszej; skromna i cicha kobietka wyciągnie rękę nieśmiało i trafi w najbliższą; podejrzliwy mędrek zacznie kombinować i zdecyduje się na środ­kową.

Jest zdumiewające, że tak skromny zasób reguł daje olbrzymi procent trafień. Oczywiście pod wa­runkiem, że nie powtarza się testu z tą samą osobą, i – najlepiej – nie uprzedza się że będziemy od­gadywać.

 

    Umiejętność taka – przewidywanie decyzji jaką podejmie przeciwnik – przydatna jest oczywiście każdemu graczowi. Jak jednak to robić ? Jakiej metody używać do odgadnięcia myśli przeciwnika ?

Edgar Allan Poe pokazuje w noweli „Skradziony list” metodę następującą:

Znałem pewnego ośmioletniego chłopca, którego powodzenia w odgadywaniu przy grze w „para, nie para” wywoływały podziw powszechny. Gra ta jest łatwa, używa się do niej krą­głych kamycz­ków. Jeden z graczy trzyma w garści pewną ilość tych kamyczków i zapytuje drugiego, czy liczba ich jest parzysta, czy nieparzysta. Jeśli zgadujący odpowie trafnie, to zyskuje jeden kamyczek, jeśli zaś się pomyli, to jeden traci. Chłopczyk, o którym nadmie­niłem, wygrał wszystkie kamyczki w całej szkole. Odgadywał on według pewnej zasady, która polega tylko na spostrzegawczości i na przy­stosowaniu się do bystrości swych prze­ciwników. Kiedy, na przykład, przeciwnik jego był skoń­czonym głuptasem i podniósłszy rękę, pytał: „Para, czy nie para ?”, dzieciak odpowiadał: „Nie para” i przegrywał. Wszelako za następnym razem już wygrywał, gdyż powiadał sobie w duszy: „Głuptas przy pierwszej kolejce wziął w rękę parzystą ilość kamyczków, ale jego przebiegłość sięga zaledwie tak daleko, iż za drugą kolejką weźmie nieparzystą, powiadam zatem nie para”; mówi tak i wy­grywa. Natomiast mając do czynienia z przeciwnikiem nie tak ograniczonym, rozumował w ten sposób: „Ten chłopiec wie, iż za pierwszym razem powiedziałem: „nie para”, kiedy więc kolej przy­jdzie na drugi, zaświta mu w pierwszej chwili myśl najprostszej odmiany, mianowi­cie, by po parze wziąć nie parę, jak to uczynił pierwszy głuptas; wszelako później pomyśli sobie, że ta odmiana jest zbyt prosta, i ostatecznie weźmie ilość parzystą, jak poprzednio. Będę zatem zgadywał: para. Po­wiada: „para”, i wygrywa. Otóż ten sposób rozumowania, który koledzy uczniaka nazwali „szczę­ściem”  – czymże jest, gdy go wyłuskamy do ostatka ?
– Jest to po prostu – rzekłem – identyfikowanie się umysłu rozumującego ze swym prze­ciwnikiem.
– Istotnie – odparł Dupin – kiedy zaś zapytałem tego chłopca, w jaki sposób osiąga tę zu­pełną iden­tyfikację, która stanowi o jego powodzeniu, odpowiedział: Gdy chcę wiedzieć, w jakim stopniu jest ktoś mądry czy głupi, dobry lub zły, i co myśli w danej chwili, staram się możliwie najdokładniej uzgodnić wyraz mojej twarzy z wyrazem jego twarzy, a następnie śledzę, jakie myśli i uczucia roz­budzą się w moim mózgu i moim sercu i niejako uzgodnią się i upodobnią do wyrazu przeze mnie przybranego.

Wynikałoby stąd – jeśli wierzyć Poemu – że brydżysta powinien być dobrym aktorem, i – aby zagrać swojego przeciwnika i w następstwie tego odgadnąć jego myśli – powinien bacznie mu się przyglą­dać (przegroda na stole w rozgrywkach wysokiego szczebla metodę tę zupełnie ukraca).

Czy przeciwnik owego chłopca może uchronić się przed jego przenikliwością ?   Jeśli za­uważy że w pojedynku na odgadywanie myśli jest gorszy, powinien... wogóle nie myśleć.  Decyzję – czy wziąć parzystą czy nieparzystą ilość kamyków? – powinien przekazać przy­padkowi (losowi). Oczywiście tak, by szansa parzystości była równa szansie nieparzystości (czyli obie po 50%), bo przecież brak równowagi zostanie zauważony.

   Niełatwo naśladować przypadek; najlepiej posłużyć się jakimś niezależnym od nas me­chanizmem. Można np sprawdzić do jakiej godziny zbliża się wskazówka sekundnika: pa­rzystej czy nieparzystej ?

   Zbigniew Szurig spróbował kiedyś wylosować decyzję stukając w kartę wystającą za brzeg stołu. Przeciwnik zaprotestował – najprawdopodobniej ze złości że zmarnują się jego dotychczasowe my­lące zrzutki – twierdząc z głębokim przekonaniem, że Prawo Brydżowe zabrania losować. Szurig po­myślał więc, i... nie trafił.

   W ówczesnym Prawie Brydżowym nic jednak na ten temat nie było.  Obecnie przypisek do Przepisu 40E2 stwierdza:

Gracz nie ma prawa korzystać, ani podczas licytacji ani podczas rozgrywki, z żadnych środ­ków wspomagających jego pamięć, kalkulację lub technikę.

Czy losowanie należy zaliczyć do kalkulacji ?  Nie słuchać o żadnym precedensowym orzeczeniu w tej kwestii. Kto spróbuje pierwszy ?

 

Co ma zrobić nasz ośmiolatek, gdy zauważy, że jego przeciwnik przeszedł na losowanie ?   Nic !  Może obstawiać najzupełniej dowolnie, np stale parzyste bądź stale nieparzyste. O wyniku zdecyduje losowanie przeciwnika, a w dystansie wynik pojedynku będzie zerowy.

   Jeśli jednak przeciwnik zauważy regularność, to zrezygnuje z losowania i zacznie wygry­wać. Aby tego uniknąć, nasz ośmiolatek też musi przejść na losowanie. Ostatecznie obaj będą losować (50%:50%), przez co gra stanie się oczywiście nieciekawa, a końcowa kwota wypłaty zbliżona do zera.

 

Gra powyższa to najprostszy przypadek gry ze  strategiami mieszanymi. Każdy gracz ma dwie de­cyzje (tj strategie, a dokładniej – strategie czyste), które powinien podejmować z tą samą frekwencją równą 50%.  Postępowanie takie nazywa się strategią mieszaną (bo mie­sza się strategie czyste) i jest optymalne. Próba odejścia od niego spowoduje w dystansie przegraną.

    Łatwo się domyśleć, że istnieją gry w których należy mieszać strategie czyste w innej proporcji niż 50%:50%, że mamy częstokroć więcej niż dwie decyzje do wyboru, i że pro­blematyka ta jest nie­zmiernie fascynująca.

 

   Czy jednak może dotyczyć to brydża ?  Czy zdarzają się w brydżu sytuacje kiedy trzeba mieszać strategie ?

   Zauważmy, że tzw palcówki (kiedy tyle samo przemawia „za” co „przeciw” – bardzo czę­sto li tylko wskutek naszej niewiedzy) nie są strategiami mieszanymi!  Decyzje obstawiamy wprawdzie mniej więcej po równo (może i po 50%), ale nie dlatego że tak jest optymalnie, lecz wyłącznie dlatego że jest zupełnie wszystko jedno. Równie dobrze moglibyśmy stale obstawiać „za” (bądź „przeciw”), a ilość sukcesów w dystansie byłaby ta sama (50%).

   Prawdziwa strategia mieszana – kiedy trzeba wybierać np jedno z częstotliwością 70%, a drugie z częstotliwością 30% (albo np: 65%:35%, 20%80% lub akurat 50%:50%) – może się zdarzyć (ale nie musi) tylko wtedy, gdy nasz sukces zależy od tego co wybrał przeciw­nik.

   W brydżu mamy niestety dodatkową komplikację, bo oprócz przeciwnika jest posługująca się przypadkiem natura – aktualny rozkład kart.

Jak więc jest w brydżu ze strategiami mieszanymi ?

 

    Gra w blokowanie

Rozważmy blokowanie naturalnym otwarciem 3 w kolor. Niech będzie to – dla ustalenia uwagi – otwarcie 3©, a rzecz cała niech toczy się w meczu brydżowym, w założeniach „obie strony przed partią”.

 

Współczesne typowe 3© to długi kolor i około 6 lew do wzięcia (w tym średnio 1 defen­sywna).  Modelowa ręka:  xx  KDW10xxx  xx  xx

 

Niech będzie tak, że partner blokującego ma nakazaną dużą wstrzemięźliwość w przedłu­żaniu bloku bądź natychmiastowym wchodzeniu w obronę („Blok zrobił swoje” – co zresztą jest przez wielu usilnie zalecane i stosowane).

 

Współczesna typowa reakcja przeciwników na takie 3© polega na preferowaniu gry własnej – kontra jest dawana najchętniej z czwórką pik, karny pas na kontrę z czwórką pik w zasa­dzie się nie zdarza, a nad przeciwnikami wyraźnie ciąży strach, że wpadka z kontrą będzie nieopłacalna – w sumie karność kontry wydaje się być nieco poniżej 50%.

 

Uznajmy, że typowy blok i typowa reakcja są w stanie równowagi, tzn że w dystansie me­czowym saldo z takiego rozdania wynosi 0 impów. Sądzę, że odrobinę lepszy jest styl bar­dziej karcący (pełne 50%), ale – wygrywanie lub  obalanie końcówki budzi zazwyczaj daleko większy entuzjazm niż mniej efektowna walka przy kontrakcie 3© (gdy pary dzielą się le­wami mniej więcej po równo), a wiadomo że mistrzowie muszą wzbudzać podziw publicz­ności (tj licytować „ofensywnie”).

Podobne zjawisko opisał ongiś w „Brydżu” Krzysztof Waśniewski: jeśli nie „dopychał” 3BA, to pogardliwie wytykano mu bojaźliwość; jeśli natomiast wpadał na takie 3BA bez dwóch z kontrą, to nikt nie miał większych pretensji, bo „poległ w walce”.

 

Skoro wiesz jak przeciwnicy licytują przeciwko blokowi 3©, to możesz wpaść na pomysł, by od czasu do czasu zastawić na nich pułapkę:  otworzyć 3© nadal na 6 lewach, ale z dużą defensywą, np:  Axx AWxxxx xx Kx, a następnie kontrować. Powinieneś na tym zarabiać, ponieważ kontrlicytacja przeciwników jest nastawiona bardziej na grę własną niż na ukarnia­nie (niekoniecznie z kontrą), a partner – przypominamy – ma nakazaną wstrzemięźliwość.

Takie właśnie pułapki (zresztą w wielu sekwencjach skaczących) stosują z powodze­niem „bezpasowcy” (w SSO jest oczywiście o wiele więcej okazji do bloków, a zatem i pułapek). Dawniej – powodzenie było olbrzymie, potem – oswojeni przeciwnicy za­częli przeciwko SSO reagować wstrzemięźliwiej.

Czy powinieneś uprzedzić przeciwników, że Twoje 3© będzie od czasu do czasu pułapką ? 

Jeśli nie uprzedzisz partnera, to nie musisz ! Jeśli on sam to zauważy i zmodyfikuje swój styl licytacji po 3© – to powinniście przeciwników uprzedzać (bo inaczej zostaniecie oszu­stami). Załóżmy jednak – dla uproszczenia – że wszyscy będą wiedzieć, że 3© jest cza­sem pułapkowe, a licytacja partnera nie ulega zmianie (przypominamy o nakazanej mu wstrzemięźliwości).

 

Jak mają licytować przeciwnicy ? Przeciwko pułapce powinni stosować styl bardziej kar­cący (niekoniecznie z kontrą – można skarcić także wypasowaniem), ale nie wiedzą prze­cież – jakie jest konkretne 3©? typowe czy pułapkowe ?

   Czy mają opracować styl wypośrodkowany między typowym a karcącym ? Jeśli pułapka będzie stosowana np raz na 10 otwarć 3©, to nawet najstarsi teoretycy nie będą w stanie wyobrazić sobie, jak takie wypośrodkowanie ma wyglądać.

   Mogą więc przeciwnicy przyjąć inną strategię: wzorując się na Tobie zaczną sporadycznie stosować styl karcący. Wprawdzie jeśli trafią na 3© typowe to nieco stracą, ale jeśli trafią na pułapkę – odbiją sobie straty z nawiązką.

 

Pytanie teraz – czy to wszystko Tobie się opłaca ?

   Jeśli na drugim stole (grasz w meczu!) zaczną licytować tak samo, to oczywiście saldo będzie zerowe. Załóżmy więc, że zarówno 3© jak i reakcja na 3© będą na drugim stole ty­powe (uprzedziłeś wprawdzie, ale nie są przekonani do Twojego pomysłu), i teraz dopiero zapytajmy:

   Jak często masz stosować pułapkę, aby to Ci się opłacało ? (a może nigdy!?)  Jak czę­sto przeciwnicy mają stosować styl karcący, aby zminimalizować swoją stratę ?  I wreszcie – ile na tym zarobisz ?

 

   Rozwiązywanie gry

Sporządźmy tzw tabelę wypłat – ile impów średnio zarobisz w każdym z czterech możli­wych zdarzeń:

 

 

Reakcja przeciwników

 

 

 

 

Twoje 3© 

Typowa

Karcąca

 

 

 

Typowe   

 

0

+

1

 

 

 

Pułapka   

+

4

5

 

 

 

0

=

bez zysku i straty (choćby dlatego, że tak samo będzie na drugim stole)

 

+

1

=

zarobisz, bo Reakcja Karcąca jest gorsza przeciwko 3© Typowym

 

+

4

=

zarobisz na wpędzeniu przeciwników w wpadkę z kontrą 
(bo Reakcja Typowa jest zła przeciwko Pułapce)...

 

5

=

ale stracisz, gdy akurat zastosują Reakcję Karcącą.

Liczby są oczywiście w dużej mierze „wzięte z sufitu”, ale – narazie je zaakceptuj
(a potem powtórz obliczenia z innymi i sprawdź co wyjdzie).

 

Przystąpmy do nieco zawikłanego rozwiązania powyższej gry:

Obliczanie MaxyMina  (dolnej wartości gry)

Z każdego wiersza wybierz liczbę najmniejszą (będą to: 0 i –5),
a z nich następnie największą (będzie to 0):

MaxyMin = 0

Jest to największy zysk jaki możesz sobie zagwarantować przy jakiejkol­wiek strategii przeciwników. Jeśli chcesz grać jak najostrożniej (co nie zawsze jest równoważne grze na maxymalny zysk!), powinieneś więc sto­sować tylko 3© Typowe.

Obliczanie MiniMaxa  (górnej wartości gry)

Z każdej kolumny wybierz liczbę największą (będą to: +4 i +1),
a z nich następnie najmniejszą (będzie to +1):

MiniMax = +1

Jest to najmniejsza strata jaką mogą sobie zagwarantować przeciwnicy przy jakiejkolwiek Twojej strategii. Jeśli chcą grać jak najostrożniej (co nie zawsze jest równoważne grze na maxymalny zysk!), powinni więc stoso­wać tylko Reakcję Karcącą.

Porównanie

Jeśli  MaxyMin > MiniMax:     

Pomyliłeś się !  (zacznij od początku).

Jeśli  MaxyMin = MiniMax:

W tej grze naogół (bo jest specyficzny wyjątek) nikomu nie opłaca się mieszać strategii ! (przykład pokażemy później).

Jeśli  MaxyMin < MiniMax:

W tej grze jest mieszanie strategii !

 

Jak mieszać strategie  ( tylko dla gier typu 2 na 2 ! )

Oblicz odległości dwóch liczb z każdego wiersza i każdej kolumny (np dla wiersza dru­giego: odległość między +4 a –5 wynosi 9, dla kolumny pierwszej odległość między 0 a +4 wynosi 4), i dopisz je przy tabeli:

 

 

Reakcja przeciwników

 

 

 

 

Twoje 3© 

Typowa

Karcąca

 

 

 

 

Typowe   

 

0

+

1

 1

 

 

 

Pułapka   

+

4

5

 9

 

 

 

 

4

 

6

 

 

Odległości dopisane z prawej wskazują (po przestawieniu!!) – jak często powinieneś sto­sować swoje strategie:

9 razy na 10  (90%)  3© Typowe
1 raz  na 10  (10%) 
3© Pułapkowe.

Odległości dopisane pod spodem wskazują (po przestawieniu!!) – jak często powinni sto­sować swoje strategie przeciwnicy:

6 razy na 10  (60%)  – reakcję typową
4 razy na 10  (40%)  – reakcję karcącą.

Jeśli którakolwiek ze stron zmieni swoje częstotliwości, to w dystansie zacznie osiągać gorszy rezultat (oczywiście jeśli strona przeciwna to zauważy i w ripoście swoje częstotli­wości odpowiednio zmieni). Tak więc nikomu nie opłaca się od powyższych częstotliwości odstępować.

 

Obliczmy teraz – jaki jest Twój średni zysk (a może strata ?) z każdego takiego rozdania:

Jeśli otworzysz 3© Typowe:

w 60% zyskasz 0 (bo w tyluż %% natrafisz na reakcję typową),

w 40% zyskasz 1 (bo w tyluż %% natrafisz na reakcję karcącą),

co łącznie da ci średnio:          

60% * 0 + 40% * 1 = 0,4 impa.

Sprawdź, że tyle samo wyjdzie Ci dla 3© Pułapkowych ! Nie jest to wcale dziwne, jeśli uzmysłowisz sobie, że częstotliwości zostały wyznaczone optymalnie dla obu stron kon­fliktu (punkt równowagi).

Jeśli znasz algebrę i podstawy analizy, to możesz rozwiązywać gry (nie tylko 2x2) badając swój łączny średni zysk jako funkcję częstotliwości strategii.

 

W każdym takim rozdaniu zyskujesz więc średnio 0,4 impa !

Oznacza to, że Twój pomysł z pułapką jest lepszy niż 3© zawsze typowe (gdy wyszła liczba ujemna, byłby gorszy). Jeśli więc drużyna przeciwników nie chce przegrywać, musi zacząć licytować tak samo jak Ty !!

 

        Kwestie prawne

Zdecydowałeś że raz na 10 rozdań Twoje 3© będzie pułapkowe.

Czy powinieneś powiedzieć to przeciwnikom ? jeśli nie powiedziałeś partnerowi (a jeśli powiedziałeś ?).  Czy przynajmniej powinieneś ich uprzedzić, że 3© jest czasem pułapką ?  A jeśli partner zmodyfikuje nieco swoją licytację po 3© ?

Wydaje się, że należy wszystko ujawnić wszystkim !

 

        Odzywki mieszane

Ongiś na Kongresie w Sopocie pojawiła się para z następującą kartą konwencyjną:

       1¨ = 10–15   1© = 12–16   1ª = 14–18

przy czym to wszystko było z układem dowolnym !!! (dziwne, ale prawdziwe: dopiero w połowie turnieju ktoś wezwał sędziego).

   Na czym to polegało – tego niestety nie udało się wyjaśnić. Jest jednak możliwe, że otwarcie wybierali losowo, i że istnieją tego rodzaju licytacje systemowe, które są opła­calne!

 

Wyobraźmy sobie następującą modyfikację otwarć Słabe 2S:

2© =  w 70% na kierach, w 30% na pikach

2ª =  w 70% na pikach,  w 30% na kierach

z odpowiednio ustawioną dalszą licytacją.

   Jeśli nawet nie jest to opłacalne, to nie widać powodu (jeśli nie jesteśmy World Bridge Fustiness) dla którego miałoby być zabraniane.

 

         Jak losować ?

Czy wolno Ci korzystać z jakiegoś mechanizmu do losowania ?  (np z sekundnika na Twoim zegarku). Jeśli uznamy że Prawo (brydżowe) tego nie dopuszcza, pojawiają się spore kło­poty.

   Losowanie „w umyśle” jest bardzo niedoskonałe. Mimo woli pamiętasz swoje ostatnie decyzje i mimowoli starasz się postąpić odmiennie (a przypadek nie pamięta przecież swojej historii). Pamiętają je również przeciwnicy i w jeszcze większym stopniu partner (bo zmieniamy go znacznie rzadziej). Tak więc Twoje decyzje będą odgadywane częściej niż wynikałoby to ze statystyki – nawet gdyby wszyscy jak najusilniej starali się tego uniknąć. Ponadto – jeśli będziesz miał za dużo szczęścia, możecie narazić się na podejrzliwe spoj­rzenia przeciwników.

   Jeśli wolno Ci będzie korzystać z mechanizmu losującego, to z kolei pojawią się inne kłopoty, gdy będziesz to czynić jawnie (na oczach wszystkich). Fakt losowania (bądź nielo­sowania!) zdradzi Twój problem, podobnie jak zdradza go namysł (bądź brak namysłu). Musiałbyś więc dla kamuflażu losować także gdy nie trzeba (ostrzegając przeciwników tak jak to zaproponowano w „Cogito ergo...” w „Przeglądzie brydżowym” 2–3/1995) albo... lo­sować zawsze.

    W każdym razie liczba prawdziwa liczba wylosowana powinna być znana tylko losują­cemu, bo inaczej dojdzie do zdradzenia jego decyzji. Np jeśli otwierający rzuca kością, to nikt nie powinien wiedzieć jakie decyzje przyporządkowane są poszczególnym wynikom (np że dwójka oznacza zdecydowanie się na 3© Pułapkowe).

 

    Gra w blefowanie

Rozważmy opłacalność blefowania naturalnym otwarciem, dajmy na to 1ª:

 

 

Reakcja przeciwników

 

 

 

Twój 1ª  

Normalna

Czujna

 

Normalny 

 

0

+

3

 67%

Blefowy 

+

1

5

 33%

 

89

%

11

%

 

Wychodzi (oblicz to sam wg podanej wcześniej recepty) – że powinieneś blefować z czę­stotliwością 33%, a przeciwnicy w 11% powinni licytować „czujnie” (np zaczajać się z sil­niejszą kartą, by nieświadomy partner „powiózł” Cię do kontraktu wyższego).

 

Założyłeś, że gdy przeciwnicy akurat zareagują „normalnie”, to na blefie coś zyskujesz – zaledwie 1 imp. Bardzo powściągliwie, ale i tak przesadnie – jest przecież partner, który bardzo często wszystko popsuje. Saldo prawie na pewno jest więc ujemne. Przyjmij więc tylko 1 imp straty i zobacz co się dzieje:

 

 

Reakcja przeciwników

 

 

Twój  1ª      

Normalna

Czujna

 

Normalny 

 

0

+

3

 

Blefowy 

1

5

 

MaxyMin = 0   (większa liczba spośród  0 i –5)
MiniMax  = 0   (mniejsza liczba spośród  0 i +3)

Skoro są równe, to – jak już nadmieniliśmy wcześniej – nikomu tym razem   nie opłaca się strategia mieszana.  Dla każdej strony optymalne jest stałe (w 100%) stosowanie strategii znajdującej się w tym samym wierszu (kolumnie) co liczba 0 (wspólna wartość MaxyMina i MiniMaxa).  Powinieneś więc zawsze otwierać normalnie, a przeciwnicy nigdy nie powinni stosować czujności (pozycja z liczbą 0 nazywana jest punktem siodłowym).

W takim przypadku gra może być „jawna”, tzn Ty możesz poinformować że otworzyłeś „normalnie”, a oni że reagują „normalnie”. Ale bez pokazania kart.

 

Jeśli uważasz że 1 imp straty był zbytnim pesymizmem, sprawdź co się dzieje przy saldzie zerowym:

 

 

Reakcja przeciwników

 

 

 

Twój  1ª    

Normalna

Czujna

 

 

Normalny 

 

0

+

3

63%

5/8

Blefowy 

 

0

5

37%

3/8

 

100

%

0

%

 

 

 

8/8

0/8

 

 

Wychodzi to samo co poprzednio, z tym że 0 znajduje się także w wierszu drugim, co oznacza za­chodzenie sytuacji szczególnej (w które obliczanie %% jest przydatne):

   Nie musisz w 100% otwierać normalnie, lecz dysponujesz pewnym luzem – możesz ble­fować z czę­stotliwością od 0% do 37%. Masz więc do wyboru wiele strategii mieszanych (tzw przedział siodłowy). Przeciwko każdej przeciwnicy powinni zawsze licytować normal­nie, ale...  jeśli wybrałeś akurat 37% oni z kolei dysponują luzem – mogą stosować dowolną strategię mieszaną (mają luz całkowity). Większa częstotliwość blefu jest nieopłacalna – przeciwnicy zaczną stale stosować czujność, co zmniejszy Twoją średnią wygraną.

Najkorzystniejsze wydaje się jednak nieblefowanie. Chociażby dlatego, że od czasu do czasu przeciwnicy mogą jednak zareagować czujnie i zarobisz 3 impy.  Z drugiej strony – przy Two­ich 37% przeciwnicy (jeśli o tym wiedzą) stają przed problemem, jak mieszać swoje strategie. Niby wszystko jedno, ale... osiołkowi w żłoby dano (po­nadto – a nuż przekroczysz trochę te 37%).

Kto wie – może to jest właśnie prawda o blefach ?

 

Zauważ na koniec (jak to ładnie napisano w „Bez impasu”), że najłatwiej zarobisz na ... roz­propagowaniu siebie jako blefiarza.  Po kilku głośnych blefach (niekoniecznie udanych!) przeciwnicy zasiadający przeciwko Tobie skłonni będą do licytacji czujnej i zarobisz 3 impy bez żadnego ryzyka (bo przecież już się nablefowałeś).

 

                  Coś jeszcze w licytacji ?

W omówionych przykładach nie poruszałem kwestii natury – rozkładów przydzielanych z określo­nymi prawdopodobieństwami przez los. To jest dodatkowa strona biorąca udział w grze – na szczę­ście nie jest niczyim przeciwnikiem, ale i tak powoduje spore komplikacje.

 

Jedyny znany mi przykład gry licytacyjnej (z naturą, bardzo skomplikowany) jest w książce „Bez im­pasu” (Macieszczak–Mikke, 1980, strona 75). Niestety, oparty jest na tak sztucz­nych założeniach („wydumany”), że nie ma żadnej wartości użytkowej (wyłącznie pokaz). Na oko wydaje się być bez zarzutu, ale... nie weryfikowałem.

W obszernym artykule Krzysztofa Sokołowskiego pt  „Teoria gier a brydż” („Problemy brydżowe”, 1992, PZBS) jest tylko odrobinka o strategiach mieszanych (bez przykładu i algorytmu). Zresztą cały artykuł sprawia wrażenie przeznaczonego dla erudytów (do „mówienia o”).

Zauważmy że przykłady które podałem nie są bynajmniej nieskazitelne.

Kto wie – może strategie mieszane wogóle nie zdarzają się w licytacji ?

       Zanim ktoś poda przykład dobitniejszy, przejdźmy do rozgrywki–wistu...

 

    Gra w „Łapanie Damy”

Jak przedstawić problem rozgrywkowo–wistowy jako grę w której bierze udział także natura (tj przydzielane przez los rozkłady) pokazali (chyba jako pierwsi) Macieszczak–Mikke w książce „Bez Impasu” (1980) (na stronie 71):

S chce wziąć 4 lewy w kolorze Axxx–KWxx. Gra oczywiście z ręki Asa, a następnie blotkę, i po dodaniu blotki przez W musi podjąć decyzję – impas czy z góry.

Pytanie:  Czy E powinien dorzucać dziesiątkę z jakąś określoną częstotliwością ?

Dla prostoty Autorzy rozważają 10 jednakowo prawdopodobnych podziałów podzie­lonych na 4 grupy:

 

 

K W x x

 

 

Wielkość wygranej podawana jest jako „wypłata” dla WE, tzn jako średnia ilość lew branych przez WE (w tym kolorze):

D 10 x

N

W      E

S

x x

3 podziały

D x x

10 x

3 podziały

10 x x

D x

3 podziały

x x x

D 10

1 podział

 

A x x x

 

 

                                          

 

 

Rozgrywka S

Wist  E

 

 

 

Zawsze impas

po 10 od E z góry

E z 10x dokłada:

2/3

67%  

 

4

 

3

x

1/3

33%  

 

4

 

6

10

 

100

%

0

%

 

 

3/3

0/3

 

Ponieważ wygrane są podane dla WE, przy obliczaniu MaxyMina i MiniMaxa powinieneś „czuć się” graczem E.

     

Jest to ten sam przypadek co w ostatniej wersji „Gry w blefowanie" (Czytelnik łatwo spraw­dzi to i procenty), zatem:

S powinien zawsze impasować, E natomiast z dubletona 10x powinien dokładać 10
z częstotliwością dowolną, byleby wynosiła conajmniej 1/3.

Wygląda to bardzo dziwnie !  Skoro tak wyszło dla 10x, to to samo wyjdzie dla 7x !  Jaką strategię przyjąć więc dla dubletona 107 ? Stawiamy 100% na 7, i jest to strategia opty­malna (jedna z wielu). Ale wówczas nic nie pozostaje dla 10.  Więc jednak nie jest opty­malnie, bo dla 10 powinna być co­najmniej 1/3. Sprzeczność !

 

W konstrukcji gry tkwi więc gdzieś błąd, ale bodźcem do jego odnalezienia stało się dla mnie (nawet) dopiero pisanie niniejszego tekstu. Błąd ten jest bardzo trudny do wykrycia, więc dla ambitniejszych Czytelników robię tutaj przerwę...

 

P R Z E R W A

 

Tabelka gry nie uwzględnia oczywiście wszystkich możliwych rozgrywek gracza S. Niektóre – np zawsze z góry – z góry odrzucamy jako w widoczny sposób gorsze dla S, ale powin­niśmy baczyć by nie przeoczyć żadnej konkurencyjnej.

   Autorzy „Bez impasu” założyli, że S nie zwraca uwagi na dokładane blotki, poza jednym przypadkiem gdy E dokłada (bądź nie dokłada) 10. Tymczasem: skoro 10 jest kartą wyróż­nioną, to S powinien zwracać na nią uwagę zawsze – także gdy pojawia się (bądź nie poja­wia) u W ! (w każdym razie nic na tym nie traci, więc co mu szkodzi). Lapsus ten spowodo­wał przeoczenie równie dobrej (co druga) strategii:  „Zawsze impasuj, chyba że nikt nie ujawni 10 (w takim razie graj górą)”.

 

Nowa strategia ma bardzo ciekawą własność przy podziałach: 10xx–Dx. W może ujawnić dwie ze swoich trzech blotek trojako, z czego: 2 razy ujawni 10, 1 raz jej nie ujawni (proszę to obejrzeć np dla 1043–D2).  Wobec tego S odniesie przy tych podziałach średnio: gdy E nigdy nie dokłada 10 – 1 sukces, gdy E zawsze dokłada 10 – 2 sukcesy (przy innych po­działach obliczenie sukcesów jest trywialne). Wzbogaćmy więc tabelkę o tę strategię:

 

Rozgrywka S

Wist E

 

 

zawsze

impas

zawsze impas, chyba że:

E z 10x
dokłada:

 

 

10 od E

brak 10

 

 

4

3

6

x

 

 

4

6

3

10

 

Tak jak poprzednio – liczby w tabelce to średnie ilości lew branych przez WE w rozpatrywanych 10 podziałach.

Spróbujmy tę grę rozwiązać...

Najmniejsza liczba w wierszu pierwszym to 3, a w drugim też 3;

największa z nich (MaxyMin) wynosi więc 3.

Największe liczby w poszczególnych kolumnach to: 4 6 6;

najmniejsza z nich (MiniMax) to 4.

Ponieważ MaxyMin jest mniejszy od MiniMaxa, więc gra nie ma punktu równowagi (siodło­wego). Łatwo to zresztą sprawdzić przyglądając się tabelce i badając – co zrobi jedna strona, gdy druga uprze się przy jakiejś strategii (wyjątek: gdy S uprze się przy impasowa­niu, E może grać dowolnie).

W tej grze jest zatem mieszanie strategii !

ale do obliczenia częstotliwości nie możemy użyć metody opisanej poprzednio,
ponieważ nie jest to gra 2 na 2 (lecz 2 na 3).

Łatwo jednak spostrzec (bez żadnych obliczeń), że jeśli E będzie równie często zrzucać 10 co x (50%:50%), to S najmniej lew oddaje przy grze stale na impas (mianowicie 4). Pozo­stałe strategie dają mu bowiem wówczas średnią stratę 4,5 (połowa sumy 3 + 6) każda, więc nie opłaca mu się ich stosowanie.

   Jeśli E zacznie stopniowo uprzywilejowywać jedną ze swoich strategii – np zrzucać 10 coraz częściej: 55%, 60%, 65%,... itd – to strata S po przejściu na strategię „Zawsze im­pas, chyba że nie ujawnili 10” zacznie stopniowo maleć (od 4,5 poczynając) – aż w końcu spadnie do 3 gdy E zacznie zrzucać 10 zawsze. Przez jakiś czas będzie więc większa od 4 – i do tego momentu S musi jednak stale grać stale na impas, a WE niezmiennie inkasują średnio 4 lewy; gdy spadnie równo na 4 – E będzie zrzucał 10 z częstotliwością ileśtam, a dla S każda strategia będzie jednakowo opłacalna (4 lewy straty).

   To ileśtam można dość łatwo obliczyć: proszę sprawdzić, że wynosi 2/3 (gdy E próbuje dokładać coraz rzadziej – 1/3).  Oznacza to, że rozwiązanie gry jest następujące:

         E – zrzuca 10 z dowolną częstotliwością w zakresie od 1/3 do 2/3

               (nieskończenie wiele strategii mieszanych)

         S – gra zawsze na impas.

Oczywiście odstępstwo E od częstotliwości 1/2 daje rozgrywającemu dodatkową informa­cję (jak wszelkie zrzutki nielosowe), ale – dopóki częstotliwość mieści się w zakresie od 1/3 do 2/3, dopóty gra na impas pozostaje strategią optymalną.

Podobnie – gdy rozgrywający zabiera się do zgrywania AKD atu, możemy zupełnie spo­kojnie zrzucać od najniższej (i ogólnie: losować je z dowolną częstotliwością w zakresie od 0% do 100%). Nawet gdy rozgrywający będzie o tym wiedział, i tak będzie musiał do­kończyć atutowania.

* * *

Nie zawsze więc traci się na nielosowości zrzutek, a gra powyższa pokazuje – być może po raz pierwszy w brydżu – sytuację kiedy odstępstwo od nielosowości jest ograniczone i ści­śle określone. Może E np przez całe życie zrzucać 10 np w 60% (tj wyraźnie częściej niż gdyby losował), a nic na tym nie straci – S nadal musi grać na impas.

   Sytuacji takich znajdzie się jeszcze zapewne sporo – może nawet mnóstwo. Im więcej tym lepiej dla... praktyki (bo można będzie nie martwić się niedokładnością losowania swo­ich blotek).

Po raz pierwszy opublikowane w „Przeglądzie Brydżowym”  2–3/1995

 

cd tej problematyki – patrz Entropia

 

Szansologia

Co nowego...

do Spisu

 

redakcja@pikier.com

© Pikier.com

brydż, brydz, bridge, brydż sportowy, brydz sportowy, bridge sportowy, Pikier, Sławiński, Slawinski, Łukasz Sławiński, Lukasz Slawinski,