Heurystyki w stochastyczno–statystycznym modelu gry w brydża

Andrzej Matuszewski, Instytut Podstaw Informatyki PAN

1 VI 2007

Po ciężkiej pracy nad edyktem "Constitutio Antoniniana" (nadającym w roku 964 A.U.C.          

STRESZCZENIE:

Wprowadzono probabilistyczne kryterium optymalizacji gry w brydża. Dotyczy ono jednego rozdania na jednym stole, ale uwzględnia ono rozegranie tego rozdania na innych stołach. W przeciwieństwie do już istniejących, proponowane kryterium dotyczy wszystkich faz rozdania – chociaż tu zajmiemy się głównie rozgrywką i jej niejaką konsekwencją: wistem (obroną). Przedyskutowano związek tego kryterium z bardziej konstruktywnymi metodami, które równocześnie dają się matematycznie i/lub algorytmicznie sformalizować, a zatem mogą być potraktowane jako heurystyki dotyczącymi gene­ralnego kryterium. Zdefiniowano 3 heurystyki: dwie probabilistyczne i jedną deterministyczną. Sfor­mułowano niektóre zadania do rozwiązania.

SŁOWA KLUCZOWE:

Wartość oczekiwana, symulacja Monte Carlo, strategia rozgrywającego, algorytmy, optymalizacja.

 

1 WSTĘP

Pojedyncze rozdanie jest podstawową cegiełką  gry w brydża. W niniejszej pracy przedstawimy mo­del przebiegu rozdania. Przebieg ów jak i każdy pojedynczy  ruch (który nie jest jednak pod wszyst­kimi względami: „atomem”…) wykonywany w rozdaniu mają charakter stochastyczny. W pewnym sensie przymiotnik ten można „przetłumaczyć” jako: losowy (nie jest właściwym przymiotnik: staty­styczny – o czym dalej). Jednak owa losowość posiada swoją nieubłaganą logikę. Jest to logika w 90–ciu procentach wynikająca z reguł gry w brydża. Reguły te – choć są proste – określają grę, która jest bardzo trudna i wieloaspektowa. Wykażemy, iż owa wieloaspektowość wynika m. in. z częściowo sprzecznych  heurystyk, których nie da się uniknąć zarówno „ludzkiemu’ jak i „komputerowemu” graczowi. Pomimo sprzeczności owe heurystyki powinny być w przyszłości pomocne w uczeniu się tradycyjnym i informatycznym.

Przedstawimy stochastyczne kryterium optymalizacyjne, na które można spojrzeć z dwóch punktów widzenia. Z jednej strony pretenduje ono do roli ostatecznego wzoru rangującego możliwe ruchy, które są do wykonania w danym momencie przez gracza. Z drugiej strony – ze względu na bardzo ogólną formę kryterium – nie można na ogół podać efektywnego algorytmu wyliczenia numerycznej wartości wzoru, a zatem z pewnością wyznaczyć optymalny ruch. Stąd owe heurystyki.

Oprócz reguł i „bezosobowej” logiki postępowania (wystarczającej dla ułożenia programu kompute­rowego grającego w brydża) istnieje jeszcze praktyka gry na różnych poziomach wtajemniczenia. W poniższych rozważaniach modelujemy w pewnym stopniu również i ową praktykę. Ze względu na konieczność formalizacji procesu modelowania rozpatrzono tylko trzy podstawowe (postawmy znak zapytania przy tym przymiotniku) strategie postępowania najtrudniejszych problemów gracza i tylko w (nieco) uproszczony sposób.

2 DEFINICJE

Nie sposób w krótkim paragrafie zaprezentować wszystkich pojęć niezbędnych dla zrozumienia dal­szego ciągu. Zamiast je defi­niować, lepiej byłoby odesłać słabo obeznanego z brydżem Czytelnika by ze 2 lata pograł sobie towarzysko, sportowo, w Interne­cie i z dobrym programem komputerowym. Spróbujmy jednak zestawić sobie pewne rzeczy podstawowe dotyczące brydża:

2.1 Pojęcia wstępne – oczywiste dla grających w brydża

Optymalizację gry trzeba podzielić, przynajmniej z punktu widzenia poszukiwania algorytmu postę­powania graczy (w tym grają­cego programu komputerowego) na 3 zasadnicze sytuacje. Dotyczą one jednego rozdania rozgrywanego na jednym stole.

1.      Licytacja – dotyczy wszystkich czterech graczy. Ponieważ gra się w parze, trzeba przede wszyst­kim uwzględnić system li­cytacyjny danej pary. W pewnym stopniu należy brać również pod uwagę system licytacyjny przeciwników – w czym pomocne są (na pewnym poziomie za­awanso­wania) karty konwencyjne. W fazie tej istnieją problemy probabilistyczne, ale omówie­nie ich odło­żymy do innej publikacji.

2.      Rozgrywka

3.      Obrona. Tutaj oprócz optymalizacji gry własnej trzeba przekazywać i odbierać sygnały part­nera (zrzutki konwencyjne).

Ściśle rzecz biorąc istnieje jeszcze jedna pozycja nie mieszcząca się w tym podziale, a mianowicie sytuacja gracza mającego od­dać pierwszy wist. Dla uproszczenia tą sytuację w tych rozważa­niach pominiemy.

2.2 Ustalenia dodatkowe – oczywiste dla grających w „brydża zaawansowanego” lub sportowego

1.      Istnieją różne rodzaje zapisu dotyczące pojedynczego rozdania. W pewnym stopniu wpływają one na wszystkie 3 wymie­nione wyżej sytuacje gracza. W dalszym ciągu posłużymy się głów­nie skrótowymi określeniami: zapis na IMPy i zapis na maxy, bo te symboliczne skróty my­ślowe wy­starczą do przedstawienia istoty tych rozważań. Z dalszych rozważań będzie wyni­kać, jak ważny dla optymalizacji (doskonalenia) gry w brydża jest właśnie sposób zapisu wy­niku rozdania. Wie­lolet­nie dyskusje jakie się toczą w wielu środowiskach brydżowych na ten temat mają zatem swoje głębokie uzasadnienie.

2.      Można wprowadzić pojęcia strategii i taktyki gry – pojęcia te częściowo zdefiniujemy kontek­stowo poniżej. Dotyczą one m.in. rodzaju zapisu, w którym toczą się rozgrywki.

3.      To samo rozdanie może być rozgrywane na drugim stole (mecz) lub na wielu stołach (turniej). Jest to związane z ustale­niem 1. Chodzi o to, by system zapisu był bardziej sprawiedliwy, co­kol­wiek by to miało znaczyć!

4.      Elementarnym matematycznie i algorytmicznie (lecz nie w pełni uświadamianym jako taki przez wielu graczy o różnym po­ziomie zaawansowania) jest pojedynczy ruch w licytacji i w roz­grywce/obronie.

5.      Ruch niekoniecznie jest elementarną jednostką psychologicznie. W sytuacjach decyzyjnych bądź o znaczeniu taktycznym z pewnością nie jest elementarny – mówimy o grze ludzi nie au­to­matów… Często jeden ruch decyduje o wyniku rozdania (czyli o wszystkim!), szczególnie wtedy gdy może być interpretowany przez pozostałych graczy na różne sposoby. W ta­kich sy­tuacjach strategia sprowadza się do odpowiedniego przygotowania tego właśnie ruchu. Lite­ratura bry­dżowa jest uboga w opracowania psychologiczne (temat arcy–trudny) – chociaż ostatnio jest pewne ożywienie w tym zakresie. Prawdopodobnie w tym elemencie najsilniej wychodzi na jaw słabość graczy–automatów.

Prawdopodobnie wymienione cechy brydża „zaawansowanego” to tylko formalny i bardzo ogólny aspekt zmagań na wysokim po­ziomie. Właściwie, wymienione powyżej cechy charakteryzują jeszcze inne gry karciane, bądź nawet szerzej: strategiczne. Na szczęście matematyzacja (bardzo trudna) brydża jest przecież czymś istotnym motywowana. W następnym paragrafie przedsta­wimy właśnie różne dodatkowe elementy motywacyjne i odkryjemy tym samym dodatkowe ważne aspekty brydża kwalifikowa­nego.

3 DODATKOWA MOTYWACJA

Oprócz chęci uzyskania pewnego postępu zarówno w teorii przeznaczonej dla graczy jak i dla pro­gramistów urządzeń grających w brydża, celem niniejszej publikacji jest rzucenie światła na pewne nietypowe a nawet „niewytłumaczalne” zjawiska występujące w teorii i praktyce brydżowej. Oto nie­pełna lista tych zjawisk.

3.1 Wskazówki i manewry

Wiadomo, że ograniczeniem automatów grających w szachy jest ilość wariantów, które trzeba wyge­nerować i ocenić. Z grubsza można tą ilość oszacować jako 1000k, gdzie k jest tzw. ilością ruchów naprzód. Na dobrym poziomie gry to k musi przekraczać 6! Mamy zatem do czynienia z liczbami „ko­smicznymi”.

W brydżu ilość wariantów jest nieporównywalnie mniejsza. Spójrzmy na to z perspektywy gracza „ludzkiego”. Jest absolutnie re­alistycznym (a nawet przesadnym!) założenie, że w miarę kwalifiko­wany gracz ma za każdym razem, gdy podejmuje decyzję, średnio dwa możliwe „sensowne” ruchy do wykonania. W rzeczywistości w sporym procencie sytuacji jest tylko jedna karta do dodania lub jedna odzywka do zalicytowania!!

Zatem jakby chcieć przewidywać 6 ruchów do przodu, to mielibyśmy zaledwie 64 warianty do rozpa­trzenia. Ten szacunek jest na dodatek na ogół przesadzony.

Mimo tej stosunkowo niewielkiej (no powiedzmy dla człowieka to nie tak mało…) ilości wariantów, które musi rozpatrzyć gracz lub program grający, zdumiewa ogromna ilość wiedzy jaka nie tylko jest potrzebna ale jest wręcz niezbędna do gry nawet na po­ziomie 10% profesjonalizmu (patrz niżej co przez to rozumiemy).

Np. znany teoretyk i nauczyciel brydża Edwin Kantar sformułował ok. 150 wskazówek (a w ogóle ta liczba w jego publikacjach grubo przekroczyła 500!!), bez znajomości których gra jest wyraźnie słab­sza!! Wskazówki te na ogół są bardzo dalekie od oczy­wistości!!

Oprócz wskazówek każdy gracz musi mieć opanowany pewien arsenał manewrów. Każdy wie co to jest impas, ale innych ma­newrów jest też około stu. Niestety ich znajomość jest niewystarczająca. Dochodzi do tego, że niektóre manewry nie mają nawet nazwy(!). Mimo to wiadomo, że bez znajomo­ści manewrów, brydż staje się własną karykaturą.

Postawmy się zatem na miejscu nowego adepta brydża, któremu „na dzień dobry” proponuje się nauczenie ze zrozumieniem po­wiedzmy 80–ciu wskazówek i 40–tu manewrów. Sytuacja absurdalna…

Nic tylko uciekać, a przecież jeszcze trochę się trzeba nauczyć o konwencjach  i zwyczajach licyta­cyjnych. A jest to szczególnie stresujące, bo pomyłki w trakcie licytacji wywołują natychmiastową nieprzyjemną reakcję partnera. A jeszcze dodatkowo trzeba znać chociaż elementy wistu…

Na marginesie dodam, że nawet impas nie jest wcale łatwym manewrem. Wiążą się z nim 2 elementy:

1.      Jeśli jakaś znacząca karta znajduje się w ręce, z której wychodzi się do impasu, to należy ją za­grać czy nie? Problem ten jest różny w zależności czy zagrywamy z dziadka czy z zakrytej ręki.

2.      Wykonanie impasu zakłada możliwość dojścia do ręki, z której dokonuje się zagrania. Czasami trzeba dwóch lub więcej dojść. To może być problematyczne.

Punkt 2 wskazuje, że w zasadzie każdy manewr posiada kontrmanewr. W przypadku impasu jest to próba niedopuszczenie do za­grania na impas a więc np. atak na komunikację.

3.2„Głębia” intelektualna

Średnio w co drugim rozdaniu mamy autentyczny problem czy wręcz kilka problemów, które spro­wadzają owe rozdania do po­ziomu rozrywki intelektualnej wysokiego lotu. To prawda, że często mi­jają one niezauważone, ale jest również prawdą, że niektóre rozdania zaprzątają uwagę gracza przez wiele godzin już po skończeniu gry. Często – szczególnie w naszym kraju – jedno rozda­nie może doprowadzić do czasowego rozpadu pary. Oczywiście rozdanie takie musi posiadać odpowiednią dla klasy pary głębię intelektualną.

Niektórzy w omawianej „głębi” dopatrują się przyczyny faktu, iż brydż dość często uzależnia (w sen­sie chorobowym) graczy. Zdarzają się sytuacje, że gracz znacznie więcej spędza czasu na grze niż śpi!! I to może trwać np. miesiąc!

3.3 „Profesjonalizacja”

Istnieje tzw. amatorski poziom gry. Jedną z jego cech zdefiniujemy w rozdziale KLASYFIKACJA ZMIENNYCH Zi

Inną cechą pary amatorskiej jest używanie tzw. naturalnego systemu licytacyjnego i naturalnego systemu zrzutek w obronie. Do pojęcia „naturalności” jeszcze powrócimy [nie wiem czy w tej pracy].

Rosnące „procenty profesjonalizacji” dotyczą coraz węższej grupy graczy. Wzrost ten w karierze gracza nie jest tylko ilościowy. Często przy przejściu np. z 30% do 70% nawet przy generalnie tym samym systemie licytacyjnym i zrzutkowym, trzeba dokonać swoistej rewolucji ustaleń szczegóło­wych. A więc procenty profesjonalizmu umożliwiają zaobserwowanie zjawiska przejścia ilości w ja­kość.

W chwili obecnej brydż stał się pewnego rodzaju przemysłem zatrudniającym w skali światowej kilka tysięcy brydżowych profe­sjonalistów. Przemysł ten powiązany jest z innymi gałęziami gospodarki takimi jak np. turystyka i wypoczynek.

Procent profesjonalizmu graczy ma znaczenie komercyjne dla teoretyków brydża piszących arty­kuły, książki i oprogramowanie edukacyjne. Jeżeli opisywana metoda lub system dotyczy wysokiego procentu profesjonalizmu trudno liczyć na dużą ilość nabyw­ców. Dotyczy to także usług szkolenio­wych.

Z kolei przy bardzo niskim procencie profesjonalizacji domniemanego audytorium (opracowywa­nego produktu), trudno liczyć na nabywcę, gdyż gracze tacy bywają często „uodpornieni” na wie­dzę.

3.4 Aspekty psychologiczne

W punkcie 2.5 wskazaliśmy na „podzielność” atomu czyli ruchu ze względów psychologicznych. To podstawowe dla gry prak­tycznej (i naszych rozważań) spostrzeżenie bynajmniej nie wyczerpuje aspektów psychologicznych brydża. Bardzo kontrower­syjne jest blefowanie (głównie w licytacji). Ponieważ istnieje zawsze podejrzenie tzw. blefu „kontrolowanego”, sprawa „obrosła” również usta­leniami z zakresu prawa brydżowego.

Innym motywem psychologicznym są zagrania mylące. Wymagają one na ogół najwyższych kwalifi­kacji, a zatem są dowodem 100%–wego profesjonalizmu gracza.

Nawet u słabo zaawansowanych graczy daje się zauważyć  „styl” zarówno gry jak i analizy parozda­niowej. Co więcej zawodnicy często wykonują zagrania, które można określić mianem kaprysu. Również często w analizie rozdania podkreślana bywa możli­wość wykonania tego typu zagrań. Na­zywa się to czasami zagraniami intuicyjnymi. Znaczenie „intuicji” jest psychologicznie uza­sadnione probabilistycznym charakterem gry.

Styl dotyczy nie tylko pojedynczych graczy ale również całych grup. Np. jest już niepodważalnym faktem istnienie tzw. stylu ju­niorskiego. Dochodzi do tego, że niektórzy juniorzy podkreślają, że chcą za wszelką cenę uniknąć stylu juniorskiego.

4 GENERALNE KRYTERIUM OPTYMALIZACYJNE

We wszystkich trzech fazach (z tym że rozgrywka i obrona są równoległe) każdy gracz musi wielo­krotnie wybrać ruch r optyma­lizujący następującą podwójną wartość oczekiwaną:

EΠ [ EΔ(r) [ Z(r);Pr) ]; Dir] → max       (1)

Zapis: EX[X;Q)] oznacza wartość oczekiwaną zmiennej losowej X o wartościach w zbiorze X, mającą rozkład prawdopo­dobieństwa Q.

Funkcja Z (od Zapis) jest zmienną losową określającą przewidywany wynik rozdania z punktu widze­nia gracza wykonującego ruch. Oczywiście dla strony przeciwnej ów wynik jest odwrotny w skali od­powiadającej zapisowi, w którym toczy się gra. Jeśli gra liczona jest w IMP–ach, to, jeśli Z dla linii NS wynosi 2 IMPy to dla WE: –2. Przy zapisie maksowym następuje odjęcie od 100%.

Wewnętrzna wartość oczekiwana zakłada „znajomość” rozkładu prawdopodobieństwa możliwych do uzyskania wyników rozda­nia. W rzeczywistości owe prawdopodobieństwa są też zmiennymi lo­sowymi. Oczywiście owe zmienne zależą też od danego ru­chu r, stąd też nim są indeksowane.

Zewnętrzna wartość oczekiwana „uśrednia” wewnętrzną wartość oczekiwaną, która jest zmienną lo­sową zależną od r – czyli jej rozkład (a w pewnych sytuacjach również zbiór wartości) zależy od r.

Dir oznacza proces Dirichleta, a więc rozkład prawdopodobieństwa na dyskretnych rozkładach wy­ników możliwych do uzyska­nia w danym rozdaniu, z użyciem systemu zapisu, w jakim to rozdanie jest grane.

W ostatnich latach teoretycy brydżowi zaczęli określać rozkłady prawdopodobieństwa związane z li­cytacją, jednak metodologia jest w stadium embrionalnym. Dużo więcej wiadomo o obronie a przede wszystkim rozgrywce w interesującym nas aspekcie pro­babilistycznym. Dla tego też zaczniemy od tej ostatniej.

Najpierw zatem sprecyzujemy wzór (1) w przypadku gracza realizującego pewien kontrakt. Tą adap­tację (1) rozbijemy na 2 etapy.

Osoba grająca (lub program komputerowy) w danym momencie l rozgrywki/obrony winna optymali­zować swój ruch z punktu wi­dzenia następującego wzoru:

Kryt (  r  ) = Oczekiw2 (∑ Wi (  r  ) Zi )→ max       (2)

i= 0, 1,… 13

tzn. wybieramy ruch r (spośród rozpatrywanych przez gracza g), który maksymalizuje powyższe  kry­terium. Niech R będzie zbio­rem dopuszczalnych ruchów, czyli możliwych do dołożenia kart w danej pozycji.

Istnieje ograniczenie: ∑ Wi (  r  ) = 1, dla każdego r є R.

Wi ( r ) ≥ 0 jest prawdopodobieństwem wzięcia przez stronę gracza g  ilości: i lew przy założeniu za­grania r. Wi (  r  ) odpowia­dają prawdopodobieństwom {Pr} ze wzoru (1).

Zi jest zapisem za wzięcie i lew.

Zarówno współczynniki W jak i Z są – z punktu widzenia gracza podejmującego decyzję w danym momencie oraz dla każdego ru­chu r – zmiennymi losowymi. Tylko w dwóch szczególnych przypad­kach (opisanych w rozdziale 10) współczynniki Z są stałe.

Elementy wektora losowego W  dla danego ruchu są prawdopodobieństwami., zatem argument ope­ratora wartości oczekiwanej: Oczekiw2 można interpretować jako zmienną losową, która  sama jest wartością oczekiwaną. Jest to zgodne z ogólnym kryte­rium (1), odnoszącym się również do licytacji.

Rozpiszmy (2) dla bardziej konkretnej pozycji rozgrywającego zmniejszając stopień abstrakcji tej formuły o szereg mniej istotnych jej składowych.

Załóżmy, że rozgrywający jest w trzeciej lewie kontraktu 3 pik. Pierwszą lewę wzięli wistujący. Drugą lewę wziął rozgrywający na stole. Zagrał stamtąd w trójkę pik i prawy obrońca już dołożył piątkę. Te­raz rozgrywający musi coś dołożyć z ręki. Ma on w tym momencie 5 atutów, powiedzmy: AD942. Za­tem zbiór jego ruchów (czyli dołożeń karty) składa się z pięciu elementów.

R = {♠2, ♠4, ♠9, ♠D, ♠A}

Suma występująca w (2) ma w tym momencie nie 14 lecz tylko 11 składników. Rozgrywający weźmie bowiem co najmniej 2 lewy (tę co już wziął i asa atutowego) i nie weźmie więcej niż 12 lew, bo jedną już oddał. Czyli suma jest od 2 do 12.

Powracając do oznaczeń w (1), które implicite są użyte w (2), łatwo stwierdzić, że:

Δ(r) składa się z jedenastu (na ogół nieznanych) wartości zapisu po skończonym rozdaniu,

Π jest zbiorem wszystkich możliwych rozkładów prawdopodobieństwa zmiennych losowych przyj­mujących 11 wartości.

Z reguł gry wynika, że dodanie przez rozgrywającego 2 lub 4 da na pewno ten sam efekt tzn:

Kryt (  ♠2  ) =  Kryt (  ♠4 )

5 ZNACZENIE HEURYSTYKI DLA ROZGRYWKI BRYDŻOWEJ

Zarówno sformułowanie (1), jak i bardziej specyficzne (i bardziej intuicyjne) sformułowanie (2) zawie­rają tyle nieznanych dla gra­cza wartości i funkcji, że od tych sformułowań do efektywnego znalezie­nia najlepszego ruchu „wiedzie jeszcze daleka droga”. Na pewno tą „drogę” inaczej pokonują gra­cze „ludzcy” a inaczej programy grające w brydża i ich twórcy. Ci ostatni mają do dyspo­zycji bardzo już rozpowszechnioną metodę szacowania wartości oczekiwanej: symulację typu Monte Carlo. Pro­blem szacowania wartości oczekiwanej przy pomocy symulacji posiada w teorii probabilistyki i sta­tystyki szeroką literaturę. Monte Carlo już dawno przestało być tylko generacją niezależnych wersji zadanego rozkładu prawdopodobieństwa. Bez wchodzenia w szczegóły odsy­łamy Czytelnika do pracy  przeglądowej: (Greenwood,  Wefelmeyer, 2003).!

Zarówno graczy (a przede wszystkim ich trenerów) jak i twórców programów grających powinno za­interesować inne podejście do tego problemu. Pojęcie: „heurystyka” ma dwa znaczenia w pewnym sensie różne, a jednak na przykładzie brydża zbliżone!!

Na terenie informatyki – ale również matematyki stosowanej – dominuje następujące rozumienie po­jęcia: „heurystyka”.

Załóżmy, że mamy do rozwiązania pewien trudny problem obliczeniowy. Najprostszym przykładem jest tu znalezienie maksimum globalnego funkcji rzeczywistej (funkcjonału) mającej nieskończenie wie­le maksimów lokalnych w swojej dziedzinie. 

Są też przypadki kiedy znamy algorytm dojścia do rozwiązania trudnego problemu praktycznego, ale rea­lizacja tego algorytmu jest zbyt kosztowna. Wtedy na pomoc przychodzi mądra heurystyka! Taka me­toda – chociaż nie gwarantuje dojścia do roz­wiązania – bywa:

1.      Czymś często zupełnie wystarczającym

2.      Pomocna przy rzeczywistym rozwiązaniu problemu.

Istnieje jeszcze co najmniej jedno znaczenie terminu: „heurystyka”. W metodologii nauk i logice, heu­rystyka to nie: METODA–ALGORYTM a raczej specyficzna: UMIEJĘTNOŚĆ, ZDOLNOŚĆ, DO­CIEK­LI­WOŚĆ, METODYKA badacza. Chodzi o umiejętność wykrywania ukrytych związków np przy­czy­no­wych. Owo wykrywanie odbywa się na ogół przy pomocy stawiania inteligentnych albo wręcz twórczych hipotez.

Jak zobaczymy poniżej dwie pierwsze heurystyki (probabilistyczne) użyteczne dla optymalizacji roz­gryw­ki brydżowej są bliskie pierwszej z powyższych definicji, natomiast trzecia (deterministyczna)  pod­pada raczej, pod drugą definicję heurystyki!

To, że różnica między obiema – formalnie innymi – definicjami pojęcia „heurystyka” zanika jest wi­docz­ne z monografii Michale­wicza i Fogela (2006).

Przed­stawione heurystyki mogą być świadomie zastosowane tylko przez graczy kwalifikowanych. Gracze słabsi często nieświa­domie wykorzystują w swojej rozgrywce tylko pewne elementy prezen­towanych heurystyk.

Heurystyki mogą być pomocne przy projektowaniu i ulepszaniu programów (automatów) grających w brydża. Płyną z nich jednak nieco inne zalecenia niż dla graczy i ich trenerów.

 

6 TRADYCYJNA MATEMATYZACJA ROZGRYWKI I JEJ UOGÓLNIENIE – heurystyka 1

Kontynuujemy rozumowanie rozgrywającego pewien kontrakt. Przedstawimy, bez nadmiernego wcho­dzenia w szczegóły, tzw. tradycyjną probabilistyczną metodę optymalizacji rozgrywki. Ta me­to­da istnieje już co najmniej 60 lat, ale w żadnym opracowaniu nie została ona wielostronnie opisana. A wy­maga takiego opisu!

Wyspecyfikujmy dość typową sytuację rozgrywającego.

Pozostało k lew do rozegrania (k ≤ 13).

Rozgrywający do realizacji kontraktu potrzebuje wziąć (1<) n (≤k) lew.

Załóżmy, że są możliwe dwie tzw. linie rozgrywki.

Przykładowo:

1.   Linia L1 polegająca na jednostronnym impasie damy w jednym z kolorów.

2.   Linia L2 polegająca na wyrobieniu jednego z kolorów bocznych.

Wybór optimum wg tej heurystyki polega na obliczeniu prawdopodobieństw sukcesu obu linii, a na­stępnie wyboru linii o większym prawdopodobieństwie (wzięcia n lew). Linii może być więcej niż dwie.

Do obliczenia posiłkujemy się prawdopodobieństwami układów obu obrońców, które są niewi­docz­ne dla rozgrywającego w sytu­acji decyzyjnej. Prawdopodobieństwo L jest funkcją prawdopo­do­bieństw zdarzeń elementarnych. Prawdopodobieństwa elemen­tarne wylicza się z uwzględnieniem na­stępujących danych:

1.      Apriorycznych prawdopodobieństw układów kolorów. W praktyce następuje odpowiednia mody­fikacja tych prawdopodo­bieństw.

2.      Wnioskowaniu o położeniu istotnych figur u obrońców.

3.      Danych dodatkowych wynikających z licytacji i z dotychczasowego przebiegu rozgrywki.

Słabości metody

Czasami trzeba rozważyć np. wynik rozdania jako wpadkę bez jednej. Taka wpadka może być opła­cal­na. Optymalna linia na wy­granie kontraktu może się różnić od linii na wpadkę bez jednej. Problem ten komplikuje się dodatkowo, jeśli trzeba dodat­kowo roz­patrywać wpadkę bez dwóch i nadróbkę.

Pro­blemem też jest praktyczne wyliczenie przy stole prawdopodobieństw linii. Być może w dającej się przewidzieć przy­szłości dopuszczone zostaną do użytku graczy (i/lub komentatorów pewnego ty­pu rozgrywek sportowych) odpowiednio skonstru­owane kalkulatory do wyliczania prawdopodo­bieństw sukcesu linii rozgrywkowej. Na pewno z czasem wszelkiego rodzaju trady­cyjna lub nowa po­twier­dzona profesjonalnie wiedza będzie ujęta w formie hardware’owo–software’owej po to by wyko­rzy­stywać np. przy grze internetowej. Tak jak to ma miejsce przy korespondencyjnej grze w szachy.

Możemy zdyskontować pierwszą korzyść wynikającą z wprowadzenia kryterium optymalności (2). Otóż opisywana me­toda ist­nieje już kilkadziesiąt lat a jednak:

1.      Nie jest dobrze udokumentowana.

2.      Jest niechętnie wykładana.

3.      Jest niechętnie słuchana.

4.      Rzadko się pojawia w periodykach profesjonalnych.

Oprócz wymienionych słabości możemy obecnie stwierdzić, iż metoda tradycyjna nie daje rozwiąza­nia optymalnego a jedynie jest heurystyką. Zatem irracjonalny opór przed podejściem uważanym za nau­kowe i jedynie słuszne było całkiem racjonalne.

7 ZAWODNICZA OPTYMALIZACJA ROZGRYWKI CZYLI

WALKA O MAKSYMALIZACJĘ SPODZIEWANEJ ILOŚCI LEW – heurystyka 2

Większość doświadczonych graczy posiłkuje się metodą inną niż tradycyjna. Różnica polega nie tyl­ko na algorytmie obliczenio­wym, ale również na „filozofii”. Nie przede wszystkim szukają oni linii op­ty­malnej – jest ona raczej skutkiem.

Przedstawimy pewną formalizację owej metody, a następnie opiszemy jej aspekty bardziej prak­tyczne.

Już na początku rozgrywki (po ukazaniu się „dziadka”) taki gracz szacuje oczekiwaną ilość lew, któ­rą może wziąć. Następnie tak dobiera ruchy swoje i „dziadka” by zmaksymalizować ową wartość ocze­kiwaną, obserwując oczywiście kolejne ruchy obrońców.

Po ukazaniu się dziadka rozgrywający określa zwykle strategię rozgrywki, a następnie wzbogaca ją ru­chami taktycznymi.

Ta metoda ma (w dystansie) tą przewagę nad metodą tradycyjną, że reaguje dynamicznie na wszyst­kie wydarzenia przy stole, a więc:

1.      Namysły obrony. Namysły te są często specjalnie prowokowane poprzez nietypowe zagrania rozgrywającego.

2.      Zrzutki obrony, zmieniające prawdopodobieństwa określonych konfiguracji zakrytych rąk.

3.      Szybkość analizy – gracz rozpoczynający rozgrywkę po kilku sekundach, ma dużo większe szanse na to, że przeciwnicy prze­ciwko niemu popełnią więcej błędów.

4.      Szybkość analizy – gracz rozpoczynający rozgrywkę po kilku sekundach, ma dużo większe szanse na to, że przeciwnicy prze­ciwko niemu popełnią więcej błędów.
Rozpoczynanie rozgrywki natychmiast lub szybko po wyłożeniu dziadka, szczególnie w intencji sprowoka­nia przeciwnika do błędu a nie w płaskim rozdaniu, jest faulem i II obrońca ma prawo wstrzymać roz­grywkę. W ważnych rozgrywkach byłem świadkiem tego typu wstrzymań nawet jak obrońca miał zagranie oczywiste. Dotyczy to tylko sytuacji po pierwszym wiście, potem tempo jest dowolne.

5.      Każda profesjonalna para, stara się kamuflować używane przez siebie konwencje wistowe.
To nieszczęśliwe sformułowanie, które traktowane dosłownie jest równoważne twierdzeniu że każda pro­fesjonalna para oszukuje. Wszystkie ustalenia muszą być jawne i równo dostępne dla każdego z graczy przy stole. Stąd zakaz nie tylko ukrywania ustaleń, ale także stosowania kryptotechnik (ustaleń zależnych od klucza, w konkretnym rozdaniu znanego obrońcom, a nieznanego rozgrywającemu). Oczywiście patalo­gie się zdarzają, sam znam przypadek pary, która grała totalną ilościówką, ale nie raczyła o tym wspomi­nać. Włosi też są na liście podejrzanych o niejawne ustalenia, ale dowodów brak (??, Leśniewski, który jest fanem analiz, ponoć ma teczkę z podejrzanymi rozdaniami, stąd ponoć taka niechęć do niego Boc­chiego głośna przed paroma latami po wydrukowaniu wywiadu z nim w "Brydżu"). Również techniki w ro­dzaju zrzutki odwrotne z permutacją blotek (np. umawiamy się że 5 jest młodsza od 2 i informujemy o tym), mimo że dozwolone, są uznawane (i słusznie) za głęboko nieetyczne.

6.      Toczy się walka o informację. Umiejętność selekcji i określenie prawdopodobieństwa prawdziwo­ści uzyskanych informa­cji jest zdecydowanie niedoceniana przez brydżystów.

7.      Ogromną pomoc w rozgrywce przynosi wiedza, kiedy przeciwnicy muszą zrzucić prawidłową ilo­ściówkę. Można dostoso­wać plan, nie do szans matematycznych, ale do rzeczywiście za­stanych rozkładów.

Zupełnie nie opisuje się w materiałach teoretyczno–treningowych krzywych oczekiwanej ilości lew. Są to (w przypadku roz­grywki) krzywe, które mają 48 argumentów, gdyż po każdym ruchu oczeki­wana ilość lew może ulec zmianie. Nie jest to sprawa prosta, bo przy publikacji trzeba nie tylko od­tworzyć oceny gracza w trakcie rozdania ale także podać bardziej dokładne oszaco­wania zagranych kart i również odchylenia od optymalnych ruchów (czyli błędy gracza). Tego typu analiza musiałaby być skom­puteryzowana, a wcześniej szczegółowo przedyskutowana.

Przedstawimy bardziej sformalizowaną formę tej heurystyki, nawiązując do kryteriów ogólnych (1) i (2):

Kryt (  r  ) = Oczekiw2 (∑ Wi (  r  ) Ni )→ max      (3)

i

gdzie:

Ni – ilość lew, które zostaną wzięte na końcu rozdania,

i – przebiega zbiór lew „znajdujących się jeszcze w grze”, tzn. po uwzględnieniu lew

     już wziętych i ta­kich, które gracz uważa za pewne zarówno dla siebie jak i dla obrony.

Słabości metody

Maksymalizowanie oczekiwanej ilości lew (do wzięcia przez rozgrywającego) nie zawsze prowadzi do maksymalnego zapisu.

W rzeczywistości gracze czasami uwzględniają jednak podejście tradycyjne i wówczas może dojść do konfliktu utrudniającego podjęcie decyzji.

Trzeba się przyzwyczaić do tego, że oczekiwana ilość lew nie jest liczbą całkowitą.

8 HEURYSTYKA „HIPOTEZOWA” – heurystyka 3

8.1 Wprowadzenie

Od zarania brydża istnieje problem „łapania” dam. Chodzi o sytuacje, w których rozgrywający może impasować brakującą mu damę w obie strony. Istnieją pewne ogólne wskazówki pomagające doko­nać właściwego wyboru w konkretnej sytuacji, ale… gracze na ogół przedkładają irracjonalne (a na­wet z lekka niecenzuralne) reguły typu: damę bierze się pod siebie.

Problem łapania dam w rozgrywce brydżowej można by uznać za zbyt płaski by go rozważać w spo­sób pogłębiony gdyby nie fakt, iż jest to jedynie wierzchołek góry lodowej. „Górę” tą można by na­zwać wykrywaniem rozkładów sprzyjających.

O ile w przypadku konieczności zlokalizowania damy układy sprzyjające dla rozgrywającego są 2 i wiadomo jakie (tylko ciężko się zdecydować, na który zagrać), o tyle w wielu rozdaniach wykrycie ta­kich układów bywa trudne. Aby „zbliżyć” tą problematykę do kryterium (2) i zdefiniować kolejną heu­rystykę przytoczymy w kolejnym punkcie jedną z zasadniczych wskazówek, która mą­dry nauczyciel daje dobrze zapowiadającemu się adeptowi brydża.

8.2 Pierwsza karta z dziadka

Wskazówka ta brzmi następująco:

„Nigdy nie dokładaj natychmiast pierwszej karty z dziadka”

Jest bardzo wiele powodów potwierdzających słuszność tej maksymy. My zwrócimy uwagę na jeden z nich. Okaże się on być jednym z kluczowych i chronologicznie pierwszym elementem przedstawia­nej heurystyki.

Moment wyłożenia dziadka zwiększa gwałtownie informację dla wszystkich trzech graczy, którzy za chwilę stoczą walkę. Jednak rozgrywający ma pewną przewagę, choć musi wykazać również mak­symalną rozwagę Przewaga rozgrywającego wynika ona z dwóch powodów:

1.      Rozgrywający w tym momencie dokładnie zna swój potencjał. Zna swoje silne i słabe strony. Strona przeciwna na ogół roz­poznaje swój potencjał stopniowo.

2.      Z natury rzeczy rozgrywający będzie stroną aktywniejszą od obrony, bo poza skrajnie „dziw­nymi” kontraktami, to rozgrywa­jący bierze większość lew. A zatem ma on więcej możliwości inicjowania swoich PLANÓW niż przeciwnicy swoich!

8.3 Kolejne kroki algorytmu heurystyki 3

Przewagę swoją rozgrywający powinien wykorzystać w następujący sposób. Opiszemy tą metodę przy założeniu, że chce on wy­grać zapowiedziany kontrakt.

Powinien on wyszukać takie rozkłady niewidocznych rąk obrońców, które zapewnią mu sukces. Jest to zadanie na ogół bardzo trudne, ale powinno być wykonane właśnie w momencie ukazania się dziadka. Załóżmy, że są 3 typy tych rozkładów.

Teraz rozgrywający powinien przejść do drugiego, równie trudnego jak pierwszy, etapu realizacji swego PLANU. Powinien „roz­pisać” każdy z tych trzech typów sprzyjających mu rozkładów na ruchy czyli sekwencje dokładanych kart.

Wreszcie owa już zarysowywująca się heurystyka winna zostać ostatecznie dopracowana w nastę­pujący sposób. Otóż rozgry­wający powinien poszukać najdłuższego ciągu ruchów (poczynając od tego pierwszego czyli dołożenia pierwszej karty z dziadka), który zapewnia realizację kontraktu przy założeniu prawdziwości wszystkich trzech hipotetycznych rozkładów.

To jest główny wariant tej heurystyki. W przypadku, gdy się okaże, że rzeczywisty rozkład kart obrońców odbiega od wszystkich założonych lub (tutaj nieco upraszczamy obraz autentycznej walki) rozgrywający poszedł „złą ścieżką”, należy dokonać korekty omawianej heurystyki (dostoso­wując ją do już ujawnionych kart). Owa konieczna korekta jest jednak już ewidentną porażką roz­gry­wającego – również ze względu na to , że na ogół informacje rozgrywającego są porównywalne w tej fazie gry z tym o czym wiedzą obrońcy.

8.4 Porównanie z poprzednimi heurystykami

Jak widać pomiędzy poprzednimi a obecną heurystyką jest zupełnie zasadnicza różnica. Nie spro­wadza ona się jedynie do wcze­śniej zaanonsowanych charakterystyk:

1.      Istotnym składnikiem „intelektualnym” heurystyki 3 jest świadomość tego, że dla każdego zało­żo­nego układu kart w rę­kach obrońców istnieje deterministyczny optymalny algorytm rozgrywki. Jest to tzw. rozgrywka dla czterech rąk.

2.      Heurystyki 1 i 2 podobnie jak teoretyczne kryterium mają charakter probabilistyczny, zaś heury­styka 3 jest determini­styczna.

Oto kolejne różnice:

1.      1 i 2 są zasadniczo dostosowane do kolejnych 24–ech ruchów rozgrywającego (rozgrywający ma do dyspozycji 26 kart, ale ostatnie dwie już nie podlegają jego wyborowi, bo muszą być doło­żone), zaś heurystyka 3 „patrzy” na rozdanie wy­łącznie całościowo.

2.      Istotnym składnikiem „intelektualnym” heurystyki 3 jest świadomość tego, że dla każdego zało­żo­nego układu kart w rę­kach obrońców istnieje deterministyczny optymalny algorytm rozgrywki. Jest to tzw. rozgrywka dla czterech rąk.

9 KRYTERIUM OPTYMALIZACYJNE DOTYCZĄCE RÓWNIEŻ OBRONY I LICYTACJI

Przedstawione metody rozgrywkowe można po pewnych modyfikacjach zastosować również do obrony. W przypadku metody tradycyjnej w jej głównym wariancie, obrońcy szukają linii prowadzą­cej do obłożenia kontraktu bez jednej z maksymalnym praw­dopodobieństwem. W przypadku metody „zawodniczej” chodzi o maksymalizowanie wartości oczekiwanej ilości lew obrońców (a więc: 13–[ilość lew rozgrywającego]). W przypadku heurystyki 3, szuka się takich układów niewidocznych rąk, które umożliwiają obłożenie kontraktu.

Oprócz analizy należy używać odpowiednich zrzutek.

 

10 KLASYFIKACJA ZMIENNYCH Zi

Przy istniejącej praktyce rozgrywek brydżowych zmienne Zi wyliczane są w jeden z poniższych spo­sobów.

1.      Zapis robrowy. Często zapis robrowy przelicza się na tzw. zapis jedno–rozdaniowy a ten z kolei cza­sami na IMP–y. We wszystkich przypadkach od razu po rozdaniu znany jest wynik. Amato­rzy w najlepszym przypadku są w stanie optymali­zować tylko przy tym sposobie zapisu. W trakcie roz­grywki współczynniki Z są stałymi.

2.      Zapis miltonowy (Russian Chicago). Wynik rozdania zależny jest od siły połączonej pary rąk. Dla obrońców siła ta do końca praktycznie pozostaje nieznana. Natomiast dla rozgrywającego po otwarciu dziadka zapisy są wartościami stałymi.

3.      Zapis turniejowy. Wynik rozdania zależy częściowo od wyników tego rozdania rozegranego na in­nych stołach turnieju. Tu wchodzi element statystyczny uwzględniony w tytule artykułu. In­nych graczy można bowiem traktować jako próbę lo­sową z określonej populacji.

4.      Zapis meczowy. Porównuje się wynik rozdania z wynikiem uzyskanym na drugim stole przez drugą parę teamu prze­ciwko drugiej parze przeciwników. Efekt na ogół przelicza się na IMPy.

11 KOMENTARZE DO KRYTERIUM DOTYCZĄCE LICYTACJI

W wielu sytuacjach naprawdę decyzyjnych – tzn. wtedy gdy licytacja zbliża się do maksymalnej możliwej (dla rozdania) wysoko­ści – licytujący musi się liczyć z kontrą karną strony przeciwnej. Za­tem zapisy Z muszą być traktowane jako zmienne losowe o parametrze będącym prawdopodobień­stwem kontry. Z minimalnym prawdopodobieństwem dodatkowym trzeba uwzględniać re­kontrę.

Trzeba też brać pod uwagę przelicytowanie nawet najbardziej „napiętych” własnych kontraktów, przez przeciwników

Nie istnieje dotychczas matematyczna teoria licytacji, która uwzględnia specyfikę brydża.

12 PRZEGLĄD STRON INTERNETOWYCH I LITERATURY SPECJALISTYCZNEJ ZWIĄZANYCH Z OMAWIANYMI ZAGADNIENIAMI

Mówiąc z pewną przesadą można potraktować większość problemów teoretycznych i dydaktycz­nych brydża jako wprowa­dzanie, uzasadnianie i dydaktyka heurystyk poszukujących rozwiązania problemu optymalizacyjnego (1). Oczywiście dotych­czas nikt w ten sposób nie stawiał sprawy. W ogóle w brydżu matematyka i podejście naukowe były dotychczas traktowane “po macoszemu”. W dotychczasowej niezwykle rozbudowanej literaturze przedmiotu znajduje  zaledwie kilka pozycji w pełni naukowa. Na dodatek dotyczą ona aspektów (a jest ich jeszcze sporo), które tu nie były rozwa­żane, dlatego ich nie zacytu­jemy.

Poniższe cytowania należy traktować jako próbkę – w założeniu reprezentatywną – dotyczącą za­gadnień poruszanych w tym artykule. Są one 100%–owo profesjonalne w zakresie brydża, czy też według obecnie funkcjonującej nomenklatury: eks­perckie.

Strony zajmujące się szeroko rozumianą działalnością dydaktyczną to:

www.dannykleinman.com/   www.michaelslawrence.com/   www.bridgedoctor.com/  www.kantarbridge.com/

Organizacje brydżowe prowadzące działalność dydaktyczną to:

Internetowa Szkoła Brydża Ryszarda Kiełczewskiego, www.PZBS.pl.

Polska ma niekwestionowane osią­gnięcia we wszystkich sportowych dyscyplinach brydża.

http://web3.acbl.org/internet/websiteForms.nsf/ltpbForm?OpenForm

Największa i najbardziej wpływowa organizacja brydżowa” American Contract Bridge Ligue

Matthew Granovetter (wraz  z małżonką) również prowadzi działalność dydaktyczną, jednak w znacz­nym stopniu opiera ją o oryginalną koncepcję teoretyczną prze­znaczoną dla wistujących. Koncepcja ta jest częściowo opisana w książce: A SWITCH IN TIME by Pamela and Matthew Granovetter. Dalsze informacje na bieżąco na stronie: www.bridgetoday.com/. Koncepcja Granovetterów ma wysoki sto­pień „naukowości”.

Inna koncepcja, tym razem dotycząca licytacji, mająca wysoki procent naukowości, to tzw. prawo lew łącznych, zainicjowane przez Jean–Rene Vernesa w 1968 roku. Metodologię tą rozwijał następnie Larry Cohen w książkach:  „Тo Bid Or Not To Bid.”, “Following Law”

Dobrze udokumentowaną (ale jednak nie 100% naukową…) krytykę tego prawa zawiera książka Mike’a Lawrence’a i Andersa Wirgrena:  “I Fought The Law Of Total Tricks”, posiadająca polskie tłu­maczenie: Jak walczyłem z prawem lew łącznych.

Dalsze dyskusje na stronie: www.newbridgelaw.com/

 

Symulacja Monte Carlo:  http://www.solver.com/sdkplatform.htm

Pierwszy poważny software oparty na symulacji Monte Carlo: http://www.gibware.com/

 

Strony intelektualisty brydżowego Richarda Pavlicka oraz najbardziej teoretycznego czasopisma branżowego (obie ok. 80% “naukowości”). Prezentują wiele opracowań probabilistycznych i z za­kresu teorii gier:  http://www.rpbridge.net/bgtc.htm    http://www.bridgeworld.com/

 

Pierwszy poważny program dotyczący analizy czterech rąk, wspominanej w związku z heurystyką 3:

http://www.deepfinesse.com/dfentry.html

 

LITERATURA MATEMATYCZNA CYTOWANA

Greenwood P. E., Wefelmeyer W.,  "Empirical estimators based on MCMC data",

w: Shanbhag D. N., Rao C. R.,  "Sto­chastic processes: modelling and simulation", Elsevier, pp.337–370, 2003.

Michalewicz Z., Fogel D. B.,  "Jak to rozwiązać czyli nowoczesna heurystyka", WNT, Warszawa, 2006.

 

Matematyka

 

Co nowego...

do Spisu

1 VI 2007

redakcja@pikier.com

© Pikier.com

brydż, brydz, bridge, brydż sportowy, brydz sportowy, bridge sportowy, Pikier, Sławiński, Slawinski, Łukasz Sławiński, Lukasz Slawinski,

http://niusy.onet.pl/niusy.html?t=watek&group=pl.rec.gry.brydz&tid=9069448&aid=54266623