ŁS

Entropia

17 II 2003

Wprowadzenie:

Ostatnim przykładem w artykule Strategie mieszane (1) (przeczytać!) była gra w „Łapanie Damy”:

 

KWxx

 

Okazało się że Eos z dubla 10x może zrzucać 10 z dowolną częstością

w zakresie od 1/3 do 2/3 – i dopóki nie przekracza tych granic, dopóty gra na impas pozostaje dla Słońca strategią optymalną.

(zatem 10 nie wyróżnia się spośród innych blotek)

D10x

N

W      E

S

xx

Dxx

10x

10xx

Dx

xxx

D10

 

Axxx

 

Było przy tym powiedziane, że częstość losowa (czyli 1/2) daje Słońcu najmniejszą informację, ale nie wyjaśniono, czym właściwie jest informacja i w jaki sposób ją mierzyć. Spróbujmy to nadrobić.

Informacja

Kiedy otrzymujemy więcej informacji, a kiedy mniej ? 

Zależy to od prawdopodobieństwa zdarzenia o którym nas poinformowano – im bardziej coś było niespodziewane, tym więcej informacji otrzymaliśmy. Jeśli przeciwnicy raczą nas zawiadomić, że 5 brakujących 5 atutów nie dzieli się 5–0, nie będzie to żadną rewelacją bo przecież tak właśnie jest najczęściej. Jeśli natomiast jeden z przeciwników zdradzi nam że ma renons, otrzymana informacja będzie znacznie większa, bo przecież renons zdarza się dość rzadko.

Inna sprawą jest przydatność otrzymanej informacji. Może się okazać, że informacja o renonsie na nic się nie zda, bo i tak kontraktu nie sposób wygrać. Jednak na ogół lepiej być poinformowanym bardziej.

Ilość informacji mierzy się wzorem:

lob

1

gdzie:

P = prawdopodobieństwo zdarzenia o którym nas poinformowano

lob = logarytm binarny (tzn o podstawie = 2)

P

Obliczmy ile informacji uzyskujemy otrzymując odpowiedź TAK na pytanie w sytuacji typu „na dwoje babka wróżyła”, tzn kiedy odpowiedź TAK była równie prawdopodobna co NIE (obie miały P = 1/ 2).

Wyjdzie dokładnie 1 (bo 1/ P = 2, a lob 2 = 1 (jako że 2 do potęgi 1 = 2) ), a ponieważ jednostka ilości informacji nazywana jest bitem, mówimy że otrzymaliśmy 1 bit informacji.

Słowo bit pochodzi od binary unit (binarna jednostka), a zarazem oznacza: szczypta, odrobina.

Dość powszechnie acz niepoprawnie nazywa się bitami także cyfry w układzie dwójkowym, czyli 0 i 1.

Właściwa ich nazwa jest jednak inna – mianowicie binity – od słów binary digit (binarna cyfra).

Jeśli prawdopodobieństwo TAK będzie rosnąć, otrzymana informacja będzie oczywiście maleć

(np dla P = 70% otrzymamy pół bita), a gdy w końcu dojdzie do 100% – informacja wyniesie 0 (bitów).

Jeśli prawdopodobieństwo TAK będzie maleć, ilość bitów będzie rosnąć (nieograniczenie).

Sensowność powyższego wzoru na ilość informacji można uzmysłowić sobie rozpatrując zbiór o większej ilości zdarzeń: A, B, C...  O zdarzeniu A możemy być poinformowani natychmiast albo stopniowo (np najpierw o tym że zachodzi A lub B, a potem że spośród nich zaszło A). W obu przypadkach powinniśmy otrzymać tę samą ilość bitów, i – jak można sprawdzić – tak jest rzeczywiście.

Entropia czyli  Niepewność

Stojąc przed dylematem „Czy zachodzi to–a–to ?” jesteśmy w stanie niepewności:  TAK czy NIE ?

Można ją zmierzyć, obliczając średnią ilość bitów jaką otrzymamy kiedy dowiemy się co zaszło:

p( TAK ) lob

1

+  p( NIE ) lob

1

p( TAK ) p( NIE ) = prawdopodobieństwa zdarzeń

( oczywiście   p( TAK ) + p( NIE ) = 1 )

p( TAK )

p( NIE )

Tak obliczana niepewność nazywa się entropią – i można powiedzieć, że wyraża ona naszą potrzebę informacji, stopień niedoinformowania. Podobno entropia wszechświata jako całości nieubłaganie wzrasta – wszystko zdąża do chaosu, a niepewność „co? gdzie? jest” staje się coraz większa.

( entropia to słowo sztuczne: greckie en-tropia znaczy tyle co zwracanie się do środka )

Grając w brydża powinniśmy oczywiście starać się, by entropia przeciwników była jak największa.

Zobaczmy to w poniższej walce o lewy:

 

K109

szansa a priori:

Słońce gra blotkę do 9, i – niezależnie od tego z jaką częstotliwością Eos wybiera D (bądź W) – optymalnym zagraniem w drugiej lewie pozostaje blotka do 10

( bo szansa DWx nigdy nie przewyższy żadnej z pozostałych )  

Wxx

N

W      E

S

ADx

1/ 3

Axx

DWx

1/ 3

Dxx

AWx

1/ 3

 

xxxx

 

 

Eos dysponuje więc całkowitym luzem w zakresie odstępstw od losowości – może bić, dajmy na to Damą, z częstotliwością zupełnie dowolną: 0–100 % ! i nic na tym nie straci, bo optymalna strategia Słońca rozgrywania tego koloru nie ulegnie zmianie. Ale... czy aby na pewno nic nie straci ?

Obliczmy średnią entropię dla Słońca w zależność od P = częstości bicia Damą przez Eosa:

Jeśli Eos pobił Damą (P), stosunek szans ADW:DWx zmienia się z 1:1 na 1:P, a entropia = ...

Jeśli Eos pobił Waletem (1-P), stosunek szans DWx:AWx zmienia się z 1:1 na 1–P:1, a entropia = ...

Średnia entropia wyraża się zatem wzorem ...    (Szczegóły pomijamy. Najlepiej napisać programik)

I ostatecznie możemy sporządzić tabelę:

P  =

0

.1

.2

.3

.4

.5

.6

.7

.8

.9

1

średnia entropia =

0.667

0.793

0.855

0.892

0.912

0.918

0.912

0.892

0.855

0.793

0.667

Najmniej pewności co do rzeczywistego stanu rzeczy – czyli największą entropię – ma więc Słońce wtedy kiedy Eos mając DWx bije losowo (w 50% Damą, w 50% Waletem). Co oczywiście można było łatwo przewidzieć, jako że problem był symetryczny, a rola Dama identyczna jak rola Waleta.

Są jednak problemy bardziej finezyjne:

Łapanie Króla z Dziesiątką

Rozważmy następującą walkę o lewy:

Słońce – będąc rozgrywającym – gra ze stołu Damę:        (rozważmy po 600 rozdań wytasowanych)

 

DW9x

 

rozdań z konkretnymi zrzutkami:    

Np w podziale pierwszym Wieczór ujawniając 2 blotki może uczynić to na 1 z 6 możliwych sposobów.

Zatem szansa że ujawnił takie blotki a nie inne maleje 6 razy.

876

N

W      E

S

K10

Eos musi kłaść Króla

600 : 6 = 100

1087

K6

???

600 : 2 = 300

108

K76

Eos musi kłaść blotkę

600 : 2 = 300

 

Axxx

 

 

 

Strategia Słońca zależy od częstości z jaką Eos podkłada Króla w przypadkach chwiejnych (K6).

Jeśli mniej niż 100 razy (na 300) – Słońce gra Waleta i wygrywa stale w 400 rozdaniach.

Jeśli równo 100 razy – Słońce po Królu może równie dobrze grać na impas, ale wygrywa też 400 razy.

Jeśli więcej niż 100 razy – Słońce po Królu gra na impas i wygrywa coraz częściej niż 400 razy !

Zatem Eos powinien podkładać Króla z dowolną częstością nie przekraczającą 1 / 3.

Gra powyższa została przeanalizowana w „Bez impasu” (Andrzej Macieszczak i Jakusz Mikke, 1980).

Autorzy popełnili jednak pomyłkę (zakładając – nie wiadomo dlaczego – że jedna ustalona blotka jest u Wieczora) i wyszła im błędnie częstość 1/ 2. Poza tym nikt chyba nie opublikował analizy tego rodzaju problemów, choć czasem podawane są częstości (w Amerykańskiej Encyklopedii) jest podana poprawna częstość 1/ 3 dla problemu bliźniaczego, więc chyba w domyśle i dla niniejszego).

Nasuwa się teraz pytanie:

Czy jest obojętne jak często Eos podkłada Króla ? – byle nie czynił tego częściej niż 1 na 3.

Otóż powinien podkładać z taką częstością, aby entropia Słońca była jak największa !

Schemat obliczeń jest analogiczny jak w poprzednim problemie. A oto wyniki:

p =

0

0.1

0.2

0.249

0.250

0.251

0.3

1/3

średnia entropia =

0.857

0.957

0.983

0.985227

0.985228

0.985227

0.983

0.978

Zatem Eos powinien podkładać Króla z częstością = 1 / 4 !

W rozpatrywanych 300 rozdaniach ma więc 75 razy podłożyć Króla, a 225 razy blotkę – czym zawsze postawi Słońce przed jednym z dylematów:

po podłożeniu Króla – będzie 100 przeciwko 75 za K10 – czyli 4:3

po dołożeniu blotki – będzie 300 przeciwko 225 za K76 – czyli też 4:3 !

Okazuje się, że nie jest to efekt przypadkowy. Można łatwo wykazać ogólnie, że (twierdzenie):

W tego rodzaju trylemacie entropia jest największa, gdy dylematy mają tę samą proporcję szans.

Pozwala to zaoszczędzić w przyszłości żmudnych rachunków.

Autor nie dysponował żadnymi podobnymi rozważaniami jako wzorcem, a jedynie definicją informacji i entropii. Dobrze więc, gdyby ktoś to wszystko zweryfikował, a zwłaszcza sens pojęcia entropii średniej.

Palcówkowość

Tak można by nazwać entropię specjalnie na użytek brydżystów.

Ponieważ entropia dylematu waha się od 0 do 1 bita, można ją wyrazić w procentach:

0% = wiadomo co jest, 100% = nic nie wiadomo (na dwoje babka wróżyła i po równo – palcówka).

Jeśli są więcej niż 2 zdarzenia należy entropię podzielić przez logarytm binarny ilości zdarzeń.

 

Szansologia

Co nowego...

do Spisu

Nie samym brydżem człowiek żyje:  do Czytaj!

17 Lutego 2003

mailto Pikier

© Pikier.com

brydż, brydz, bridge, brydż sportowy, brydz sportowy, bridge sportowy, Pikier, Sławiński, Slawinski, Łukasz Sławiński, Lukasz Slawinski,