Poker Essays

Strategie, Mindset und Beispiele für Theorie und Praxis

GTO - Basics

Einleitung

In diesem Artikel erfährst du was GTO bedeutet, worin im Poker der Unterschied zur traditionellen Herangehensweise an Poker besteht und vor allem wann und wie sich mit GTO basiertem Spiel Gewinne erzielen lassen.

Definition und Abgrenzung

In diesem Abschnitt möchte ich mit dir einige Grundlagen zur Spieltheorie besprechen und eine Abgrenzung zur traditionellen Herangehensweise an Poker aufzeigen.

Definition und Grundlagen

GTO steht für Game Theory Optimum (auf deutsch “spieltheoretisches Optimum”). Die Spieltheorie ist eine Teildisziplin der Mathematik und beschäftigt sich unter anderem damit welche Strategien Spieler anwenden müssen um die bestmöglichen Ergebnisse zu erzielen. Die Spieltheorie fasst den Begriff des Spiels sehr weit. So werden nicht nur klassische Spiele wie Poker oder Stein/Schere/Papier als Spiele verstanden sondern grundlegend alle Situationen, in denen Akteuere mit unterschiedlichen Interessen aufeinander treffen und der Erfolg der Akteuere maßgeblich von ihrer jeweiligen Strategie bestimmt ist. Typische Beispiele welche im Sinne der Spieltheorie als Spiel verstanden werden können sind:

  • Verhörsituationen ( Wikipedia: Gefangenendilemma ),
  • Inspektionsprobleme (z.B. die Strategien von Verkehrsbetrieben Schwarzfahrer zu identifizieren),
  • u.v.m.

Die typische Herangehensweise um spieltheoretische Aufgabenstellungen zu lösen ist es, für alle Spieler die Strategie zu finden, die dazu führt, dass ein Abweichen von dieser Strategie keinen Vorteil mehr verspricht. Wenn für alle beteiligten Spieler diese Strategien gefunden sind, spricht man auch von einem sogenannten Nash-Gleichgewicht ( Nash-Gleichgewicht ).

Eine Anwendung des Nash-Gleichgewichts im Poker sind die sogenannten Nash-Ranges die für bestimmt Situationen definieren, welche Ranges gegen einen optimal spielenden Gegner All In gepusht werden können.

Abgrenzung zum traditionellen Poker

Der traditionelle Ansatz an Poker setzt zu einem signifikanten Anteil darauf, die eigenen Ranges mit Fokus auf die eigene Equity zu optimieren. Da die Equity einer Range neben den bekannten Spielelementen wie z.B. den Gemeinschaftskarten auch von den unbekannten Spielelementen, insbesondere den gegnerischen Ranges abhängig ist, ergeben sich Vor- und Nachteile dieser Herangehensweise. Ein Vorteil ist, dass wenn du deine Gegner gut einschätzen kannst, du mit dem traditionellen Ansatz deine Ranges auf die Spielweise der Gegner optimieren kannst und so Fehler deiner Gegner gezielt ausnutzen kannst. Nachteilig ist, dass das Ausnutzen von gegnerischen Fehlern eine permanente Adaption des eigenen Spiels erfordert. Schätzt du den Gegner richtig ein gewinnst du, schätzt du ihn jedoch falsch ein oder aber der Gegner kann sich schneller an dich anpassen als du an ihn, bist du schnell in einer Verlustsituation.

Dieses Dilemma kann dadurch gelöst werden, indem ein Spieler seine Strategie dahin gehend gestaltet, dass auf Aktionen dieses Spielers eine erfolgversprechende Adaption der Mitspieler nicht möglich ist. Diese Strategien können weitestgehend unabhängig von den Spielpräferenzen der Mitspieler entworfen werden und bieten bei erfolgreicher Umsetzung den Vorteil, dass das eigene Spiel nicht mehr angreifbar ist. Einer der Nachteile dieses Vorgehens liegt darin, dass eine von den generischen Stärken und Schwächen unabhängige Strategie auf einen optimal spielenden Gegner ausgerichtet ist, und entsprechend die Schwächen des Gegners durch rein spiel-theroretisch gestaltete Strategien nicht ausgenutzt werden. Entsprechend verwenden viele starke Spieler GTO als Fundament ihres Spiels welches gegen Schwächen der Gegner angepasst werden kann – auch wenn dadurch automatisch Angriffspunkte im eigenen Spiel entstehen.

Beispiel und Gewinnpotential von GTO basiertem Spiel

Um zu verstehen, unter welchen Umständen mittels GTO basierten Spiels Gewinne möglich sind und unter welchen Umständen nicht, empfehle ich dir das Verinnerlichen des Konzepts des Nash-Gleichgewichts:

Ein Spiel befindet sich dann im Stadium eines Nash-Gleichgewichts, wenn alle Spieler jeweils eine Strategie in der Art gewählt haben, so dass ein einseitiges Abweichen von dieser Strategie für keinen Spieler einen Vorteil verspricht.

Vernachlässigst du den Rake folgt aus der Tatsache, dass Poker ein Nullsummenspiel ist, dass das von allen Spielern angestrebte Nashgleichgewicht sich dadurch auszeichnet, dass für die Gegenspieler ein Abweichen von ihrer jeweiligen Strategie keinen Vorteil verspricht und somit alle Spieler bei optimalem Spiel im Nashgleichgewicht ± 0 spielen.

Daraus folgt jedoch nicht, dass ein Spieler, der eine Strategie wählt welche bei optimalem Spiel der Gegner einen EV von ± 0 hat automatisch ohne Gewinn den Tisch verläßt. Denn nur weil alle Spieler in diesem Szenario mit ihrer Nash-Strategie ± 0 spielen würden, heisst das nicht automatisch, dass alle Spieler eine Nash-Strategie spielen. Weicht also ein Gegner von der theoretischen ± 0 Nash-Strategie ab, bringt ihm dies keinen Vorteil. Im Gegenteil, ein Spieler der gegen einen GTO Spieler von der theoretischen Nash-Strategie abweicht, muss mit erheblichen Verlusten rechnen, welche sich durch den Nullsummen-Charakter von Poker in Gewinne der Nash-Spieler bzw. des Nash-Spielers übersetzen.

Beispiel

Stell dir das folgende vereinfachte Spiel zwischen zwei Spielern (S1 und S2)vor:
Beide Spieler setzen blind 1/bb, so dass sich im Pot 1bb befindet. Die Bet Size beträgt auch 1bb. Anstelle Karten wird ein Würfel verwendet, das bedeutet die Ergebnismenge E für einen Wurf beträgt:

E = {1,2,3,4,5,6}

S1 würfelt, das Ergebnis seines Wurfes wird S2 jedoch nicht gezeigt. Nach seinem Wurf, kann sich S1 entscheiden, ob er eine Bet setzen möchte oder nicht. Entscheidet sich S1 gegen eine Bet, bestimmt das Würfelergebnis den Gewinner. S2 darf daraufhin entscheiden, ob er die Bet mitgeht oder direkt aufgibt. Die Regeln des Spiels besagen, dass S1 auf jede 1 und jede 2 gewinnt und S2 auf jede 3, 4, 5 oder 6 gewinnt. Sollte S2 aufgeben, gewinnt S1 den Pot. Sollte sich S1 initial gegen eine Bet entscheiden, gewinnt S2 den Pot.

ES1 = {1,2}
ES2 = {3,4,5,6}

Lösung

Für S1 stellt sich nach seinem Wurf die Frage ob er setzen oder aufgeben soll. Im Falle einer 1 oder 2 ist eine Bet offensichtlich die richtige Entscheidung, da der Verzicht auf die Bet den Gewinn eines möglichen Calls aufgeben würde. Falle einer 3,4,5 oder 6 ist die Entscheidung zwischen Bet oder Aufgeben für S1 nicht offensichtlich, läßt sich jedoch über die Konzepte von Pot Odds und des Nash-Gleichgewichts lösen.

S2 bekäme auf eine Bet Pot Odds in Höhe von 2:1. Daraus folgt, dass S2 es sich im Falle des Calls leisten kann auf drei Versuche zwei mal seinen Einsatz zu verlieren, wenn er beim dritten mal den Pot gewinnt. Entsprechend sollte die Bluff Frequenz von S1 33.33% betragen, also auf zwei Value Bets sollte S1 eine Bluff Bet setzen. Eine Bluff Frequenz von 1/3 führt zu einer Indifferenz von S2 bzgl. eines Folds oder eines Calls.

Eine Beispiel Menge BS1 der Würfelergebnisse auf die S1 setzt würde also aus seinen zwei Gewinnwürfen und einem beliebigen der Verlustwürfe bestehen, z.B.:

BS1 = {1,2,6}

Für den Fall, dass S1 eine Bet gesetzt hat, stellt sich für S2 die Frage ob und wenn ja in wieviel Prozent der Fälle er die Bet mitgehen soll. Zur Beantwortung dieser Frage sollen wieder die Konzepte von Pot Odds und Nash Gleichgewicht verwendet werden.

S2 weiß, dass S1 im Falle eines Bluffs Pot Odds von 1:1 erhalten hätte. Daraus folgt, dass auf gemittelt zwei Versuche der Bluff einmal misslingen darf, wenn er beim zweiten mal erfolgreich ist. Daraus folgt eine Call Frequenz CFS2 von

CFS2 = 50%

Die Call Frequent von 1/2 führt zu einer Indifferenz von S1 zu Bluffen oder einen Bluff aufzugeben.

Mit diesen Werten läßt sich nun der Erwartungswert EV für beide Spieler bestimmen.

Unter der Annahme, dass sowohl S1 als auch S2 ihren ermittelten Strategien folgen gilt für S1, dass er
  • mit einer Wahrscheinlichkeit von 1/2, nämlich immer dann wenn S1 sich gegen eine Bet entscheidet (im Beispiel bei jeder 3,4 und 5), weder zusätzliche Gewinne noch Verluste verbucht,
  • mit einer Wahrscheinlichkeit von 1/3, nämlich immer dann wenn S1 eine Value Bet setzt (im Beispiel bei jeder 1 und 2)
    • zu (1−CFS2)=50%, nämlich immer dann wenn S2 folded den Pot in Höhe von 1bb gewinnt
    • zu CFS2=50% den Pot sowie den Call von S2 also in Summe 2bb gewinnt
  • mit einer Wahrscheinlichkeit von 1/6, nämlich immer dann wenn S1 eine Bluff Bet setzt (im Beispiel bei jeder 6)
    • zu (1−CFS2)=50% wenn S2 folded den Pot in Höhe von 1bb gewinnt
    • zu CFS2=50% wenn S2 die Bluff Bet called, die Bet in Höhe von 1bb verliert.
  • jedoch in jedem Fall die 1/2bb die blind investiert wird abgezogen werden muss.
und für S2, dass er
  • mit einer Wahrscheinlichkeit von 1/2, nämlich immer dann wenn S1 sich gegen eine Bet entscheidet (im Beispiel bei jeder 3,4 und 5), die 1bb im Pot gewinnt,
  • mit einer Wahrscheinlichkeit von 1/3, nämlich immer dann wenn S1 eine Value Bet setzt (im Beispiel bei jeder 1 und 2)
    • zu (1−CFS2)=50% folded und nichts gewinnt und
    • zu CFS2=50% die Value Bet called und seinen Einsatz verliert
  • mit einer Wahrscheinlichkeit von 1/6, nämlich immer dann wenn S1 eine Bluff Bet setzt (im Beispiel bei jeder 6)
    • zu (1−CFS2)=50% folded und nichts gewinnt und
    • zu CFS2=50% die Bluff Bet called und sowohl den Pot als auch die Bet von S1, also 2bb gewinnt.
  • jedoch in jedem Fall die 1/2bb die blind investiert wird abgezogen werden muss.
EVS1 = 1/2×0 + 1/3×(1/2×1+1/2×2) + 1/6×(1/2×1−1/2×1)1/2
= 0
EVS2 = 1/2×1 + 1/3×(1/2×0−1/2×1) + 1/6×(1/2×0+1/2×2)1/2
= 0

Legende: S1 checked, S1 setzt eine Value Bet, S1 setzt eine Bluff Bet, geposteter Blind

Gewinn-Potential S1

Die gefundene Strategien beschreiben ein Nash-Gleichgewicht, entsprechend sollte keiner der Spieler einen Vorteil erzielen können, wenn er von seiner jeweiligen Strategie abweicht. Entsprechend ist es wichtig zu verstehen weshalb GTO- bzw. Nash-Strategien dennoch Gewinnpotential bieten.

Um weiteres Gewinnpotential für die Spieler zu finden, soll hier Spieler 1 betrachtet werden und zwar für die Fälle in denen S1 versucht sein Setzverhalten zu ändern und für die Fälle, in denen S2 fehlerhaft spielt.

Abweichungen von S1

Solange S2 diese Strategie beibehält, wird der Erwartungswert beider Spieler stets 0 betragen.

Das bedeutet, S1 kann seinen Erwartungswert nicht durch ein anderes Spielverhalten erhöhen, solange S2 perfekt spielt.

Dies sei exemplarisch an den Fällen, dass S1 immer betted (EV*S1, EV*S2) und das S1 nur Value Bets (EV**S1, EV**S2) setzt veranschaulicht.

Abweichung 1: S1 betted immer, S2 bleibt seiner Strategie treu:

EV*S1 = 1/3×(1/2×1+1/2×2) + 2/3×(1/2×1−1/2×1)1/2
= 0
EV*S2 = 1/3×(1/2×0−1/2×1) + 2/3×(1/2×0+1/2×2)1/2
= 0

Legende: S1 checked, S1 setzt eine Value Bet, S1 setzt eine Bluff Bet, geposteter Blind

Abweichung 2: S1 setzt nur Value Bets und bluffed nie, S2 bleibt seiner Strategie treu:

EV**S1 = 1/3×(1/2×1+1/2×2) + 2/3×01/2
= 0
EV**S2 = 1/3×(1/2×0−1/2×1) + 2/3×11/2
= 0

Legende: S1 checked, S1 setzt eine Value Bet, S1 setzt eine Bluff Bet, geposteter Blind

Abweichungen von S2

Nimm an, dass S1 weiterhin von einer Gewinnverteilung wie oben beschrieben ausgeht und damit eine Bluff Frequenz von 1/3 wählt. S2 ist jedoch bereit ist, sich auch unter schlechteren Voraussetzungen auf das Spiel einzulassen. Nämlich auch dann, wenn S1 ohne es zu wissen zusätzlich auch bei einer 3 gewinnt (E*S1) und S2 nur noch bei einer 4, 5 oder 6 (E*S2)

E*S1 = {1,2,3}
E*S2 = {4,5,6}

Die Erwartungswerte (EV***S1, E***S1) für S1 und S2 ändern sich wie folgt:

EV***S1 = 1/2×(1/3×1+2/3×0) + 1/3×(1/2×1+1/2×2) + 1/6×(1/2×1−1/2×1)1/2
= 1/6+1/2−1/2
= 1/6
EV***S2 = 1/2×(1/3×0+2/3×1) + 1/3×(1/2×0−1/2×1) + 1/6×(1/2×0+1/2×2)1/2
= 1/3−1/6+1/6−1/2
= −1/6

Legende: S1 checked, S1 setzt eine Value Bet, S1 setzt eine Bluff Bet, geposteter Blind

Hatte S1 in den Fällen, in denen er sich gegen eine Bluff Bet entschied (jede 3, 4 oder 5) nichts gewonnen, wenn S2 sich nur unter den ursprünglichen Bedingungen auf das Spiel einließ, gewinnt er in der veränderten Spielsituation in diesen Fällen im Schnitt 1/6bb und damit in Summe 1/6bb anstelle 0bb.

Entsprechend gewinnt S2 unter den veränderten Bedingungen 1/6bb weniger und somit anstelle von 0bb nur −1/6bb.

Daraus folgt, dass wenn ein Spieler die Spielsituation falsch einschätzt und sich entsprechend auch unter schlechteren Rahmenbedingungen auf ein Spiel einläßt, seine Gegner mit optimalem Spiel zusätzliche Gewinne erzielen können.

Zusammenhang zum Poker

Das vorgestellte Spiel folgte sehr einfachen Regeln, und anstelle von Karten wurden Würfel verwendet. Die Erkenntnis, die sich aus dem Beispiel ziehen läßt ist jedoch, dass GTO basiertes Spiel nicht automatisch Ergebnisse von ±0 liefert. Vielmehr ist es so, dass wenn die Gegner eines GTO Spielers bereit sind, sich unter schlechteren Voraussetzungen als angemessen auf das Spiel einzulassen, der GTO Spieler signifikante Gewinne erzielen kann.

Daher ist es so wichtig, dass du in der Lage bist, Spielsituationen richtig einzuschätzen und deine Ranges entsprechend zu gestalten. Deine hoffentlich schwächere Gegnerschaft wird hierzu in der Regel deutlich schlechter in der Lage sein als du. Und Gegner, die die Spielsituation falsch einschätzen sind eine der wichtigsten Quellen für Gewinne am Pokertisch.

Sollte S2 sich nur unter noch besseren Bedingungen auf das Spiel einlassen, entspräche dies einem Spieler der zum Beispiel in der Auswahl seiner Starthände zu selektiv ist. Im Extremfall kämen die anderen Spieler gegen einen solchen Rock zwar nicht mehr dazu ihre GTO Strategien in der Praxis umzusetzen, würden jedoch jedes mal die Blinds vom Rock kassieren.