ポーカーにおける混合戦略とは?
2023年11月16日
今回は、ゲーム理論のナッシュ均衡に基づいた混合戦略について紹介していきます。
混合戦略は現代ポーカーにおいて欠かせない概念です。混合戦略について理解し、実践で使えるようにしていきましょう。
ゲーム理論について知りたい方は初めに『ポーカーにおけるゲーム理論とは?GTOとの関連を解説』をご覧ください。
混合戦略はGTOにおける、EVが同じ時に起こります。ポーカーでは互いに最適な戦略を取っていると多くの場合でチェックやベットを混ぜた混合戦略が必要になります。
もし、全て同じライン(アクション)を取っていたら、簡単にエクスプロイトされてしまうでしょう。では、なぜ混合戦略が必要なのか、どうエクスプロイトされるのか見ていきましょう。
混合戦略を理解するために、よく使われる簡単な例がジャンケンです。
実は、ジャンケンも混合戦略を取らないと簡単にエクスプロイトされてしまいます。
ジャンケンでの混合戦略はグー、チョキ、パーを33%ずつ混ぜるのが数学的に正しいです。もし少しでも偏ってしまうと、相手にエクスプロイトされて長期的に見ると負けてしまいます。
例えば相手がグー40%、チョキ30%、パー30%出すとします。そうしたら、こちら側は100%パーを出し続けてしまえば、簡単に勝ち越すことが出来るでしょう。
このジャンケンの例から混合戦略の重要性について学べたと思います。次に、本題のポーカーでの例を紹介します。
ポーカーでは、多くのスポットで混合戦略を使うと最も高いEVを出すことが出来ます。
その例を見てみましょう。
※スタックは互いに100bb
プリフロップ
BTN レイズ 3bb
SB 3bet 10bb A❤︎5❤︎
MP コール
フロップ A♠︎8♦︎7♠︎ ポット21bb
SB ?
ここでのSBのアクションは何が良いでしょうか?トップペアだからといってベットを全てしてしまってはいないでしょうか?
ここでのSBの正しいアクションはチェックとベットの混合戦略です。ここでトップペア全てをベットしてしまうと、自分のチェックレンジにトップペアが含まれず、相手はチェックしたのを見たらベットをしエクスプロイトされてしまいます。
ジャンケンと同様、ポーカーでもしっかりとバランスを取れるようにしていきましょう。
実際のGTOのSBの結果は以下の通りとなっています。A5が緑色と紫色で混合戦略になっているのが分かるかと思います。
※ベットサイズ33%,75%、rake5%、cap3、誤差0.5% 。レンジはPreflopAdvisor
混合戦略の他に、純粋戦略というものがあります。純粋戦略は名前の通りチェックやベットを混合するのではなく、最もEVが高いアクションが存在し、その1つのアクションを取ることを言います。
例を見てみましょう。
プリフロップ
BTN レイズ 3bb
BB コール 3♦︎3♠︎
フロップ 9♦︎5♣︎3❤︎ ポット6.5bb
BTN ベット2.15bb(33%)
BB ?
ここでのBBのアクションは100%レイズすることです。混合戦略と違い、純粋戦略ではある特定のアクションを取ることが数学的に正しいです。
実際のGTOにおけるBBの33の結果は、青色一色でレイズが正しいです。
※ベットサイズ33%,75%、rake5%、cap3、誤差0.5%。レンジはPreflopAdvisor
ここで33のセットを全てレイズしたとしてもBBをエクスプロイトすることは出来ません。レイズの中には、ストレートドローやバックドアフラッシュが含まれておりBTNはレイズされた際に、セットより弱いハンド全てを降りていたら逆にBBにエクスプロイトされてしまいます。
このように純粋戦略ではある特定のアクションを取ることが正しくなります。
ただ、ポーカーにおいて純粋戦略は珍しく、混合戦略になる場合がほとんどです。
混合戦略の利点は相手にレンジを推測させにくくする点です。同じハンドでも様々なアクションをしてくるため、対戦相手は相手のアクションからレンジを絞り込むことが困難になります。
そのため、対戦相手は容易に勝ち越すことが出来なくなるでしょう。
ここまで読んだ方は、GTOで計算された答えを常に暗記すればポーカーは楽勝だと思ったかもしれません。
しかし、それは間違いです。
なぜなら、GTOで計算された答えを全て覚えることは不可能だからです。例えば、先ほどGTOの計算結果を載せましたが、 正しい比率で混合戦略を覚えることは出来るでしょうか?それに加え、先ほどの結果は、『 ベットサイズ33%,75%、rake5%、cap3、誤差0.5% 。レンジはPreflopAdvisor 』という限定された結果のGTOです。
本当のGTOではベットサイズは無限に設定することが出来、誤差をもっと少なくすることが出来るため計算結果はさらに複雑になるでしょう。
人間が最適な戦略を常に出来ないことから、どんな人でも少しのミスはしています。そのミスにエクスプロイトをすることが最も高いEVラインを取ることが出来るでしょう。
混合戦略にを学ぶにはGTO Wizardを使うのが一番です。
GTO+やPioSolverの解析結果を見て学ぶことも可能ですが、見るだけでは身に付きにくいです。そこでGTO Wizardを使うと、実際のベットやチェック頻度を調整することが出来、自分がどれくらい正確に頻度を習得しているのか練習することが出来ます。
混合戦略を学びたい方は、ぜひ一度GTO Wizardを使ってみてください。
混合戦略はポーカーを上手くなるために必須のスキルです。混合戦略の値から大きく外れてしまうとそれに気づいた上手いプレイヤーにはエクスプロイトされるでしょう。