コメントで論文を紹介していただいたので早速読んでみた。

"Monte Carlo search applied to card selection in Magic: The Gathering"（和訳：MTGのカード選択へのモンテカルロ探索の適応） url: http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=5286501

　モンテカルロ法はmtgのAIに応用する場合においても有用であると主張する内容だった。私としても有用であろうというふうには思うんだけど、この内容がそれを裏付けるものになっているかは疑問に感じた。

論文の概要

　この論文では「メインフェイズのクリーチャーのプレイをモンテカルロ法で選択すると、ランダムでの選択や貪欲法での選択より強かった。」と主張している。計算条件として、

クリーチャーと土地だけの単色デッキ
デッキ内容は公開情報
マリガンについての記述なし（たぶんなし）
アタックとブロックの戦術は著者が考えたルールに従う場合とランダムの場合の2通り
第２メインのカードプレイの戦術はルールに従う場合、ランダムの場合、モンテカルロ法に従う場合の３通り

　プレイヤーの戦略はアタック戦略がランダムかルールに従うか、ブロック戦略がランダムかルールに従うか、カードプレイ戦略がランダムかルールに従うかモンテカルロかの組み合わせで作られ、計12通りの戦略を相互に戦わせて勝率を調べる。メインフェイズでの戦術のルールは以下のとおり。

ランドはあったら出す
クリーチャーは一番重たいものから貪欲法で出す

アタックとブロックの戦術のルールは紙面の都合で詳しくは書かないとしてある。（超重要事項なんですが、、、）一応アタックは無駄死にしないように、クリーチャーの数とPTの合計が損をしないように選択し、ブロックは返しのフルパンでのダメージが大きくなるように、受けるダメージを抑えて相手のクリーチャーを殺せるようにブロックすると書かれている。

結果と自分の考え

　結果として、各プレイヤー間の200戦やったときの戦績表を載せる。RA_RB_RMといった表現は、RA=ランダムアタック、SA=ルールアタック、RB=ランダムブロック、SB=ルールブロック、RM=ランダムメインプレイ、SM=ルールメインプレイ、MC=モンテカルロメインプレイを表す。 f:id:Delver:20150817142135j:plain

　著者はモンテカルロの優位性について述べているが、そんなことよりブロックのルールがいくらなんでも弱すぎる。rarbrmとrasbrmのプレイヤーの勝率を比べると、どのプレイヤーを相手にした場合でもルールでブロックするプレイヤーが大きく劣っている。さすがにランダムより弱いnoobブロックでは検証の意味がないのではと思う。さらに最後にモンテカルロの探索回数と勝率の関係を示すグラフが2つ載せられている。これによるとnoobブロック戦術をお互いに採用したときはルールに従うカードプレイに対して、モンテカルロ法は80%の勝率があるとしているが、この異常に高い勝率はモンテカルロ法にのみnoobブロックが行われることを予想できるために生じているに過ぎない。そのためプレイ戦術自体の評価としては不適切である。　一方でランダムブロックを採用したときは、ほぼ50:50であり、2000回の探索を行った際にはモンテカルロ法がルールに従うプレイに対して負け越している。このデータからモンテカルロ法が優れているとするのは無理がある。むしろカードプレイはクリーチャー以外のスペルがない条件では貪欲法で決めるので十分であるとすら言える。

　著者は私と同じような思考を辿って、論文が必要で無茶したのかなと思う。もともとはアタックブロックもモンテカルロでやりたかったのではないだろうか。　ブロックを適切に行うと、この条件では多くのゲームはライブラリアウトまで決着しない上に、ロングゲームになるので探索空間が広がりモンテカルロは弱くなる。そのためブロックルールを弱くせざる得なかったんだろう。私としては10体クリーチャーが並んだら引き分けにする等の処置をとるしかないと考えている。　結果を見る限り、クリーチャーしか入ってないデッキであれば貪欲法で十分そうである。アタックとブロックについて考察してる論文があるといいなと思うので、自分でも論文を探してみることにする。