コンピュータ囲碁のプログラムの作り方の本。
コンピュータ囲碁では、将棋などとは違って盤面の評価関数を作ってゲーム木探索をしていく方法はあまりうまくいってないらしい。
評価関数の代わりに、終局まで盤面にランダムに石を打つこと(プレイアウト)を規定回数繰り返して、その勝敗数によって評価している。
多腕バンディット(Multi-armed Bandit)問題のアルゴリズムを使って、期待値の大きい手とまだあまり探索していない手を探索するようにしている。
プレイアウトするときに、どのように石を打たせるかが強さの重要な要素。
- 作者: 美添一樹,山下宏,松原仁
- 出版社/メーカー: 共立出版
- 発売日: 2012/11/10
- メディア: 単行本
- クリック: 7回
- この商品を含むブログ (3件) を見る