AlphaZero

AlphaZero風オセロにFlaskでWebUIを追加しECS/Fargateで動かしてみた

前々回、前回とAlphaZero風オセロの強化学習環境を作っていましたが、今回はFlaskでWeb化したゲーム部分を追加してECS/Fargateで動かしてみました。*1 今回のコード FlaskによるWebUI 実行方法 実装概要 ECS/Fargateで動かす 構築の手順 ECS/Fargateのオセロ…

AWS Batch環境でのAPV-MCTSのセルフプレイによる強化学習をGPU化してみた

前回の記事で作成したAPV-MCTSのセルフプレイによる強化学習のAWS Batch環境をGPU化して動かしてみました。 今回のコード 環境の概要 GPU化の実装 nvidia-docker2に対応したAMIの作成を行うCodeBuildを追加 セルフプレイの新モデル作成時のトレーニングをGPU…

AWS Batch環境を作ってAPV-MCTSのセルフプレイによる強化学習を動かしてみた

以前の記事で作成したAlphaZeroもどきオセロのAPV-MCTSのセルフプレイによる強化学習をAWS Batchで動かしてみました。 今回のコード 環境の概要 環境構築の手順 VPC環境 ECR関連 AWS Batch関連 セルフプレイ方法 まとめ 今回のコード 下記、タグv0.0.1になり…

オセロをランダムからChainerを使ったAlphaZeroもどきへと進化させながら実装してみた

これはChainer/CuPy Advent Calendar 2018の25日目です。パーソルキャリア Advent Calendar 2018の25日目でもあります。 クリスマスにオセロしてくれる相手が欲しかったので簡単なオセロゲームを実装してみました。 今回のコード 遊び方 実装概要 オセロ 人…