ぷよぷよプログラミングAI学習システムは、中高生の自己調整学習に向けて開発されました。
どうやって、Chromebookで、10分で、素敵な人工知能を作れるのでしょうか?
秘密は、3つ。
1 jupyter liteで、webクライアントがpythonコードを実行
2 超軽量な機械学習フレームワークdezeroを採用
3 ぷよぷよのstageとactionがコンパクト
Github&X
ぷよぷよプログラミングAI学習用まとめ
深層強化学習の基礎
amaAI
2022年に開発された強豪AI
ぷよぷよプレイヤーwiki
Youtube
X(Twitter)
GitHub
Discordリンク
puyoai
ぷよぷよ通のAIを書くためのフレームワーク
最終更新5年前
Github
研究論文
深層強化学習を用いたぷよぷよAIの開発
- ゲーム開始から10手の学習
- 上級者のプレイ動画から教師データを抽出し、深層学習
- 上級者のプレイを模倣するAIを開発
論文はこちら
「ぷよぷよ」における深層強化学習による自己対戦の適応
- 一人用ぷよぷよにおけるゲームルールの学習と性能向上を行った
- 深層強化学習と自己対戦を使った対戦用ぷよぷよにおける性能向上を行った
論文はこちら
以下のサイトで紹介されています。
[JSAI2023]ゲーム開発に浸透するAI技術の諸相
DQNを用いたぷよぷよの連鎖構築AI
- DQNによる連鎖構築の学習
- 強いAIには勝てなかった
論文はこちら
モンテカルロ木探索を用いたぷよぷよAI
- Mayah(盤面を点数化する盤面評価システムとしらみつぶし探索を用いたAI)を参考にAIを作成
- 探索にモンテカルロ木探索を導入
- 高い点数を得られる盤面をより短い時間で探索することが目的
論文はこちら
ぷよぷよ×強化学習
DQNでぷよぷよを学習してみる
- GitHubにソースあり
- GPUは使わない
AlphaZeroで最強のターン制ぷよぷよAIを作る!
- ソースコード無し
- 「AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門 著 布留川英一」を参考に実装
アルゴリズム
[強化学習]モンテカルロ木探索を解説・実装
- モンテカルロ木探索
- 木探索アルゴリズムの一種
- 適当な回数ランダムに実行し、その結果から結論を導くアルゴリズム
ぷよぷよ積み方
ぷよぷよの連鎖土台一覧
- 18種類の積み方が記載されている
- 詳しく積み方を記載しているものとそうでないものがある
- 全ての積み方において画像あり
9割の人が使う形「GTR」のつくり方
- 画像あり
- GTRの基本
- 2連鎖