深層強化学習の参考サイトまとめ

Last updated at 2024-10-16Posted at 2024-10-03

　ぷよぷよプログラミングAI学習システムは、中高生の自己調整学習に向けて開発されました。
　どうやって、Chromebookで、１０分で、素敵な人工知能を作れるのでしょうか？
　秘密は、３つ。
　１　jupyter liteで、webクライアントがpythonコードを実行
　２　超軽量な機械学習フレームワークdezeroを採用
　３　ぷよぷよのstageとactionがコンパクト

Github&X

ぷよぷよプログラミングAI学習用まとめ

深層強化学習の基礎

amaAI

2022年に開発された強豪AI

ぷよぷよプレイヤーwiki

Youtube

X（Twitter）

GitHub

Discordリンク

puyoai

ぷよぷよ通のAIを書くためのフレームワーク
最終更新5年前

Github

研究論文

深層強化学習を用いたぷよぷよAIの開発

ゲーム開始から10手の学習
上級者のプレイ動画から教師データを抽出し、深層学習
上級者のプレイを模倣するAIを開発

論文はこちら

「ぷよぷよ」における深層強化学習による自己対戦の適応

一人用ぷよぷよにおけるゲームルールの学習と性能向上を行った
深層強化学習と自己対戦を使った対戦用ぷよぷよにおける性能向上を行った

論文はこちら

以下のサイトで紹介されています。
[JSAI2023]ゲーム開発に浸透するAI技術の諸相

DQNを用いたぷよぷよの連鎖構築AI

DQNによる連鎖構築の学習
強いAIには勝てなかった

論文はこちら

モンテカルロ木探索を用いたぷよぷよAI

Mayah（盤面を点数化する盤面評価システムとしらみつぶし探索を用いたAI）を参考にAIを作成
探索にモンテカルロ木探索を導入
高い点数を得られる盤面をより短い時間で探索することが目的

論文はこちら

ぷよぷよ×強化学習

DQNでぷよぷよを学習してみる

GitHubにソースあり
GPUは使わない

AlphaZeroで最強のターン制ぷよぷよAIを作る！

ソースコード無し
「AlphaZero 深層学習・強化学習・探索人工知能プログラミング実践入門　著　布留川英一」を参考に実装

アルゴリズム

[強化学習]モンテカルロ木探索を解説・実装

モンテカルロ木探索
木探索アルゴリズムの一種
適当な回数ランダムに実行し、その結果から結論を導くアルゴリズム

ぷよぷよ積み方

ぷよぷよの連鎖土台一覧

18種類の積み方が記載されている
詳しく積み方を記載しているものとそうでないものがある
全ての積み方において画像あり

9割の人が使う形「GTR」のつくり方

画像あり
GTRの基本
２連鎖

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up