中学生から大学生までのAI初学者を対象にしています。
強化学習28を行っていることが前提です。
tensorflowの強化学習版は
tensorflow/agentsです。
githubはこちら
この中にチュートリアルがあるので、そちらをやります。
CartPole をDQNでやるのが、チュートリアル1にありました。
colaboratoryのノートブックを開くからgithub経由で開きます。
そのまま実行すれば、すくすく進みます。
数分で終わります。
2日後に追記です。
chainerは、define by runです。この流れをくんで、pytorchもdefine by run。
tensorflowはver1.0がdefine and run、 ver 2.0がdefine by run。
このあたりの説明は、ググってください。
初心者に優しいのは、define by runです。
define and runは、めげました。強化学習には向いていない。ゲームごとの特徴を、いちいち細かく設定しなければならなくなります。
tensorflowで強化学習するならば、ver2.0以降ということになります。
ところが、googleは頑張っていますが、ver1.0と2.0が絶壁のように違うみたいで、ソースコードを読んでもひどいことになります。
tensorflowの可読性は悪いようなので、2日でめげました。chokozainer的に何もできない。
なので、tensorflowは大きな理由がなければ、2021年以降に再勉強しようかと思っています。
そもそも、tensorflowをやろうとしたのは、tensorflow.jsの存在があるからです。
同様のものはONNX.jsでできそうなので、そちらを使ってみようかと思います。