More than 5 years have passed since last update.

強化学習42　Colaboratory+CartPole+tensorflow 見せてもらおうかtensorflowの新兵器とやらを

Last updated at 2019-12-24Posted at 2019-12-23

中学生から大学生までのAI初学者を対象にしています。
強化学習２８を行っていることが前提です。

tensorflowの強化学習版は
tensorflow/agentsです。
githubはこちら

この中にチュートリアルがあるので、そちらをやります。
CartPole をDQNでやるのが、チュートリアル１にありました。
colaboratoryのノートブックを開くからgithub経由で開きます。

そのまま実行すれば、すくすく進みます。
数分で終わります。

2日後に追記です。
chainerは、define by runです。この流れをくんで、pytorchもdefine　by　run。
tensorflowはver1.0がdefine and run、 ver 2.0がdefine　by　run。
このあたりの説明は、ググってください。
初心者に優しいのは、define by runです。
define　and　runは、めげました。強化学習には向いていない。ゲームごとの特徴を、いちいち細かく設定しなければならなくなります。
tensorflowで強化学習するならば、ver2.0以降ということになります。
ところが、googleは頑張っていますが、ver1.0と2.0が絶壁のように違うみたいで、ソースコードを読んでもひどいことになります。
tensorflowの可読性は悪いようなので、2日でめげました。chokozainer的に何もできない。
なので、tensorflowは大きな理由がなければ、2021年以降に再勉強しようかと思っています。

そもそも、tensorflowをやろうとしたのは、tensorflow.jsの存在があるからです。
同様のものはONNX.jsでできそうなので、そちらを使ってみようかと思います。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

強化学習42 Colaboratory+CartPole+tensorflow 見せてもらおうかtensorflowの新兵器とやらを

強化学習42　Colaboratory+CartPole+tensorflow 見せてもらおうかtensorflowの新兵器とやらを