0
0

More than 3 years have passed since last update.

強化学習42 Colaboratory+CartPole+tensorflow 見せてもらおうかtensorflowの新兵器とやらを

Last updated at Posted at 2019-12-23

中学生から大学生までのAI初学者を対象にしています。
強化学習28を行っていることが前提です。

tensorflowの強化学習版は
tensorflow/agentsです。
githubはこちら

この中にチュートリアルがあるので、そちらをやります。
CartPole をDQNでやるのが、チュートリアル1にありました。
colaboratoryのノートブックを開くからgithub経由で開きます。
tensorflow.png

そのまま実行すれば、すくすく進みます。
数分で終わります。

2日後に追記です。
chainerは、define by runです。この流れをくんで、pytorchもdefine by run。
tensorflowはver1.0がdefine and run、 ver 2.0がdefine by run。
このあたりの説明は、ググってください。
初心者に優しいのは、define by runです。
define and runは、めげました。強化学習には向いていない。ゲームごとの特徴を、いちいち細かく設定しなければならなくなります。
tensorflowで強化学習するならば、ver2.0以降ということになります。
ところが、googleは頑張っていますが、ver1.0と2.0が絶壁のように違うみたいで、ソースコードを読んでもひどいことになります。
tensorflowの可読性は悪いようなので、2日でめげました。chokozainer的に何もできない。
なので、tensorflowは大きな理由がなければ、2021年以降に再勉強しようかと思っています。

そもそも、tensorflowをやろうとしたのは、tensorflow.jsの存在があるからです。
同様のものはONNX.jsでできそうなので、そちらを使ってみようかと思います。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0