LoginSignup
0
0

More than 5 years have passed since last update.

Reinforcement LearningのUdemyコンテンツをやっていく(1)

Posted at

Reinforcement LearningのUdemyコンテンツの勉強を始めました。

個人的に、機械学習を利用したセキュリティのソリューションを作りたくて、Pythonを使った強化学習の勉強を開始したいと思います。
教科書は、以下のものを使います。

「Advanced AI: Deep Reinforcement Learning in Python」
https://www.udemy.com/deep-reinforcement-learning-in-python/

何かあれば、マサカリ、質問など投げていただけたらと思います。

Introduction and Outline

深層学習と強化学習の組み合わせ→ALphaGo、自動運転自動車、人間を超えたテレビゲームの試合
70年代から開発されてたけど、最近すごいらしい
深層強化学習!!
強化学習は教師あり学習、教師なし学習とは違うよ
技術的には、エージェントがデータと相互作用するんだけど、逐次的で、もっと相互作用的だよ。
教師あり学習や教師なし学習を退屈なものにするよ

多大な潜在能力があって、多大なリスクがあるよ
経済の安定性や、我々の存在そのものに多大なリスクがあるお(ターミネーター!?)
AIは人間みたいには考えないよ

OpenAI使うみたい

基礎をやっていったら、OpenAI Gym環境をやっていくよ
Open AI Gymって、シンプルな標準的UIを全ての環境で準備しているので、UIを勉強するだけだよ

Cart-Pole
カートに乗ったポールを可能な限りバランスしていくゲーム
Mountain Car
車を山のてっぺんまでおしあげる必要があるんだけど、直接登る力はなくて、反動を使う必要がある

Boston Dynamicsのロボットが例として出てた

テクニック

前のコース:Marcov Decision Process
Dynamic Programming
Monte Carlo
Temporal Difference Learning
の三つが重要らしい

RBFネットワークが強化学習では使われるらしい
Deep Q-Learning

どこでコードをゲットするか

以下のリポジトリでコードをゲットできます。

OpenAI Gymをインストールするには以下のようにします

sudo pip install gym

pipがインストールされてなかったので、以下のサイトを参考にインストール

注意事項としては、「ちゃんとコードしようね!」ということが挙げられていました。講義の中で実行されているコードを自分でもちゃんと実行してみること、そして最後には、何も見ずに自分でもコードして実行できるようにすること。
なんとなく通して見て、何も覚えてないということはないようにすること

成功するためのガイドラインも示されていました
1,Q&Aを活用することーこれは、Udemyコンテンツを買った人しか使えないですね
2,前提科目を知っておくこと
3、学んだことを全て実際に実装してみることー重要
 
ということで、次回に続きます

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0