Reinforcement LearningのUdemyコンテンツの勉強を始めました。
個人的に、機械学習を利用したセキュリティのソリューションを作りたくて、Pythonを使った強化学習の勉強を開始したいと思います。
教科書は、以下のものを使います。
「Advanced AI: Deep Reinforcement Learning in Python」
https://www.udemy.com/deep-reinforcement-learning-in-python/
何かあれば、マサカリ、質問など投げていただけたらと思います。
Introduction and Outline
深層学習と強化学習の組み合わせ→ALphaGo、自動運転自動車、人間を超えたテレビゲームの試合
70年代から開発されてたけど、最近すごいらしい
深層強化学習!!
強化学習は教師あり学習、教師なし学習とは違うよ
技術的には、エージェントがデータと相互作用するんだけど、逐次的で、もっと相互作用的だよ。
教師あり学習や教師なし学習を退屈なものにするよ
多大な潜在能力があって、多大なリスクがあるよ
経済の安定性や、我々の存在そのものに多大なリスクがあるお(ターミネーター!?)
AIは人間みたいには考えないよ
OpenAI使うみたい
基礎をやっていったら、OpenAI Gym環境をやっていくよ
Open AI Gymって、シンプルな標準的UIを全ての環境で準備しているので、UIを勉強するだけだよ
Cart-Pole
カートに乗ったポールを可能な限りバランスしていくゲーム
Mountain Car
車を山のてっぺんまでおしあげる必要があるんだけど、直接登る力はなくて、反動を使う必要がある
Boston Dynamicsのロボットが例として出てた
テクニック
前のコース:Marcov Decision Process
Dynamic Programming
Monte Carlo
Temporal Difference Learning
の三つが重要らしい
RBFネットワークが強化学習では使われるらしい
Deep Q-Learning
どこでコードをゲットするか
以下のリポジトリでコードをゲットできます。
OpenAI Gymをインストールするには以下のようにします
sudo pip install gym
pipがインストールされてなかったので、以下のサイトを参考にインストール
注意事項としては、「ちゃんとコードしようね!」ということが挙げられていました。講義の中で実行されているコードを自分でもちゃんと実行してみること、そして最後には、何も見ずに自分でもコードして実行できるようにすること。
なんとなく通して見て、何も覚えてないということはないようにすること
成功するためのガイドラインも示されていました
1,Q&Aを活用することーこれは、Udemyコンテンツを買った人しか使えないですね
2,前提科目を知っておくこと
3、学んだことを全て実際に実装してみることー重要
ということで、次回に続きます