Reinforcement LearningのUdemyコンテンツをやっていく(1) #強化学習

Reinforcement LearningのUdemyコンテンツの勉強を始めました。

個人的に、機械学習を利用したセキュリティのソリューションを作りたくて、Pythonを使った強化学習の勉強を開始したいと思います。
教科書は、以下のものを使います。

「Advanced AI: Deep Reinforcement Learning in Python」
https://www.udemy.com/deep-reinforcement-learning-in-python/

何かあれば、マサカリ、質問など投げていただけたらと思います。

Introduction and Outline

深層学習と強化学習の組み合わせ→ALphaGo、自動運転自動車、人間を超えたテレビゲームの試合
７０年代から開発されてたけど、最近すごいらしい
深層強化学習！！
強化学習は教師あり学習、教師なし学習とは違うよ
技術的には、エージェントがデータと相互作用するんだけど、逐次的で、もっと相互作用的だよ。
教師あり学習や教師なし学習を退屈なものにするよ

多大な潜在能力があって、多大なリスクがあるよ
経済の安定性や、我々の存在そのものに多大なリスクがあるお（ターミネーター！？）
AIは人間みたいには考えないよ

OpenAI使うみたい

基礎をやっていったら、OpenAI Gym環境をやっていくよ
Open AI Gymって、シンプルな標準的UIを全ての環境で準備しているので、UIを勉強するだけだよ

Cart-Pole
カートに乗ったポールを可能な限りバランスしていくゲーム
Mountain Car
車を山のてっぺんまでおしあげる必要があるんだけど、直接登る力はなくて、反動を使う必要がある

Boston Dynamicsのロボットが例として出てた

テクニック

前のコース：Marcov Decision Process
Dynamic Programming
Monte Carlo
Temporal Difference Learning
の三つが重要らしい

RBFネットワークが強化学習では使われるらしい
Deep Q-Learning

どこでコードをゲットするか

以下のリポジトリでコードをゲットできます。

OpenAI Gymをインストールするには以下のようにします

sudo pip install gym

pipがインストールされてなかったので、以下のサイトを参考にインストール

注意事項としては、「ちゃんとコードしようね！」ということが挙げられていました。講義の中で実行されているコードを自分でもちゃんと実行してみること、そして最後には、何も見ずに自分でもコードして実行できるようにすること。
なんとなく通して見て、何も覚えてないということはないようにすること

成功するためのガイドラインも示されていました
1,Q&Aを活用することーこれは、Udemyコンテンツを買った人しか使えないですね
2,前提科目を知っておくこと
３、学んだことを全て実際に実装してみることー重要
　
ということで、次回に続きます