LoginSignup
0
0

More than 3 years have passed since last update.

レポート(深層学習) 後半後編

Last updated at Posted at 2020-01-10

Tensorflowの実装演習

TensolFlow
最も使われることが多く、Googleが作成

・セッションをランしていない段階ではTensorが定義されているだけのため、printだけでは中身は見えないことに注意
→sess.runで中身が分かる
image.png

・プレースホルダー
→箱のようなものになっていて、後程、値を入力できる

image.png

image.png

強化学習

→長期的に報酬を最大化できる仕組みを考えていく

強化学習と通常の教師あり、教師なし学習との違い
→教師なし、あり学習では、データに含まれるパターンを見つけ出す
およびそのデータから予測することが目標
→強化学習では、優れた方策を見つけることが目標

・行動価値関数と状態価値関数
ある状態の価値に注目する場合は、状態価値関数
状態と価値を組み合わせた価値に注目する場合は、行動価値関数

0
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0