###Tensorflowの実装演習
TensolFlow
最も使われることが多く、Googleが作成
・セッションをランしていない段階ではTensorが定義されているだけのため、printだけでは中身は見えないことに注意
→sess.runで中身が分かる
・プレースホルダー
→箱のようなものになっていて、後程、値を入力できる
###強化学習
→長期的に報酬を最大化できる仕組みを考えていく
強化学習と通常の教師あり、教師なし学習との違い
→教師なし、あり学習では、データに含まれるパターンを見つけ出す
およびそのデータから予測することが目標
→強化学習では、優れた方策を見つけることが目標
・行動価値関数と状態価値関数
ある状態の価値に注目する場合は、状態価値関数
状態と価値を組み合わせた価値に注目する場合は、行動価値関数