一連の流れ[引用元(1)]
①デ―タセットをインポートまたは生成
②データを変換/正規化
③データセットをトレーニングセット、テストセット、検証セットに分割する
④アルゴリズムのパラメータを設定
⑤変数とプレースホルダーを初期化
⑥モデル構造を定義
⑦損失関数を設定
⑧モデルの初期化とトレーニング
⑨モデルを評価
⑩ハイパーパラメーターをチューニング
⑪デプロイと新しい成果指標の予測
##⑤からやってく。
まずプレースホルダと変数の違い。
プレースホルダ:実際の内容を後から挿入するためにとりあえず用意した場所。計算した結果の値とかを入れたい
変数:ある範囲内の数のこと。調べてたらtf.Variablesとかtf.assignとか出てきたからこいつらなんだろう。わかんないから飛ばす。
##⑥モデル構造を定義
難しいこと言っているけど計算グラフを作るために足したり掛けたりすること。この定義されたモデルってやつにさっきの変数とかプレースホルダーを入れてこねくりまわす。
##⑦損失関数を設定
損失関数は機械学習させた結果が実際に予測させたかった値にどれだけ近いかを示す関数。さまざまな種類の損失関数がある。
##⑧モデルの初期化とトレーニング
変数の作成や損失関数など必要な材料がそろったらあとは実行。初期化してリセットしてからやる。計算グラフとかの初期化も行う。トレーニングの所で機械学習が行われる
##⑨モデルを評価
ようやく実行させた。その結果がどれだけ精度が良かったか確認する。それがうまくいってなかったらどうしてうまくいかなかったのかを考え、次のステップに移る。
##⑩ハイパーパラメーターをチューニング
設定した値④に何か変更点があったかを検証する。そしてまた異なる値に設定したのち再度モデルを評価⑩させる
##⑪デプロイと新しい成果指標の予測
全てが終わった後それから読み取れたデータ、結果をもとに次の予測を考えていく。①に戻る
(1):「Pythonベースの活用レシピ60+ TensorFlow 機械学習クックブック 2017年」p3-5