(1).やったこと
①.データ分析の大体の流れの概要のおさらい
―――――
(1).課題の設定
(2).データの取得
(3).環境構築
(4).データの理解・可視化
①.必要なライブラリのインポート
②.取得したデータを読みこむコードを作成
③.データの確認
今回は追及しないが、恐らくここにいろいろな手法がある。
④.使用するデータの特徴の確認
今回は追及しないが、恐らくここにいろいろな手法がある。
(5).データの加工・前処理
①.データフレームから不要なカラムを削除
②.データの補完
今回は追及しないが、ここだけで独立しておさらいすべきなくらい多くの流れが
ある。
③.学習データを説明変数と目的変数に分割
(6).モデルの作成
①.使うモデルを準備する。
②.モデルのインスタンスを作成する。
「モデルのインスタンスを作成する」の意味を理解はしてない。
③.モデルのパラメータを設定する。
(7).モデルの評価
①.学習データを学習用と評価用に分割
②.分割後の学習用データを使ってモデルを作成
③.分割後の評価用のデータを使ってモデルを作成
※モデルの評価自体に、恐らく精度を上げるための手法がいろいろある。
―――――
②.次の学習の方針の確認
・やること
データサイエンスの基礎学習を行う。
テキストは『東京大学のデータサイエンティスト育成講座』を使用。
・注意点
やるべきことは、データサイエンス基礎にどんな項目があるかを把握すること。
どこに何が書いてあるかをざっくり抑えれば、実践の際に見直せるので、まずはそ
れを第一目標とする。
なので、内容の把握は丁寧にやってよい。
理解のための深堀はいったん保留。
(2).気づいたこと・学んだこと・疑問