学習記録(17日目)
勉強開始:12/7(土)〜
教材等:
・大重美幸『詳細! Python3 入門ノート』(ソーテック社、2017年):12/19(木)読了
・Progate Python講座(全5コース):12/21(土)終了
・Andreas C. Müller、Sarah Guido『(邦題)Pythonではじめる機械学習』(オライリージャパン、2017年):12月23日(土)読了
Kaggle
参加コンペ:Real or Not? NLP with Disaster Tweets 12/24(火)〜
・色々と勘違いしていたようで、昨日まで抱えていた問題(引数に2値が取れないなど)は解決
・しかし、SVCやxgboostで学習してもscoreが0.5付近となる問題が発生。
課題は0か1かの分類なので、つまるところ正しい学習ができていない模様。
・ベクトル化と学習データ・テストデータの分割はできているので、再度モデルが正しいかどうかの見直しを実施中(現在進行形)
・自分が理解している機械学習の流れ
各種モジュールインポート → データの読み込み → 前処理(データ処理、分割/x_train, y_train, x_test, y_test など) → モデル作成 → モデルによる学習(x_trainとy_trainをfit) → 予測モデルの作成(fitしたものを使ってx_testをpredict) → 評価(predictと、答え部分に該当するy_testを組み合わせる。) → 結果に応じて各種工程の見直しとパラメータのチューニング。スタッキングをするなら必要な各種学習モデル分を実装する。