※自分用奮闘記メモです。
【きっかけ】
年末に「仕事こんな感じでええんやろか」と思い、
「何か新しいおもろいことはじめたいな」となり、
「そうやデータサイエンスよさそうやん」となる。
【現状のレベル】
今でもテーブルデータの扱いしか分からない。。
テーブルデータコンペ出たらそこそこいいとこいける
【どやって勉強した】
①とにかく「毎月1個資格を取る」と目標を定め勉強(半年前)
「ほーん、なるほどデータサイエンスの領域ってこんな感じなんやな」
と雰囲気をつかみ、基礎力を付けられた。5つくらい資格は取得。
②途中からPython1本で勉強することを決め、「動画見る・書籍読む・手を動かす」(3か月前)
SQLとの両立は挫折。結果的によかったかも。
重要なことは、
◆動くコードを書いてアウトプットたくさんすること
◆エラーになったら、根性見せてググって解決すること
◆コードの管理を疎かにしない
③コンペ出場前練習(2か月前)
Tytanicで練習(分類)
House Priceで練習(回帰)
回帰と分類の両方を経験。
重要なことは、
◆コピペでいいんだけど、
◆1個でいいから自分なりの工夫ポイントを作る
④コンペ本出場(1か月半前)
自分が楽しそうと思うコンペを選ぶ
重要なことは、
◆サブミットできない、と諦めない
◆精度がよくならない、と諦めない
◆先人のコードをめちゃくちゃ頑張って読む
【お世話になった書籍・動画】
Udemyに上がっている動画はほぼすべて視聴
書籍もほぼ目に留まったものはほぼ読んだけど、実際に繰り返し読むのは「読みやすい」書籍だけ
※有名な専門的な書籍も買ったけど理解できない。我慢できない。
【コンペってこういうことか】
①ベースモデルをまずはとにかく作り
②特徴量エンジニアリング頑張り
③パラメータいじいじ
…たぶんこういうことじゃない。
楽しくもあり、地味でもあり、まあ結論めちゃくちゃはまった。
【2度と会いたくない骨の折れたトラブル】
突然Jupyter Notebookが激重になる。
ググると結構陥っている人もいることを発見。
理由は、たくさんあるみたいで、その分解決するのも結構骨が折れるみたい。。
私の場合はおそらく、pip installがうまくいかなかったことによる不具合だったようです。
もう2度となってほしくない。
【所感】
数ヶ月でも成長感あって勉強楽しい。