はじめに
こんにちは!株式会社会社エイアイフィールドに新卒で入社した傍示です。現在はフロントエンドの開発を主に担当させて頂いております。この記事は株式会社エイアイフィールドアドベントカレンダー2021の12日目の記事です。
この記事は8日目の記事で軽く紹介したデータ分析コンペサイトの紹介やコンペサイトを利用した勉強の進め方を紹介します。
1. データ分析コンペサイトに登録しよう!
まずデータ分析コンペサイトに登録と言っても、どのコンペサイトがいいのか分からない方もいらっしゃるかと思います。
そこでKaggleなどの私が登録しているコンペサイトについて個人的な主観を紹介させて頂きます。自分のレベル感や趣向にあったサイト選びの参考になれば幸いです。
1. Kaggle
世界最大級のコンペサイトで約40万人ほどのデータサイエンティスト、機械学習エンジニアが切磋琢磨しているコミュニティとなっています。コンペ中のディスカッションも盛んで、メダルや称号を獲得する事で自分の実力を対外的にアピールすることが可能です。
2. SIGNATE
Kaggleの日本語版として紹介されている日本最大級のコンペサイトです。コンペ以外にも SIGNATE QUESTといったデータサイエンスを学べるコンテンツも充実しており初心者の方にもオススメです。
3. Nishika
データサイエンティスト特化型求人も充実しているコンペサイトです。最近では特許庁とのコラボをしたコンペや開催されていたり、副業の紹介も行っているので、データサイエンス関連の仕事をしてみたい方は登録するメリットがあると思います。
4. ProbSpace
自社主催コンペが中心のサイトで、毎回分かりやすいチュートリアルが付属しているため参加のハードルは他のサイトより低いと思います。またスプラトゥーンやプロ野球などの中々身近で面白い題材を取り扱ったコンペが多い印象です。
2. ディスカッションをもとにコードを提出してみよう
上記のサイトに登録したら、コンペの楽しさを体感するために何らかのコンペに参加して用意されているチュートリアルや他の方が書いたコードを真似て投稿することから始めてみましょう。
上記で紹介したサイトではコンペごとに参加者がコードを共有するページ(Kaggle:Code、SIGNATE:フォーラム、Nishika:ディスカッション、Probspace:トピック)があり、まずはそこのコードをコピーして実行結果を確認してみます。
すると実行結果と自分の順位がすぐに確認する事が出来るので、「コンペに参加した!!」といった実感が湧いてきます。
その次は複数のチュートリアルのコードを組み合わせてみたり、コードの中のパラメータらしき数字を変更してみて精度が変わるかどうか確認してみましょう。
そうした試行錯誤を繰り返していく中で順位の変動や、コードを中身を理解する事が出来るのでデータ分析コンペの楽しさをより実感できるかと思います。
3. コンペに必要な知識を増やそう
コンペを続けていると他の人のチュートリアルを真似るだけでなく、「自分のアイデアを実装してみたい!」、「もっと上位を目指したい!」となってくるかと思います。
そうした方のための勉強の進め方について紹介していきます。
・Kaggle関連の本を読む
コンペに行き詰った際にはKaggle関連の書籍を読んでみましょう。
Kaggleで使えるテクニックや勉強の進め方などを、実際にKaggleで活躍されている方からの視点で学ぶことが出来るのでオススメです。
もちろんKaggle以外のコンペでもこのテクニックは活かせます!
例)
・Kaggleで学ぶデータ分析の技術
・実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
・Kaggle Grandmasterに学ぶ機械学習実践アプローチ
・講座に参加する
データサイエンス関連の講座は様々な企業や団体が開催していますがそういった講座に参加するのもオススメです。データサイエンスの知識が身につくのは勿論ですが、講座専用のコミュニティチャンネルが用意されていることが多く、受講生同士で切磋琢磨しながら課題に取り組むことが出来るので参加する価値は大いにあります。
今回は筆者が参加した中で特に良かった講座をピックアップして挙げさせていただきます。
・AI QUEST
・データサイエンティスト養成講座
・東京大学グローバル消費インテリジェンス寄附講座
おわりに
今回はデータ分析コンペの始め方や学習の進め方について紹介していきました!
個人的にはゲームの順位を上げる感覚で取り組める部分がコンペに参加するモチベーションに繋がっていると感じています。
是非皆さんも、コンペに参加してこの楽しさを味わいながら一緒に切磋琢磨していきましょう!!