はじめに
こんにちは!AMBL株式会社に21卒で入社した傍示です。現在は画像系AIアプリのインフラ周りをを主に担当させて頂いております。この記事はAMBL株式会社 Advent Calendar 2022の4日目の記事です。
この記事では自分が大学時代にデータサイエンティストになる際に勉強した方法や教材などを紹介します!
有料な講座が学生だと無料で受講できたり、そもそも学生じゃないと参加できなイベントなどが結構あったりするので、ぜひ学生のうちにこうしたイベントに沢山参加してデータサイエンスの勉強を効率的に進めて頂ければと思います。
これからデータサイエンティストとして就活を考えている学生さんや自分と同年代の社会人の方にとってちょっとでも参考になれば幸いです。
無料でデータサイエンスを学べる教材に関してはこちらの去年書いたAdvent Calenderの記事もよければご参照ください!
動画教材(Udemy)
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
データ分析コンペサイトで有名なSIGNATEが作った教材。
SIGNATEの練習コンペに投稿しながらpandas,matplotlib、scikit-learnなどのライブラリの使い方や回帰・分類についても基礎的な知識について学ぶことができます。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 中級編 -
機械学習に必要となる微積・線形代数・統計などの数学を手書きで一から分かりやすく説明してくれます。またpythonの基本的な文法についても丁寧に説明してくれるので、pythonやデータサイエンスについて完全な初心者の方はこの教材から始めることをオススメします。
上記2つは自分がデータサイエンスの勉強を始めた時に最初に取り組んだ教材になります。
Udemyのセールの時に購入すれば90%オフ位で購入することができるのでぜひセールのタイミングを狙って購入してみて下さい。
データ分析コンペ
上の動画教材でデータサイエンスの基礎を身に着けた後は、実際にデータサイエンスコンペに参加することをオススメします!
最初はハードルが高く感じると思いますが、他の人のコードやディスカッション内容が沢山投稿されているのでそれを真似するだけで簡単に参加することができます。
また上の動画教材をクリアしていればSIGNATEのコンペには参加できるようになっていると思いますので、ぜひどこからでもいいので自分の興味のあるコンペに挑戦してみるのはどうでしょうか?
下記に主なコンペサイトとコンペをする際にオススメな書籍を添付しておきますので、参考にしてみてください!
おすすめコンペサイト
1. Kaggle
2. SIGNATE
3. Nishika
4. ProbSpace
5. atmaCup
おすすめ書籍
・Kaggleで学ぶデータ分析の技術
・実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
・Kaggle Grandmasterに学ぶ機械学習実践アプローチ
・Kaggleで磨く 機械学習の実践力──実務✕コンペが鍛えたプロの手順
データサイエンス関連の講座を受講する
データサイエンス関連の講座は様々な企業や団体が開催していますがそういった講座に参加するのもオススメです!
データサイエンスに関する知識が増えることは勿論、同じ分野に興味のある人と交流を図ることができるので一人で勉強するのに比べてモチベーションも高く維持しながら続けることができると思います。
また冒頭でも述べましたが、学生限定であったり学生の場合だと受講料が無料になる講座があるので学生のうちにこうした講座に参加してみてください。
オススメ講座
データサイエンティスト養成講座
一般社団法人データサイエンティスト協会が毎年開催している講座です。
kaggle Masterなどの称号を持っている講師の方から、SIGNATEのコンペのデータを利用して実際のコンペで使われているような特徴量エンジニアリングやモデル選定についてなど実践的な内容を学ぶことができます!
こちらの講座ですが一般の方だと受講費が8万円かかりますが学生の場合だとなんと無料で受講することができます。
自分も学生時代に受講しましたが、テーブルコンペに参加する際に今でも利用するような実践的なテクニックについて色々学ぶことができたので本当に満足するのと同時に本当に無料で良かったのかと思うくらいには良い教材です!
マナビDXクエスト (旧 AI Quest)
2019年から経済産業省主催で開催されているデジタル推進人材育成プログラムです!
内容としては実際の事例などをもとに作成された教材を利用して要件定義からデータ分析、企業への提案までを一気通貫で学習できるものになっています。
大きな特徴としてはSlackや専用Wikiなどを活用した受講生同士でディスカッションをしながら課題を進めていく流れとなっており、従来の講師の先生が教えてくれる内容をただ聞くのではなく自分から主体的に進めていく必要があります。
また2020年度から企業協同プロジェクトも開始しており、実際の企業さんとヒアリングを重ねながら課題解決を目指すプログラムも開催されています。
データ分析だけでなくビジネスへの応用までここまで体系的に学べる講座(しかも無料)はないと思いますので今年度の募集は終わっていますがぜひ来年度以降のプログラムに参加することをオススメします!
東京大学松尾研究室の公開講座
日本のディープラーニング研究者として有名な松尾先生が全国の学生を対象として開催している公開講座です。
基本的な機械学習の講座や自然言語処理・強化学習・世界モデルに関する講座など様々な分野の講座が夏休みや冬休みの期間で開催されています。自分が受講したのはグローバル消費インテリジェンス寄附講座(GCI)でしたがpythonの基本的な文法からnumpy、pandas、matplotlibなどのライブラリの使い方、教師あり・教師なし学習についてgoogle colabを使った自分でコードを記述しながら体系的に学ぶことができたので本当に良かったと思っています。
難易度としては高めですが、ディープラーニングに関する最新の技術を無料で学ぶことができるので、今学生でこうした分野に興味のある人はぜひ調べてみてください。
また一部講座については公開されているので自分のような社会人の方はこちらから学習を進めて頂ければと思います!
松尾研究室で公開されている講座
GCIデータサイエンティスト育成講座演習コンテンツ 公開ページ
Deep Learning基礎講座演習コンテンツ 公開ページ
おわりに
今回は特に学生さんに向けてデータサイエンスを勉強する際にオススメの講座を紹介させて頂きました!
こうして改めて調べてみると学生という身分がいかに勉強をする上で恵まれていたかということを感じます。
社会人になっても勉強はできますが、やはり仕事に関わることが多くなってくると思いますので、
自分の興味関心のある分野を好きなだけ勉強できる学生時代は大切にしてほしいなと思います!
もちろん勉強だけでなく、部活や留学、インターンシップなど勉学以外にもこの期間しかできないことが沢山あるので
この記事を読んで下さった方が後悔のない楽しくて充実した学生生活を送ってくださることを祈っています。