「Kaggle Advent Calendar 2024」の 13日目の記事です。
はじめに
Kaggleは世界規模のデータサイエンスコンペティションに参加できるプラットフォームです。Kaggleをやるようになって1年弱ほどですが、楽しくもがいているような感覚を持っています。
私と同じようにKaggle興味ある・頑張りたいなと思っている方の参考になればうれしいと思い、体験談の1つとしてこちらの記事に残します。
こんな方のお役に立てれば幸いです
- Kaggleに興味がある、始めてみたい
- タイタニックからなかなか次に進めない
- Kaggleコンペで勝ちたいけど勝てない方
まとめると昔の自分が読みたい記事を書きました!
自己紹介
私のKaggle歴は1年弱です。
(Kaggleに出会ったのは6年ほど前で、取り組むようになるまでの話はまた別の話。)
- 2024/2 タイタニック
- 2024/5 アワビの年齢予測 (Playground)
- 2024/6 Home credit
個人的なKaggleの楽しみ方
「初心者はまずタイタニックをやろう」とよく耳にしますが、私も次の一手に悩んでいました。
そういうときは先人の知恵をお借りすればよくて、こんな記事があります。
まとめると、「タイタニックをきちんとやって、その後Playgroundコンペを挟んで、本番に挑もう」って感じのようです。私もご多分に漏れずこの流れに乗っています。
とはいえ、タイタニックやPlaygroundでは上位10%以内になんとか入れたものの、開催中のコンペにはまた異なるハードルがあり苦戦しています。"ハードル"にはいくつもの種類がありますが、やっていれば乗り越えられると信じて、その間を楽しむ方法を考えました。
- Notebook expertを目指してみる
- 気になるコンペに参加して、丁寧に復習する
Notebook expertを目指してみる
KaggleではCompetitionが最大の魅力だと思っていますが、それ以外の魅力もあります。
そう、Notebookです。
Notebooks Expertとは
自分で書いたコードを公開し、一定以上の「いいね!」がもらえるとメダルが獲得できまして、そのメダルを5つ集めるとNotebooks Expertになれます。
これはコンペに参加していればコードは当然書きますし、それを公開するだけで自分がやった実績として残ります。
また実際に投稿してみると、今まで使っていなかったKaggleの機能を使うようになったり、どんなNotebookが伸びやすいのか(つまり伸びているだけでコンペで勝つために有益とは言い難いものがあるかも?とか)といった視点に気が付けます。
(筆者はコンペメダルを持っていません笑)
丁寧に復習しよう
私はHome creditでかなり時間を使って参加しましたが、最終的にはメダル圏外になってしまいました。
残念でしたが、コンペ終わってから真のはじまりなのかもしれません。
↑アーカイブは非公開のようです。
私はKagglerが喋っているのをこちらのイベントで初めて目にしたのですが、「復習をきちんとやったほうが良い」と言われていたのが印象にすごく残っています。
復習には、自分がどんなことを考えて、どんなコードを書いたのかの日記や記録が残っていると便利でした。
コンペの終了後には、上位解法が公開されたり、そのまとめが公開されたりします。
もちろん、まとめ記事を読んでみるのは重要ですが、それ以上に自分の環境で写経してLate submitするのが最強だと思っています。
最後に
私は亀のようなスピードで少しずつKaggleを楽しんでいます!
他の方も楽しんでKaggle生活を送れますように!