はじめに
こんにちは
機械学習のコンペサイトとして有名なものにKaggleがあります.
Titanicのコンペが機械学習のチュートリアルとして有名で、やったことがある方も多いかもしれません.
https://www.kaggle.com/c/titanic
これを理解したらもう十分!
・・・とはならないと思います.
(この状態だった時代もあったと思います.ブログやQiitaで知見を充実してくださった先人の方々には本当に頭が下がる思いです)
そこで難易度が低く腕ならしにちょうど良いコンペがないかなーと探していたら良いコンペがあったので紹介します.
Kaggle Tabular Playgroud Series
結論ですが2021年から始まったTabular Playground Seriesがとてもおすすめです.
https://www.kaggle.com/c/tabular-playground-series-mar-2021
このコンペは以下の特徴があります.
- データがテーブルデータ形式
- データ量がそこそこ大きい(100MB程度)
- 毎月新データで開催されるコンペ
個人的には特に一番下が強いと思っています.
Titanicって問題として有名になりすぎてしまっているので
検索すると似たことやってる人が多くてあまり試行錯誤しなくても精度が出てしまうんですよね...
またTitanicはテーブルコンペにしてはテーブルのデータ量やカラム数が少なく、実際のコンペと乖離しているという部分もあります.
このコンペならほどほどのデータ量で手探りしながら解いていくことになり、
コンペの期間としても長すぎず短すぎずで良いのでは?と思っています.
また画像分類や自然言語処理でなく、テーブルデータ形式なのでTitanicと同じテクニックで解けるというのもあります.
初心者なら過去のコンペのカーネル見て勉強しろというのがごもっともな意見だと思います.
しかしコンペ出たほうがテンションが上がると思うのでテンションが上がる方を選択しましょう
ちなみにこのコンペは賞金やメダルこそ出ませんが1~3位にはKaggle merchandise(おそらくTシャツとかマグカップとかシールとか)がでるそうです.
Kaggle以外の初心者向け機械学習コンペ
Kaggleとタイトルに書きましたがKaggle以外のコンペサイトでも初心者向けコンペを見つけたのでついでに紹介します.
SIGNATE Beggner限定コンペ
こちらは日本のサイトで株式会社SIGNATEが主催するコンペです.
https://signate.jp/competitions/414
ユーザの称号がBegginerの場合のみ参加できるコンペです.
注意点としてはKaggleのようなJupyter Notebookの環境は用意されていないので
Google Colabなりローカルに開発環境を作るなりで環境を整える必要があります.
こちらも毎月開催されています
賞品などはありませんが、上位60%に入るとBegginerの一つ上の称号であるIntermidiateがもらえるそうです.
atmaCup
こちらも日本のコンペでatma株式会社が主催するコンペです.
~~https://atma.connpass.com/event/204364/~~
追記: コンペは終了しました.次回コンペを待ちましょう.
今回のディスカッションは初心者必見です.見ましょう.
毎回初心者向けの講座を開催しているそうなのでとっつきやすいと思います.
注意点としてはSIGNATEと同じく環境は自分で整えるということと1~2週間のオンサイトのコンペだということです.
(ただ時節柄現在はすべてオンラインです)
そしてコンペ後には振り返り会が開催されています.
こちらは定期的に開催されているようです.
上記URLのコンペは今週開催されるコンペです.登録しましょう.
追記: コンペは終了しました
入賞者には物理メダルがもらえるそうです.
終わりに
さて、3月のTabular Playground Seriesが始まっています.
本日は機械学習を学び始めるにはちょうど良い日ではないでしょうか?
それでは良い機械学習ライフを!