Kaggleのコンペティションリスト(随時更新)

  • 19
    いいね
  • 0
    コメント

1. はじめに

データ解析には解析するターゲットごとにいくつかパターン↓があります。

  • データの型
    • eg. 画像、言語、数値、時系列
  • 学習用データの形態
    • eg. 単純な瞬時データ、ユーザーidに紐づいた過去の履歴、大量の欠損値
  • スコアリング指標
    • eg. Accuracy、Fn measure, Matthews correlation coefficient

こういったパターンごとの、解析のファーストステップや細かいノウハウをkaggleで調べられれば良いなと思い、過去2年分のKaggleコンペをリスト化しました。(ひとまず元々のデータ形式別で分類しています)

*1 コンペ自体は5年以上前から開催されていますが、「Kernels」へアップロードされているコードをすぐに見ることができるのはここ2年分のみとなります。人によってはGithubへ素晴らしいコードをアップし、Discussionでリンクを貼っている人もいます。「Discussion」は2年以上前のコンペでも確認することができるので、発見した場合は別途紹介できればと考えています。
*2 コンペによっては参加メンバーのみにデータを公開していたり、何かしらの条件が原因で極端に参加者が少ない場合があります。こういった場合、ほとんど参考になる情報が載っていないので、このリストから事前に除外しています。

2. 数値データ

3. 画像データ

4. 言語データ、その他