はじめに
初めましてluddite^です。KaiRAアドベントカレンダーの15日目の記事として、先日kaggleの音声認識コンペ「Bengali.AI Speech Recognition」で賞金を獲得し、その際winners callを受けたため、その流れを書きたいと思います。
目次
winners callとは
kaggleはデータ分析・機械学習の世界的なコンペティションプラットフォームであり、世界中のデータサイエンティストがコンペに参加して予測精度を競います。いくつかのコンペでは上位入賞で賞金を獲得することができ、賞金獲得チームは後日winners callを受けることになります。名前的に電話で賞金獲得を祝ってくれるみたいな楽しげなイベントを想定しますが、そんなわけもなく、コンペのホストに対してwebミーティングで自身の解法のプレゼンテーションを行うという非常に面倒な光栄なイベントです。
kaggleで賞金を獲得したことがある人は少なく、ネット上にもwinners callに関する情報があまりないため、後世のために私の体験を残しておこうと思います。
winners call当日までの流れ
2023年10月17日:
コンペ終了。
2023年10月20日:
順位確定。
コンペホストからメールが来て、2週間以内に以下のことが求められる。
解法とリーダーボードのスコアを再現できるコードの共有。
⇒discussionで解法を書く。学習のワークフローとコードをgithubで1つのリポジトリにまとめて公開する。
kaggleのteamタブからモデルの提出。
⇒提出ファイルの容量上限的にモデルの重みを提出できないため、上記のリポジトリをzipファイルにしてそれを提出する。
competition close formというgoogle formの提出。
⇒名前や住所、payoneerのアカウント、賞金の分割法、winners callに応じられない日程を記入する。payoneerは海外送金を受けるためのサービスで、アカウントの作成時に免許証かパスポート(マイナンバーカードは不可)の写しが求められることがある。コンペ終了1週間前位にどちらも持っていない場合は、急いでパスポートを発行しに行く。
2023年11月23日:
コンペホストからwinners callに関するメールが来る。
⇒20分程度の発表スライドを作成する。winners callの日程候補が2つ与えられたため、どちらがよいか選択する(交渉の余地あり)。前日までに作成したスライドをホストに送る。
winners call当日の流れ
2023年12月5日午前9時に開催されたwinners callには、コンペホスト2名、Kaggle職員1名、私たちのチーム3名、及び2位のチームから1名の合計7名が参加しました。イベントはコンペホストの自己紹介で始まり、2位チームのプレゼンテーション、続いて私たちのプレゼンテーションと質疑応答が行われました。交流は全て英語で行われるため、質疑応答に不安がある場合は事前にメールで質問を送ることをお勧めします。運が良ければ事前に回答が得られますが、運が悪いと返信がないか、当日まったく異なる質問が投げられることがあります。
参考までに、私たちが受けた質問は以下の通りです。「デノイズ処理に特殊なワークフローを用いた理由は何か」、「デノイズの効果の程度はどうか」、「解法で最も計算コストが高い部分はどこか」、「より高性能な計算機を使用できる場合の改善策は何か」、「リアルタイム推論は可能か」、「さらなるデータ収集が必要な場合、どのようなデータがどれだけ必要か」などです。
最後には、質疑応答とは別に広報用のQ&Aセッションがあり、これに回答してイベントは終了しました。
終わりに
kaggleで賞金獲得した際の流れについて説明しました。英語でプレゼンテーションと聞くとすごいハードルが高いように思いますが、実際にやってみると大したことないことに気づきます。「賞金をとった」というとkaggleを知らない人にも実力を示しやすく、対外的にもウケがいいので、ぜひメダルだけでなく賞金も狙ってみてください。
皆様、よきkaggleライフを~