この記事はAcademiX Advent Calendar 2022 5日目の記事です。
はじめに
情報系の学科に在籍中の学生です。
機械学習コンペの実績はsignateブロンズ×2のみのまだまだな学生です。
今回は、今年参加したコンペについて振り返ります。
今年参加したコンペ
今年参加したコンペは以下の三つです。
-
SIGNATE Student Cup 2022
https://signate.jp/competitions/735 -
MUFG Data Science Champion Ship
https://signate.jp/competitions/754 -
Feedback Prize - English Language Learning
https://www.kaggle.com/competitions/feedback-prize-english-language-learning
SIGNATE Student Cup 2022
とあるきっかけからしっかりとコンペに取り組もうと決心し、ちょうどよくsigntateで学生限定コンペが開催されていたので、
「これはメダル取らなければ...」と思い参加しました。
このコンペは求人情報を用いた職種判別だったのですが、結果銅圏でした。
良かった点 としては、
- 目標であったメダルを獲得できたこと
- 久しぶりにコンペに参加し、知識を大雑把に取り戻せたこと
反省点 としては、
- アイデアを試すための技術がまだ足りないこと(transformerの理解が足りない)
- そもそもどういった工夫・改良をしていいのかわからないこと
でした。
上位入賞者の解法を見ていると、ベースは変わらずに大量のモデルをアンサンブルしたり、大規模モデルを使用していたりと力技が多かったので、ハイスペックマシンが欲しいなと感じたコンペでした。
MUFG Data Science Champion
上記のコンペが終わってすぐに同じく学生限定コンペが開催されたので参加しました。
このコンペの意気込みとしては、前回銅までしか行けなかったため、銀以上をとることでした。
結果は前回同様に、銅圏でした...
良かった点 としては、
- メモリを効率よく使用するための方法を理解できたこと。
- 自然言語データの有効さまざまな前処理の種類を知れたこと
反省点 としては、
- 提出数が少なかったこと
- 結果の管理がごちゃごちゃになってしまい、自分が試した内容が途中で分からなくなってしまったこと
Feedback Prize - English Language Learning
kaggleにもそろそろ出たいと思っていたところで自然言語処理のコンペがあったので参加しました。
こちらのコンペははじめてチームで参加しました。
良かった点 としては、
- チームで参加することの楽しさ・難しさを知れたこと
- discussionで銀メダルを取れたこと
- bertの理解が深まったこと(チームの皆様ありがとうございました!)
- GCPを使えるようになったこと
- GPUスペックの違いを知れたこと(GCPで調子に乗ってA100を使用してみると、4時間くらいかかっていた処理が1時間くらいで終わって、GPUスペックって大事なんだ...と思いました。費用はぼちぼちかかりますが...)
反省点 としては、
- チーム参加の利点を生かしきれなかったこと
- 提出回数が少ないこと
来年の目標
- kaggleでexpertになる
- 参加するコンペの試行回数と提出回数を増やす
ここまで読んでいただきありがとうございました。