今回はsignateの学生コンペにチームで参加した感想を書いていこうと思います。
参加したコンペ
Signate Student Cup2022に3人のチームで参加しました。
コンペのリンク
コンペ内容
海外求人情報のテキストデータを使って職種判別するアルゴリズムの構築。
テキストデータを元に四種類の職種に属するか判定する感じです。(1. data scientist 2. ML Engineer 3. Software Engineer 4. Consultant)
BERTとかWord2Vecなどを使ってモデル構築してアンサンブル学習させて提出しました。
課題
- スコアデータが少なくてなかなか精度上がらなかった。
- 学習のデータ数が少ない
大体これらが原因で精度向上妨げてた
あと
- チームメイトのファイル管理が絶望的
初コンペの感想
なんだ、コンペってこんな簡単なんだ。
って言えるような優秀な人間ならよかったな笑
まず最初に、自然言語処理は勉強したことのない分野でめちゃめちゃ面白かった。文字をベクトル化したりそれの合計で平均とって判定したりと面白い技術で溢れてるなと。
コンペ自体の感想としては、コンペの流れとかはわかるけどモデルの実装の仕方とか自分でコードを書き上げていくコード力が圧倒的に足りないって感じたな。チームメイトがかなりフォローしてくれた部分もあって結果的には銀メダルはいけそうだけど、結果以上に今の自分に足りないものを見つけられた気がする。多分1人でコンペ挑んでたら挫折してやめてたと思う。優秀なチームメイトには頭がありません。
次回目標
次は今回の経験をもとに別の初心者向けのコンペ1人で挑んでみようと思う。
今気になってるのはNishikaの不動産コンペ、個人的に不動産好きだからあり・・・
https://www.nishika.com/competitions/34/summary