10
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

マナビDX Questで得たものAdvent Calendar 2023

Day 21

グループでデータ分析コンペに参加する楽しさについて

Last updated at Posted at 2023-12-20

はじめに

こんにちは。マナビDXクエスト参加者のじんどうです。
(https://dxq.manabi-dx.ipa.go.jp/)

2022年度マナビDXクエストの演習でデータ分析コンペの楽しさを知り、今年の3月くらいからデータ分析コンペに参加するようになりました。
まだまだ初心者ですが、賞品と複数メダルもいただけました。
データ分析コンペに個人で参加したこともありますが、マナビDXクエストで出会った方々とグループで参加することがほとんどです。グループで参加するからこそ得られること、そして何より楽しいと言うことを知っていただきたく、本記事を書きました。

すでにデータ分析コンペに参加されている方、これから参加してみようと考えている方、是非ともグループでの参加をお試しください。

きっかけ

データ分析コンペに参加することになったきっかけは、マナビDXのSlackでmatsuさんがKaggleコンペへの参加を呼び掛けてくれたことです。他にもたくさんの方が手を上げられ、バックグラウンドやライフステージが似ている人同士でグループを組みました。

初戦 【Kaggle】WiDS Datathon 2023

WiDS Datathonは毎年行われるコンペで、女性たちがデータサイエンスのスキルを磨くことを目的としたコンペです。2023年は気象予測がテーマでした。

image.png

女性4人のグループで挑みました。グループを組むまで全く面識がない方々で、お互いの実力も性格も何もわからないまま、探り探りでのスタートでした。全員コンペ参加経験がほとんどなく、でも勉強熱心なメンバーがそろいました。

結果、比較的初心者向けのコンペとのことでしたが・・・。 73位/697
順位はそこそこですが、他の参加者が提供して下さっているソースコードを少し変更することしかできず、悔しさの残る結果となりました。

2戦目 【Kaggle】AMP®-Parkinson's Disease Progression Prediction

リベンジを果たすべく同じメンバーで挑んだのも、またまたKaggleのコンペです。パーキンソン病の症状を予測するコンペでしたが、ルールが難しく、理解するのに一苦労したコンペでした。

image.png

自分で一からコードも書いてみましたが、提供コード以上の精度にはできず、今回も提供コード+α と言ったことろでした。
それでも結果は115位/1805 初のBRONZEメダルもいただけました。

image.png

ただし、メンバー全員これはまぐれの結果だと実感。もう少し初心者向けのコンペで腕を磨くことになりました。

3戦目 【Nishika】生鮮野菜の価格予測 2023春

英語に苦労したこともあり、次は国内の親しみやすい内容のコンペにしました。
これは、気候や過去の価格データなどから、12品目の野菜の価格を予測するコンペです。

image.png

ここからは、参加できなくなったメンバーに代わり、元々のきっかけを作ってくれたmatsuさんにも一緒に入っていただき参加しています。
野菜が12品目もあったので、それぞれで野菜を分担し、野菜毎に何が予測に効きそうかと言ったことを調べました。
野菜によって気候の影響を受けるタイミングや期間も異なります。みんなで情報を共有しながら、「確かに去年の冬はこの野菜が高騰していたけど、こんな理由だったんだねー」なんて話をしながら楽しくコンペを進めました。

ただし、これだけいろいろ調べても気候データは精度向上には全く活かせず。そのもどかしい気持ちを共有できるのもグループ参加の楽しさです。
このころには、それぞれが自走できるようになっていて、SARIMA、LightGBM、CatBoostなどそれぞれが得意なモデルを使って予測値を算出しました。それをアンサンブルすると驚くほど精度が上がりました。
野菜によって時系列モデルが効くもの、決定木系が効くもの、バリデートの時期も1年前の同じ月が良いものもあれば、先月が良いものもあります。いろんな組み合わせを試しました。
結果 3位/100 賞品もゲット しました。Tシャツ、マグカップ、ステッカーなどをいただけ、チームで山分けしました。

image.png

その後もメンバーを加え、いくつかのコンペに参加しています。

【PROBSPACE】 野菜取引価格の予測 6位/113 GOLD
【Nishika】中古マンション価格予測 2023夏の部  15位/127
【PROBSPACE】 タクシー需要予測 20位/109 SILVER

さいごに

グループでデータ分析コンペに参加すると、

  • これをやったら精度が上がったよーとメンバーに自慢ができる
  • ソースコードの書き方や進め方に困った時にアドバイスがもらえる
  • 分担ができる(いろんなことが試せる)
  • そして何よりも、喜びや悔しさを共有できる

尊敬できる人たちと同じ目的に向かって協力することは、仕事でも企業協働でもデータ分析コンペでも、本当に楽しくわくわくすることだと日々感じています。

データ分析コンペ、まだまだ初級者ですが、いつかは賞金が取れるような力をつけていきたいです。
ぜひ、グループでデータ分析コンペ参加してみて下さい!

10
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?