11
16

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

ベンチャーキャピタルで働きながらKaggleをやってみて良かったと思うこと

Posted at

ベンチャーキャピタルとは

ベンチャーキャピタルとは主にスタートアップ企業に投資させて頂き、その企業が成長して上場やM&Aの場合に株式を売却して利益を得る職業です。
日々の業務では、新しいビジネスを起業した経営者の方と、ビジネスプランについて議論させて頂くことが多く、AI、ブロックチェーン、AR/VRなどの新しい技術やこれまでに無いビジネスモデルにアンテナを張って情報収集を行っております。

Kaggle(カグル)とは

Kaggleの概要

Kaggleとは世界最大規模のデータ分析のコンペティションで、多数のAIエンジニアやデータサイエンティストが会員として登録して、データ分析の腕前を競っています。
詳細は下記の記事などをご参考に。
一から始める機械学習(Kaggleで学ぶ機械学習)
Kaggleの始め方などは、下記の記事などで詳しく解説されています。
Kaggle事始め

ルール・概要

Kaggleでは、答えが与えられたトレーニングデータを解析して予測モデルを作成し、そのモデルを用いて答えが伏せられたテストデータの答えを予測し、その予測精度を競うというコンペティションです。
モデルで予測して提出した答えと、実際の値とがどれだけ近いか(予測精度)がスコアとして表示され、スコア順に成績が表示されます。コンペティションの終了時点でのスコアが高い順に表彰されます。
有名な入門編の問題として「タイタニックの生存者予測」というものがあり、タイタニック号の乗客の「年齢」「性別」「船室番号」などのデータから、乗客が生き残ったかどうかを予測するモデル作成が求められます。

やってみた感想

これまでの成績

Kaggleに本格的に取り組み始めたのは、2017年末〜2018年初めに開催された、メルカリの出品価格を予測するコンペティションからです。
Kaggleでは、一つのコンペティションの参加者の上位●%以上に入ると金、銀、銅メダルが付与される仕組みとなっており、
0.2%以上:金メダル
5%以上:銀メダル
10%以上:銅メダル
という設定になっています。また、取ったメダルの個数に応じてステータスも、一般→エキスパート→マスター→グランドマスターとランクアップする仕組みになっています。
私は2018年度中に銅メダルを2つ以上取得して、「エキスパート」のステータスになることを目標として週末はKaggleに取り組み、2018年8月末に終了した「Home Credit」のコンペティションで2つ目の銅メダルを取得でき、エキスパートになる事が出来ました。(Kaggleプロフィール)

ガチ勢の凄さ

私はここ半年は週末に取り組む程度の関わりでしたが、毎日Kaggleに全力をかけて取り組んでいる人は世の中に沢山いらっしゃるようです。Kaggle内のDiscussionと呼ばれる掲示板には、約3ヶ月間のコンペティション終了後にお互いの健闘を讃えるコメントが数多く掲載されます。さながらスポーツのトップアスリートの世界を彷彿とさせます。
下記は直近終了した7000組以上のチーム、個人が参加した「Home Credit」のコンペティション期間終了後の、参加者のスコアボード(得点ランキング)です。
コンテンツ1.png
順位が7000組中で上位1桁に入るようなトップレベルの方々は、数名でチームを組んで参加されていることが多いです。これはチームメンバーで色々な検討を分担しながら効率よく得点を上げて行くためです。
解答提出数を見ると、軒並み200以上の値となっており、それだけ多くの試行錯誤、トライアンドエラーを重ねてこのような高いスコアに至っているという証拠かと思います。

Kaggleをやって良かったと思うこと

Kaggleをやってみて、特にベンチャーキャピタルの業務への貢献という点で良かったと思う点を記載します。

1.投資検討の際のスタートアップ企業の技術の理解に役立った

ベンチャーキャピタルが投資検討させて頂く際に、最近は「AIを用いて〇〇する」サービスが沢山あります。その中でも競争優位性があるサービスかどうかを判断する際に、そのAIが「どのようなデータ」を入力し、「どのようなアルゴリズム」で解析するか、Kaggleのコンペティションで出てきた類似のモデルをイメージする事で、ある程度理解しやすくなります。
「十分なデータが集まるか」「データの入手は困難か」「Kaggleのコンペティションで扱われないような複雑な問題か」などのポイントも、競争優位性の判断の手助けになると感じています。

2.「Kaggleやってる」というと初対面での印象付けが出来る気がする

これはその相手がKaggleを少しでも知っているという前提が必要ですが、Kaggleは「世界最高峰のデータサイエンティストが凌ぎを削る」レベルの高いコンペティションというイメージが一般的にあると思います。私は一応理系ですが、情報学を専攻していた訳でもなく、プログラミングやAI、機械学習の専門家でもない中で、「Kaggleやってます」は、一定のAIに関する知識レベルを保有しているという印象を与える事が出来る気がします。特にベンチャーキャピタルでKaggleやっている人は少ないと思いますので、意外性という点でも効果的に感じます。

3.エンジニア向けのイベントに気兼ねなく参加出来る

イベント、Meetupの募集サイトの中には「エンジニア限定」と銘打っているイベントもあります。これは主催者側が、冷やかしの防止やイベントの盛り上がり、リクルーティングへの連携などを考慮して設定している条件かと思われます。ベンチャーキャピタルで働く人は、世間一般にはエンジニアでは無いので、このような「エンジニア限定」イベントへの参加は躊躇われる事かと思います。しかしこのようなエンジニア限定イベントの方が最新の技術的な情報へのキャッチアップの点では有効な事が多いのも事実かと思います。Kaggleをやっている人は大半はエンジニア、データサイエンティストですので、もし自分がKaggleをやっていれば、マインドセット面でこのようなイベントにも堂々と参加できます(断られる場合は仕方ないですが)。実際に参加して、懇親会でも周りのエンジニアの人の話にもキャッチアップ出来ますし、関係構築も可能です。

最後に

約半年間Kaggleに取り組んでみて、得られた経験は大変有益だったと感じています。
興味がある人は、是非タイタニックの生存者予測の問題だけでもやってみる事をオススメします。何かお手伝い出来ることがあればtwitterまでお気軽にコンタクト下さい。

11
16
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
11
16

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?