はじめに
この記事は日経xTECHさん主催の「AI道場「Kaggle」への道」アドベントカレンダーの記事です。
遅ればせながらKaggleにこの度入門いたしましたので、こちらにその経緯を書かせて頂きます。
Kaggleとは?
Kaggleとは、
強いデータサイエンティストがしのぎを削って精度向上のために人間性を捨てる場所😭
ではなく、
あるテーマに沿って、参加者みんなで精度を上げていく、知的欲求を満たす場所💪(._.💪)
だと思っています。(まだ参加して1週間くらいなんですけどもね。)
ほんと?って思った方はMNISTとか、いろんなコンペに実際に参加されてみるといいかと思います。
Kaggleってどんなことするの?
コンペティションが開始されると共に、色々な情報がDiscussionに飛んできます。
例えば先日開催された、DeepFakeDetectionChallengeで見てみてもわかる通り、
与えられた難しい問題に対して、何が使えるか早速議論が始まっています。
DFDCコンペは、Test用のFakeVideoが与えられ、それに対してFake-or-Trueを答えると言うコンペです。
例えば、上から2つ目では、「この問題に対するState-of-the-artな論文を集めてきたよ!」と投稿され、
下から2つ目では、「videoに使われてる音って判別に使えないかな?」とか。
積極的に議論され、試してみたけどどうだった。とかって言う議論をここでチェックすることができます。
Kaggleではコンペ中に自分が得た知見を他者に公開する時は、
基本的にDiscussionを通してShareしなければなりません。
なので、ここを見ればわかっている全ての情報が公開されている訳です。
みなさん、メダルが欲しいですから、基本的にわかったことは情報共有していきます。
情報共有したことが評価されてUpvoteされるのも、知的好奇心が刺激されてすごく楽しいです。
Kaggleは全て自分でやる必要はない
Kaggleでは、プログラムもその知見としての価値を持ちます。
どうやってFakeを見破るか、といった知見をKernelとして公開します。
ここで公開されているKernelは、全て再利用が可能で、そのまま使ってSubmitしても大丈夫です。
逆に、自分が機械学習のプログラミングが得意なら、ここで公開して披露することで、Upvoteしてもらえ、
メダルがもらえます。
ここで、あえて言わせていただきましょう。
コンペに勝つだけが、Kaggleではない!
ここがKaggleの面白いところだと思っています。
知見を披露して褒められることは、誰だって嬉しいことでしょう。
だって、相手は日本を限らず世界中のデータサイエンティストなんですから、
なら、参加してみましょうよ!
Kaggleに参加するのに、特別な知識や経験などは要りません。
全て用意してもらえる訳ですから。それでいて強い。って言われるならやるっきゃないでしょ!
注意して欲しいこと🚨
Kaggleはアカウント1人につき1つと限定されています。コンペ成績に支障が出るためです。
なので、下手にアカウント2個作って電話番号をダブらせて登録とかすると、アカウントロックされます。(1敗)
おわりに
ざっくりとした入門記事ですみません。
でもKaggleで参加しようか迷ってるくらいなら一度くらい参加してみませんか?
繰り返しますが、
Kaggleは”競争”ではなく”知的好奇心を刺激しまくってくれる楽しい競技”です
正直競争とか考えてると、leakとかshakeup/downとかで面白みを全く失ってしまう気がします。
(某kiriDSの方々って、競争・闘争・血で血を洗えみたいなイメージを植えつけすぎな気がします。)
Kaggleにある本当の楽しさって、
競争による優越とかキャリアアップの修行とか賞金とかそんな俗っぽい面白さではないと思うんですよ。
自分の知見が広がる楽しさ、思ってもみなかった発見とか、そういう知的なパズルでしかないんです。
なので、
Kaggle、怖いとこじゃないよ!
ってことを伝えたかったです!読んでくださってありがとうございました!