自己紹介
当方は、金融機関に勤務する52歳のものです。
統計解析は若干かじったことがあるものの、このような機械学習による分析、コンペの参加は初めてとなります。(このようなブログ投稿も初めてです。)
備忘録的な内容となりますが、ご容赦願います。
参加まで
社内でのデータ利活用に関する意識を確認することも含め、社内でデータコンペ参加者を募り、第2回金融データ活用チャレンジに参加させていただきました。
(8名と予想より多かった。他社さんはどうなんでしょうか?)
今回は、初心者、初参加でもあり、とにかく投稿することを第一の目標、あわよくば金融機関上位入賞を目標にスタートしました。
「72歳」の師匠には負けていられない
「72歳の化石」と自称する当方の統計学の師匠も巻き込んだのですが、あっという間に抜かれることに。
投稿することができ、ひと段落していたのですが、72歳に負けられないと、ここから、かなり力が入りました。
ハンズオンのおかげ!!
ツールが英語表記であったこともあり、どうしようかと思っていたのですが、ハンズオンが行われ、投稿までの一連の流れを理解できたので、とてもありがたかったです。(何度も見返しました)
おそらく、ハンズオンなしでは途中で挫折していたかもしれません。
中村様、松島様ありがとうございました!!
記念すべき初投稿まで
ハンズオンでの作業結果をそのまま投稿しました。
(まずは第一段階突破、感動!!)
特徴量
難しいことはできないので後回とし、まずは特徴量の生成に取り掛かることにしました。
計算式だけでやっていかなければならないかと思っていたのですが、とにかく機能豊富でした。
ただし、このコンペ期間で多くの機能を理解することができず、その点は残念でした。
使いこなすことができれば可能性はさらに広がったかもしれません。
手作業で州をエリア別に区分したのですが、なんとジオポイントでのエリア作成が可能のようです!!(最終日までに試すことができませせんでしたが)
週末、祝日フラグも簡単!!
機能を使いこなせず
統計学的な分析もしてみたかったのですが、そこまで至ることができませんでした。
スコアが伸びず
特徴量は色々と試してはみたものの、実力不足と機能を使いこなせずが相まって、後半はスコアが全く伸びなくなりました。
オーバーライドを試す
スコア伸びないのでSlackの情報から色々と試してみました。
(皆さんに感謝!!)
アンサンブルを試す
同様に試してみました。
簡単にできて驚きです。
あっという間にコンペ終了
結局、上位に食い込むどころか、師匠を超えられず悔しがっているところでしたが、
最終評価を確認すると・・・。
なぜか400位台から297位に大幅アップ(なぜ?)
最後に
おかげさまで、短い期間でしたが、楽しい時間を過ごさせていただきました。
自分は年を取り年々しんどくなっていますが、自身のレベルアップとともに、何とか、これを機会に社内においてデータの重要性、分析する楽しさを広められたらばと思います。
最後の最後に、
コンペの機会を与えていただいたFDUA、SIGNATEの皆様、さらにツールを提供してただいたDataiku、Databrics、Tableauの皆様、奮起させてもらった「72歳の化石」と自称する師匠に感謝したいと思います。
ありがとうございました。