初心者
データ分析
データサイエンス
文系

文系パッケージエンジニアが3ヶ月で統計学入門してみた

ひょんなことから統計・機械学習に入門した文系エンジニアの記録。

自分のスペック

文系で新卒でSierに入社、3年目。扱っているものは主にSalesforceの開発。
統計は大学で勉強したが分散の定義すらあやうく、機械学習はほぼ触ったことがない。
数学は数ⅡBまで学習したが、大学ではまったく触れず、「行列?」といったレベルです。

ことの発端

3年目になり、徐々にコードを書くことも減り、設計書を更新する日々に。
コードを書ける・自分で手を動かしていく案件がないかと上司に相談したところ、
「統計を使った案件がいいのでは?」アドバイスを受け、勉強することを決意しました。

取組んだ期間

6月〜8月の3ヶ月間。

ゴールの確認

案件へのアサイン面談のときに、「自分少しは統計できまっせ」と自信を持って言えるレベルになる。(すごい曖昧ですね。。。)
具体的には、以下の2点を目標としました。
・文系学部レベルの統計の一つの基準である(と思っている)統計的推定の話についていける。
・実際の統計を使用した案件でどのような流れでプロジェクトが進めるか具体的なイメージを持って説明できる。

主にやったこと

まずは上記目標のうち、統計の目標を達成するため家にあった大学時代の統計の本を見返しました。
微分・積分。。。う、頭が。。。。
数学に再入門する必要性を覚え、まずは数学を勉強することに。

微分積分再入門

期間:1.5ヶ月
いろいろ微分積分の本を見た結果、以下の本で勉強。
以下の本にしたポイントは以下2点です。
・途中式の省略がなく、わかりやすい。
・演習が多い。

スバラシク実力がつくと評判の大学基礎数学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!
スバラシク実力がつくと評判の微分積分キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

統計再入門

期間:1ヶ月
では、統計に改めて入門。
大学時代に使っていた教科書でもいいのですが、前述の2冊が結構良く、せっかくなのでマセマの統計本にしてみました。
スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!
上記の本は安定のマセマクオリティで途中式もしっかり書いてあり数学的にはわかりやすい内容でしたが、数学的内容に寄りすぎており、少し不安もあったので定番と言われている本を買って手元においておくことにしました。
統計学入門 (基礎統計学Ⅰ)

実際の案件でどのように統計が使用されているかのイメージ作り

自分がイメージしていた「統計を用いた案件」は既存のデータをもとに将来のデータの動きを予測するといったものです。学習を進めていくうちにどうもそれは「統計」というよりかは「機械学習」寄りのことではないかと考えました。
参考:「統計学と機械学習の違い」はどう論じたら良いのか

機械学習が実際のビジネスでどのように使われているかのイメージづくりに読んだのが下記の本。
Machine Learning実践の極意 機械学習システム構築の勘所をつかむ!

こちらは数学的側面にはあまり踏み込まずデータの取得からモデルの評価・改善まででどのような作業が必要かをわかりやすく解説してくれておりイメージ作りに役立ちました。

反省・良かった点

反省

目標が曖昧過ぎた

スタート時点での何を学びたいか、何をできるようになりたいかのイメージが曖昧過ぎた。
最終ゴールが社内の案件にアサインされることだったので社内の案件に関してどのような知識が必要かヒアリングを進めてから学習をスタートすべきであった。

良かった点

意外と数学楽しいに気づけた

長らく数学から離れていたため最初は苦戦しましたが大学学部レベルの数学も腰を据えてやってみると意外と楽しく勉強できました。数式への苦手意識が薄れました。

今後の展望

機械学習関連の知識を身に着けて行こうと思います。
ツール周りの知識は案件で使用されているツールに依存するので汎用性のある、機械学習の数学的な側面を学習していきたいです。