1年3ヶ月会社員SESを経て、5ヶ月間フリーランスをしている私の経験から、機械学習エンジニアのなり方をまとめます。
目次
エンジニアになるまでのロードマップ
機械学習エンジニアの仕事内容
どんな勉強をすればいいか
エンジニアになるまでのロードマップ
理想的なロードマップを書きました。
とはいえ、ここまでできるひとは少ないと思います。
私はpytho基礎と機械学習の基本モデルが作れるくらいで拾ってもらいました。
-pythonの基礎を学ぶ
python基礎:https://prog-8.com/
まずはこちらで基礎を10時間
pandas:https://qiita.com/kunishou/items/bd5fad9a334f4f5be51c
pandasというライブラリを10時間
これをやってみて楽しいと思えるならかなりプログラマーの素質があります。
-簡単な練習問題でモデルを作る
lightGBM:https://qiita.com/sey323/items/a5b70943005d15771981
lightGBMは、大会でもよく使われる万能モデルです。
試してみたい分析があればこちらを試してみるのがおすすめ。
-練習問題で作ったモデルについてプレゼン資料を作る
説明するスキルはすぐに求められるので、就活の段階からアピールできたら高得点です。
-過去の機械学習コンペで少し難しい課題に挑戦する
-コンペで共有されているナレッジから他の人のやり方を学ぶ
-コンペでの作成モデルでプレゼン資料を作成する
-企業との面接でこれらをアピールする
勉強するのにはgoogle-colabが便利!
環境構築などせずに使えます。
https://colab.research.google.com/?hl=ja
機械学習エンジニアの仕事内容
メジャーなところを紹介します。
・機械学習モデルの作成
王道の仕事。作成自体は難しくないので、初心者でもアサインされる。
automlとか環境が整っていればさらに楽。
精度向上とかモデル評価は経験が必要なので、高難易度。ここはPLがやります。
・PoC
企画案がうまくいくか短い期間で確かめる仕事。
・データ分析
アンケート分析が多い印象
・自動化
例えば、機械学習の結果をエクセルでまとめてクライアントに渡すのでそれを自動化をする。
どんな勉強をすればいいか
pythonで以下のライブラリが扱えればSESの採用には引っかかると思います。
・pandas
データフレーム(エクセルの表のようなもの)を扱うライブラリ。
pythonでエクセル的な操作を便利に行うためのもの。
・matplotlib
可視化のライブラリ。
機械学習モデルやPoCの結果報告や、データ分析業務で多く使う。
他にもSeaborn, plotlyなど色々なライブラリがある。
・各モデルのライブラリ
基本的な10個くらいのライブラリは触ってみるといい。
まずはlightGBMから。
scikitlearnなどの前処理ライブラリもここで学べる。
就活の時のtips
・linux
使えるかよく聞かれるところですが、現場に行かないと習得が難しい。
基本的なコマンド10種類くらいを覚えて、”一応できます”にしとくのがベター。
環境構築やDockerを使う時に必要になるが、必要になってから覚えればいい。
・SQL
機械学習前にデータを持ち出すのに使う。
これも環境を作るのが面倒でとっつきづらい。
bigqueryで勉強できる本を一冊買って、3日くらい勉強すると”一応できます”になる。
・その他の分野
テーブルデータ以外にもこんな分野があります。
・自然言語処理
https://qiita.com/fY9pFc4W1I8uoa0/items/a5e3b7706b8e8f68fabc
・画像認識
https://qiita.com/AxrossRecipe_SB/items/d758ac95b2f3d1fbb7e6