これはなに
Google Cloud Certified - Professional Machine Learning Engineerの受験記録です。
動機
なんやかんやでGoogle Cloud認定試験はこれだけ残ったので勢いで。
受験概要
https://cloud.google.com/certification/machine-learning-engineer
受けて欲しいひと
- MLを軽く勉強したい人でGoogle Cloudの基礎的なところを抑えている人。
- MLが前面に出たツールやSaaSを利用する人。(e.g. Prisma Cloud)
- コンプリート目的
上記に該当する人以外は、正直、他の資格を優先でいいようにも思う。
無駄だったとは思ってはいない。
なぜか?
一部、Google CloudのML関連サービスの知識が求められるが、ごく一部。
それ以外のGoogle Cloudサービス(Database系, GCS, GAEなど)も問題に一部登場するが、一般的な知識レベルで回答できそうなものがほとんど。
これは、おそらくGoogle Cloudのアーキテクチャが洗練されているから、理解しやすい構成になっているからと思われる。
問題の大半がMLについて。
ただ、後述の触り程度の学習でも合格点に達したので、そんなに深いことは聞いてこないと思う。
上記の背景により、Google Cloudについて基本的なことを抑えている人が、MLを勉強してみたいであったり、今後に備え下地を作って置こうという人に向いている気がする。
勉強方法
個人的オススメ順。
全体的に言えることだが、試験は英語のみのため、英語が得意でない人ほど、適宜、英語で照らし合わせた方がいい。
そうしないと、試験の時に単語が紐づかない可能性がある。
-
Crash Course
Google社内の学習コンテンツを公開したものらしい。
随所に理解度チェックテストもあり、本家のコンテンツであることから、ベストプラクティスへの信憑性も高い。
圧倒的にオススメ!
ただ、動画を飛ばして進めたこともあり、途中置いていかれるところもあった。
そこは後述の書籍や他の情報をググって補完した。
https://developers.google.com/machine-learning/crash-course -
模擬試験
試験概要は合格後に読み返しても分からないことが多いが、模擬試験は有用だった。
各問題に詳細な解説がついているので、序盤の自分自身の現在地点の確認と、受験直前のおさらいに有効。
正解の選択肢だけでなく、他の選択肢の説明もあるので、そこも理解できるようにする。
https://cloud.google.com/certification/sample-questions/machine-learning-engineer -
書籍
- 仕事ではじめる機械学習 - O'Reilly Japan
書籍はなんでもいいと思う。たまたま、会社の共用本棚にあったので拝借。
自分は前半部分の機械学習の基礎的なところのみ読んだ。
- 聴講
- スタビジ(Youtube)
いくつかだけちょっとした合間に観た。一つの動画の時間が短いのがありがたい。
ただ、Youtubeは他の誘惑が多いのであまり活用しきれなかった。
他にもコンテンツは上がっているので、動画派の人は自分好みを探してもいいかも。
受けてみたメモ
False -> Pass.
初回はほぼ丸腰で挑んでしまった。機械学習の単語が分からず惨敗。
Recall … リコール。。。車の欠陥で回収するとかのやつかなぁ。学習結果間違っていたので再学習とかかなぁ、と間違った推測のもと、試験を進めてしまった。この辺の単語は知っておくべきだった。
ただ、Google Cloud側の知識は今持っているもので結構カバーできそうだなぁとか、機械学習についてちゃんと勉強してからでないとダメだなぁという感覚は掴めた気がした。
2回目は前述の学習を行った上で挑み、無事成功 :)
あと、見直しでも数問修正できた気がする。1回目はサボってしまった。他の試験でも同様ではあるが、この試験では、より問題をしっかり読むことが大事に思った。
勉強メモのハイライト
これだけは抑えておこう
評価
True-Positive, True-Negative, False-Positive, False-Negative
を基に、正解率、適合率、再現率、AUCとか。
概念的にシンプルなのでML初学者でも簡単に理解できると思う。
先に書いたRecallの件とか、これを知っていたら容易に解けた(知らなければ解けない)問題も多い。
構成図
"GCP ML"で画像検索してみる。
いくつか構成図が出てくるので、そのサイトを眺めておくと、構成観点での設問対策になる。MLのインフラストラクチャ構成を掴める。
公式サイトがオススメ。図付きの方がイメージつきやすい&丁寧な解説があることが多い。他の試験でもこの作戦は有効。
協調フィルタリング
用途がわかる程度で大丈夫と思う。
類似比較による記憶
個人的に超オススメ。
個別で覚えるよりも、試験にも実務にも実践的な気がするし覚えやすい。
メモを以下に共有するが、あくまでメモなので参考程度に。
Neural Networkにおける、RNN vs CNN
RNN ... 時系列データの予測など、NNの各層出力を中間データとして出なく通常の結果のように利用。
CNN ... 画像識別などで、ある程度の範囲のデータをまとめたものを重ねていく。
RecomendにおけるContent Based vs Colaborative Filtering
Content Based ... 類似商品のオススメ
Colaborative Filtering ... 自分と関連する他のユーザーなどからオススメ
BigQuery ML vs Auto ML Table
いろいろ差異があるので単純比較は割愛。
AI Platform vs kubeflowとか、Coomposerとか主要サービスは概要レベルででも押さえておきたい。
オンライン予測 vs バッチ予測
オンライン予測 ... その場ですぐに結果を返す。
バッチ予測 ... まとめて予測。
AI Platformにおけるgcloud vs REST API
gcloud ... AI Platformタスク向き
REST API ... オンライン予測向き
AutoML Natural Language vs Cloud Natural Language
AutoML Natural Language ... ラベリング(分類)
Cloud Natural Language ... 分析
クラス分類 vs クラスタリング
クラス分類 ... Classfication。教師アリ。境界線を引いて明確に判別。
クラスタリング ... Clustering。教師ナシ。近くにいるものをグルーピング。