はじめに
先日、AWS Certified Machine Learning - Specialtyを受検し、合格しました。
この資格でAWS資格は7個目になるのですが、今まで一番楽しみながら勉強でき、点数も一番良かったです🎉
試験の詳細と勉強法について、記していきたいと思います。
受検時の状態
- 入社3年
- 業務でAWSを触る環境
- AWS CLF, SAA, SOA, DVA, SCS, DBS取得済み
勉強期間
1か月半
勉強時間
合計30時間ほど
内訳
就業後0.5~1時間 電車移動時2時間
使ったもの
Exam Prep Official Practice Question Set: AWS Certified Machine Learning - Specialty (MLS-C01 - Japanese)
-
毎度のことながら、CloudLicenceでの問題演習と復習に時間をかけました。3周しました。
-
機械学習の基礎知識を問われる問題が多いので、機械学習モデルの種類と用途、そして過学習への対応や混同行列の理解に努めました。
-
機械学習の基本的な知識は問題演習&生成AIと会話してキャッチアップし、AWSの知識は問題演習とBlackBelt、実際にAWSコンソールで見てみるという方法で学習しました。
生成AIと勉強
機械学習は仕事と全く違う分野ですし、聞きなれない単語に苦しみました。分からない単語があった際に、生成AIと会話しながら勉強する方法が、自分に合っていましたので紹介します。使用したのは、弊社の社内生成AIであるWeiseHubです。
WeiseHubについては、こちらの記事で紹介されておりますので、良ければご覧ください。
どのように活用していたか紹介します。
「○○の概要と用途を分かりやすく説明して」
これは機械学習の手法についてざっと理解したい時に使っていました。
例)セマンティックセグメンテーションの概要と用途を分かりやすく説明して
回答)
セマンティックセグメンテーションは、画像処理の一種であり、画像内の各ピクセルに対して、それが属する物体や物体の一部を特定することを目的としています。
つまり、画像内の個々のピクセルに、そのピクセルが何に属するかをラベル付けするタスクです。
セマンティックセグメンテーションの用途としては、以下のようなものがあります。
自動運転技術: セマンティックセグメンテーションは、自動運転車の周囲の環境を理解するために使用されます。
道路や歩道、車両や歩行者などの物体を正確に検出し、運転判断に役立てることができます。
衛星画像解析: セマンティックセグメンテーションは、衛星画像から陸地や海、建物、森林などを識別するために使用されます。
これにより、土地利用の監視や環境状況の把握が容易になります。
医療画像解析: セマンティックセグメンテーションは、MRIやCTスキャンなどの医療画像を解析するために使用されます。
異常部位の特定や病変の追跡に役立ちます。
物体認識: セマンティックセグメンテーションは、物体認識技術の一部としても使用されます。
画像内の各物体やその特定の部分を正確に特定することができます。
セマンティックセグメンテーションの目的は、ピクセルレベルでの物体検出や領域分割を実現することです。
これにより、様々な応用分野で現実世界の理解や認識を高度化することができます。
回答を元に、以下のようにノートにまとめて覚えていきました。
手法 | 概要 | 用途 |
---|---|---|
セマンティックセグメンテーション | 画像内のピクセルごとに意味やカテゴリを割り当てる技術 | コンピュータビジョンや人工知能における画像認識や物体検出 |
「○○と○○の概要と用途、違いを分かりやすく説明して」
自分の中で2つの機械学習モデルの使い分けが分かっていないときに使っていました。
例)オブジェクト検出とResNet50畳み込みニューラルネットワークについて、概要と用途、違いを分かりやすく説明して
回答)
オブジェクト検出は、画像やビデオ内に存在する物体の位置とクラスを同時に検出する技術です。
これは、物体検出の一種であり、画像内の物体を検出して境界ボックスを作成するだけでなく、それらの物体をクラス分類も行います。
ResNet50は、ディープラーニングアーキテクチャの一つであり、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)の一種です。
ResNet50は、50層の畳み込み層やプーリング層、全結合層で構成され、学習済みモデルとして提供されています。
オブジェクト検出の用途は、以下のようなものがあります。
オートバイや自動車といった車両の検出: 交通安全や自動運転技術において、オブジェクト検出は重要な役割を果たします。
道路上の車両を検出してトラフィックフローの監視や衝突回避などに利用されます。
顔の検出: セキュリティシステムや人物識別システムにおいて、顔の検出は頻繁に使用されます。
顔を検出することで、個人の識別や監視、表情認識、自動フォーカスなどを行うことができます。
物体認識: オブジェクト検出は、物体認識の一部としても使用されます。
画像内の物体の位置やクラスを同時に特定することで、現実世界の理解や自動化の実現に寄与します。
違いとしては、オブジェクト検出は、画像内の物体を検出し、それらの位置とクラスを同時に特定する技術です。
一方、ResNet50は、ディープラーニングの畳み込みニューラルネットワークの一つであり、学習済みモデルとして提供されることが多いです。
ResNet50は、画像の特徴を抽出するためのモデルであり、オブジェクト検出に利用されることがありますが、それ自体がオブジェクト検出の手法ではありません。
回答を元に、以下のようにノートにまとめて覚えていきました。
手法 | 概要 | 用途 |
---|---|---|
オブジェクト検出 | 画像内に存在する特定のオブジェクトを検出する技術 | 画像の中から車のような特定のものを抜き出す。※細かい物やテキスト抽出には向かない |
ResNet50畳み込みニューラルネットワーク | 畳み込みニューラルネットワーク (CNN) の一種。ResNet50は、50層からなる多層の畳み込み層と全結合層で構成されており、画像分類や特徴抽出に優れた性能を発揮。 | ヘアスタイルや髪色のような細かいものを抜き出す |
「○○とは何か、具体的な値を示しながら説明して」
概念は理解しているが、イメージがついていないときに使っていました。
例)シーケンスデータとは何か、具体的なデータの値を示しながら説明して
回答)
シーケンスデータとは、順序が重要なデータのことを指します。
時間や順番に関連性のあるデータを含むデータセットのことを指し、一連のデータポイントが一定の順序で並んでいます。
例を挙げながら、シーケンスデータを説明します。
考えてみましょう、ある人の一週間の気温データがあったとします。
月曜日: 25℃
火曜日: 28℃
水曜日: 30℃
木曜日: 27℃
金曜日: 26℃
土曜日: 29℃
日曜日: 31℃
上記のデータは、一連の時間的な順序で記録された気温データです。
気温は1日ごとに値があり、順序が重要です。このデータはシーケンスデータと言えます。
シーケンスデータは、さまざまな応用分野で使用されます。
自然言語処理のテキストデータや音声データ、株価の時系列データ、DNAの塩基配列など、さまざまな形式のデータを含むシーケンスデータがあります。
シーケンスデータの特徴は、時間や順序に基づいたモデリングや解析が有効であるという点です。
RNN(Recurrent Neural Network)などのシーケンスモデルや、テキストの予測、音声認識、株価の予測などのタスクに使用されます。
シーケンスデータの分析は、過去のデータに基づいて未来の予測や傾向の特定を行うことができます。
このような回答が返ってきて、シーケンスデータをより具体的に理解することができました。
まとめ
以上のように機械学習の基本的な知識やイメージ、使用例をつかむのに生成AIは便利だと思うので、良ければ活用してみてください。
本番のスケジュール
14:15 会場着 本人確認や写真撮影を済ませる
テスト前の受付は30分前からとのことで、14:45時予約で14:15から受付し始めしました
14:15-17:00ごろ 受検
19:14にバッジ認定メール、
19:20にスコアレポートのメールが来ました。(結果:868点)
感想
これで通算7個目のAWS資格となりました。MLSはAWSの知識だけでなく、機械学習の基本的な知識が求められる、他の資格とは少し違うタイプの資格でした。その分難しさもありましたが、新しい勉強法を試しながら楽しく勉強できたので、良かったなと思います。
以上です。ありがとうございました。