1. はじめに
またしても一月ほど間が空いてしまいました。
皆さんいかがお過ごしでしょうか。
ご報告がまたしても遅くなってしまいましたが、
この度AWS Certified Generative AI Developer - Professionalに合格したので、
体験談として投稿させていただきます。
先に結論から言っておくと、個人的に今まで受けた中で一番難しかったです。
いや、本当になんで受かったん?ってレベルで難しかったです。
勉強に要した期間はざっと3週間くらいと言ったところです。
2. 対策
まずご存知かとは思いますが、改めてGenerative AI Developer - Professional(以下AIPと呼称)についてざっとおさらいをします。
どんな問題が出るの?
AWS Certified Generative AI Developer - Professional (AIP-C01) 試験は、GenAI デベロッパーの役割を担う方を対象としています。本試験では、受験者が基盤モデル (FM) をアプリケーションとビジネスワークフローに効果的に統合できるかどうかが検証されます。この認定は、AWS テクノロジーを使用して GenAI ソリューションを本番環境に実装する方法に関する実践的な知識を証明するものです。
AWS Certified Generative AI Developer - Professional (AIP-C01)
平たくいうと、生成AIをどのようにして安全に業務に組み込むかということが問われます。
MLAとはまた違った切り口でAIについて問われる感じですね。
実際、あっちはSageMakerメインだったのに対し、こちらはBedRockが中心になります。
特にRAGが聞かれまくります。RAGって言葉が嫌になるくらい目につくので、自然とある程度分かるようになります。
他にはAIのガードレールを中心としたセキュリティ、監査なども多く聞かれた印象があります。
とにかく対策教材が少ない
この記事を読んでいる方は言われるまでもなく重々承知しているかと思いますが、
今年(2026年)4月に正式リリースされたこともあり、とにかく情報が少ないです。
自分が対策した時点でまともに使えるサードパーティの模試や教材はほぼ皆無でした。
唯一の救いは、AWS SkillBuilderのサブスクプランに入っていればAIPのフルセット模試が受けられること。
Official Pretest: AWS Certified Generative AI Developer - Professional (AIP-C01 - English)
※Englishとなっていますが、日本語版がちゃんとあります。内容は一緒です。
ただ、これも正直あまりアテにしないほうが良いですね。
本番で若干パニクっていたのもありますが、あんまり似た問題が出た記憶がありません。
じゃあどうすんの
ここで活躍したのがみんな大好きチャッピーです。
ChatGPTに問題を作成してもらい、まずは基礎知識を固めました。
参考用に当時自分が使っていたプロンプトを後ほど掲載します。
ただ闇雲にAIPの問題を作ってって言ってもカスみたいな簡単な問題しか出してこないので、
ちゃんと前提を教えてあげないといけません。
具体的には、出題範囲を公式の試験ガイドを参照し
- どのような観点で聞かれるのか
- 特に引っかかりやすい用語
- 一問一答ではなく、設計判断を要求するように。
- 選択肢から消去法で導けるような内容を作らないこと。
のように精度が高まるプロンプトをつっこみます。
また、最初に役に立ったかどうかは微妙ですが、参照用の辞典も作ってもらいました。
また、勉強する上で以下の観点はかなり反復していたと思います。
- Bedrock vs SageMaker
- InvokeModel vs Converse API
- Retrieve vs RetrieveAndGenerate
- RAG vs Fine-tuning
- Knowledge Bases vs 自前RAG
- Semantic search vs Keyword search vs Hybrid search
- OpenSearch vector engine vs Aurora PostgreSQL pgvector
- Agents vs Step Functions
- Guardrails vs IAM
- CloudTrail vs CloudWatch Logs
- Macie vs Guardrails sensitive information filters
- Provisioned Throughput vs On-demand
- Prompt caching vs Provisioned Throughput
- Cross-region inference vs データレジデンシー要件
ちなみに、先述した通り、RAGが死ぬほど聞かれます。
とはいえ、バージョンが変わるかどうかしない限りはほぼ出てくる問題はそう変わらないと思うので、
以下に目を通しておいたほうが良いものを書いておきます。(ChatGPTに聞いた)
- RAGの基本構造
- Bedrock Knowledge Bases
- Retrieve API
- RetrieveAndGenerate API
- Embeddings
- Chunking
- Metadata filtering
- Reranking
- Hybrid search
- Vector database
- OpenSearch vector engine
- Aurora PostgreSQL pgvector
- Kendra
ざっくりいうと、何を使ってRAGのデータベース作るんですか。どうやって文章などを分割するんですか、どのモデルにデータを分割させるんですか。どうやってデータを保存しておくんですか。などが無限に聞かれます。
私は受験前時点、どうやらRAGってものがあるらしいっていうことだけしか知らず、そもそもRAGが特定の技術を指すのか、考え方を指すのかさえも知りませんでした。
ちなみに参考程度に書いておくと、初見の模試のスコアは6割前後くらいでした。
3. 当日
受験時間は過去最長でした。
対策量不十分なAI×情報量が少ないProfessional区分というのが最悪すぎて、
問題の半分以上は確信をもって答えられたものがなかったと思います。
わからない問題はこれまでに培ってきたAWSの勘に頼って、なんとかそれらしい答えを選ぶというのが多かったです。
結果としては779点で合格ができましたが、発表までの手応えは4割取れてれば良いかなくらいに考えていました。
4. これから受ける方へ
これから全冠を目指そうと思う変な人たち(褒め言葉)につきましては、
AIPは最後に受けることをおすすめします。実務で使っているなら話は別ですが、ペーパーだけで太刀打ちしようとすると最初にこれをもってくると間違いなく無駄に時間を食います。
現場からは以上です。
PS.先日AWS Summit Japanに参加し、僭越ながら金の扇子をもらいました。いつかはトロフィーも受け取りたいですね。(自社が要件を満たしておらず来年度に申請ができなさそうだった)
以下、実際に使ってたプロンプトです
あなたは AWS Certified Generative AI Developer - Professional(AIP-C01)の高難度シナリオ問題作成者です。
目的:
AIP-C01対策として、サービス名暗記ではなく、生成AIアプリケーションを本番環境で設計・実装・保護・運用・トラブルシュートする判断力を問う問題を1問作成してください。
前提:
- 受験者は、Amazon Bedrock、Knowledge Bases for Amazon Bedrock、Agents for Amazon Bedrock、Action Groups、OpenAPI schema、Guardrails、IAM、KMS、CloudTrail、CloudWatch、S3、OpenSearch、SageMaker、Lambda、Step Functions、VPC endpoints などの基本知識は既に持っているものとします。
- 単体サービスの説明問題、用語暗記問題、サービス名だけを選ぶ問題にはしないでください。
- AWS公式試験ガイド、公式シラバス、AWS公式ドキュメントに基づいて作問してください。
- 非公式問題集、模試サイト、Q&Aサイト、個人ブログ等の既存問題文、場面設定、選択肢構成を再現、要約、翻案しないでください。
- 実在しない機能、古い名称、廃止済み機能、試験範囲外の細かすぎる制限値には寄せないでください。
作問方針:
以下のいずれかを中心テーマにしてください。
- 新規AI環境を1から構築する
- 既存構成を大きく変えずに制約を満たす
- 本番運用上の事故を最小変更で改善する
- セキュリティ、監査、権限境界を設計する
- RAGの検索品質、権限制御、データ更新、引用根拠を改善する
- Agentの安全なツール実行、Action Group、OpenAPI schema、Lambda validationを設計する
- Guardrails、IAM、KMS、CloudTrail、CloudWatch Logs、Macieの役割分担を判断する
- Prompt Management、model invocation logging、評価、回帰テスト、rollbackを設計する
- コスト、レイテンシ、スループット、スロットリングを本番運用目線で最適化する
- 障害発生時にretrieval側、generation側、tool execution側、logging側を切り分ける
テーマ選定:
- AIP-C01のDomain 1〜5から主テーマを1つ選んでください。
- 複数Domainが自然に絡む本番シナリオにして構いません。
- ただし、1問で主に測定する判断軸は1つに絞ってください。
- 補助的な判断軸は1〜2個までにしてください。
主な判断軸の例:
- Retrieve vs RetrieveAndGenerate
- Knowledge Bases vs custom RAG
- Agents vs Step Functions
- action group vs tool use
- OpenAPI schema vs Lambda validation
- CloudTrail vs model invocation logging
- CloudWatch Logs vs CloudTrail
- Guardrails vs IAM
- KMS vs IAM
- sensitive information filters vs Macie
- RAG vs fine-tuning
- prompt engineering vs Guardrails
- prompt caching vs Provisioned Throughput
- cross-region inference profiles vs data residency
- batch inference vs real-time inference
- model evaluation vs application monitoring
問題条件:
- 問題文は250〜380字程度
- 選択肢は4つ
- 正解は1つ
- 各選択肢は、実務アプローチとして成立する構成にしてください
- 各選択肢には、最低3つ以上の設計要素、サービス、機能、運用判断を含めてください
- 誤答は明らかなアンチパターンにしないでください
- 誤答は「別条件なら正解になり得るが、今回の条件では1点だけ弱い」構成にしてください
- 正解だけが全部入りに見えないようにしてください
- 正解は、問題文の決定的条件に対して必要十分な構成にしてください
- 選択肢の長さ、具体度、サービス数、設計密度をできるだけ揃えてください
- 選択肢だけを見て正解が類推できないようにしてください
- 問題文の制約条件を読まないと正解が決まらないようにしてください
- 同一問題内の選択肢は、できるだけ同じ設計カテゴリに揃えてください
- RAG問題なら全選択肢をRAG構成案にする
- Agent問題なら全選択肢をAgent / Workflow / API実行構成案にする
- セキュリティ問題なら全選択肢をGuardrails / IAM / KMS / ログ設計の組み合わせにする
- 運用問題なら全選択肢を評価 / 監視 / ログ / 改善フローにする
問題文に含める要素:
- 既存構成
- 現在の問題
- 変更できない制約
- 正解を決める決定的条件
- 最も重視する評価軸
問題文の書き方:
- 要件を箇条書きにせず、自然な実務ケース文として書いてください
- 「要件は以下の通り」「制約は以下の通り」「課題は以下の通り」のような整理済み表現は避けてください
- 正解サービス名や機能名へ直結するキーワードを露骨に書きすぎないでください
- AWS機能名ではなく、現場表現、監査表現、運用表現として制約を記述してください
- 回答者が問題文から要件を抽出する必要がある形にしてください
選択肢の禁止表現:
以下のような、文面だけで地雷だと分かる断定表現は原則として使わないでください。
- のみ
- だけ
- すべて
- 必ず
- 完全に
- 一切不要
- 常に
- 確実に
- 自動的に
- これで解決する
- 代替できる
- 任せる
- 省略する
- 問題ない
選択肢の表現は、以下のような実務設計案の文体に寄せてください。
- 「〜を組み合わせる」
- 「〜を確認する」
- 「〜を検討する」
- 「〜で制御する」
- 「〜と突き合わせる」
- 「〜を分離して扱う」
- 「〜に応じて調整する」
- 「〜を評価する」
- 「〜を補完する」
- 「〜を段階的に適用する」
禁止事項:
- GuardrailsをIAM、KMS、CloudTrail、Macieの代替として扱わない
- IAMをPII対策、prompt injection対策、回答品質評価の代替として扱わない
- KMSをアクセス制御やPII検出の代替として扱わない
- CloudTrailをモデル入出力本文の詳細ログ基盤として扱わない
- CloudWatch Metricsを回答品質評価の直接代替として扱わない
- Security Hub、GuardDuty、Configをモデル応答品質やRAG検索品質の直接評価手段として扱わない
- RAGとfine-tuningを雑に代替関係として扱わない
- Agentをすべての業務ワークフロー制御の万能解として扱わない
- Prompt Managementを品質保証そのものとして扱わない
- prompt cachingをあらゆるレイテンシ問題の万能策として扱わない
- cross-region inferenceをデータレジデンシー要件確認なしに選ばない
作問時の内部設計:
最終出力には出さない内部設計として、以下を必ず定義してから作問してください。
- 測定するAIP-C01のDomain
- 主に測定する判断軸
- 補助的に測定する判断軸
- 正解を一意に決める決定的条件
- 正解となる設計アプローチ
- 問題文に含める実務制約
- 各選択肢の設計意図
- 各選択肢の長所
- 誤答選択肢が別条件なら正解になり得る理由
- 誤答選択肢が今回の条件では負ける理由
- 参照する公式ドキュメント名、試験ガイドのドメイン名、またはシラバス項目
内部チェック:
出力前に以下を確認してください。チェック結果は出力しないでください。
- 選択肢だけを見て正解が分からないか
- 4選択肢すべてが一見もっともらしいか
- 正解は、問題文中の決定的条件によって一意に決まるか
- 誤答は「間違い」ではなく「今回の条件に対して優先順位が低い」形になっているか
- サービス知識ではなく、設計判断・制約判断・運用判断を問えているか
- 問題文に余計なヒントを入れすぎていないか
- 正解選択肢だけが不自然に長くなっていないか
- 正解だけが安全・監査・評価を盛り込んだ全部入り構成になっていないか
- 誤答だけが乱暴、抽象的、短い、または古い設計になっていないか
- 公式AWSドキュメント上に存在するサービス名・機能名だけを使っているか
出力形式:
以下の形式で出力してください。
## 問題:AIP-C01 本番寄りシナリオ問題
問題文
A. 選択肢
B. 選択肢
C. 選択肢
D. 選択肢
---
## 正解
正解の選択肢
---
## 解説
### 決定的条件
- 問題文から抽出すべき決定的条件を箇条書きで説明する
- なぜこの条件により正解が一意に決まるのか説明する
### 正解理由
- 正解選択肢が今回の条件に最も合う理由を説明する
- どのサービス・機能・設計判断が効いているのか説明する
- 他の選択肢より優先される理由を明確にする
### 他選択肢が別条件なら正解になり得る理由 / 今回負ける理由
各誤答について、以下を必ず説明する。
- 別条件なら正解になり得る理由
- 今回の条件では負ける理由
- どの決定的条件と噛み合っていないのか
### 試験での見抜き方
- このタイプの問題で注目すべきキーワード
- 正解候補を絞る判断軸
- 似たサービス・機能との切り分け
- AIP-C01本番での引っかけポイント
最後に、今回の問題が主に対応するDomainを明記してください。
