初めに
この記事は、PEP検定(Prompt Engineering Professional 検定)の
公式学習資料を一通り読んで、理解したポイントを自分用に整理したメモです。
将来の自分が見返すため&これから受験を考えている人の参考になればと思い、
要点だけまとめています。
特に、これからPEP検定を受験しようとしている方や、
公式資料のボリューム感に戸惑っている方の参考になれば嬉しいです。
公式資料への感謝
本記事は、以下の PEP検定公式学習資料 をもとにしています。
体系的で非常にわかりやすい資料を公開してくださっている
日本プロンプトエンジニアリング協会様に感謝します。
- PEP検定公式サイト
https://prompt.or.jp/pep
PEP検定とは?
PEP検定(Prompt Engineering Professional 検定)は、
生成AI(LLM)を業務で正しく・安全に活用するための知識とスキルを
体系的に評価する検定試験です。
プロンプト設計だけでなく、
- LLMの特性理解
- RAGやAPI活用
- リスク・法務・倫理
といった 実務寄りの内容 が出題範囲になっています。
公式学習資料を読んで整理したポイント
第1章から第6章までの学習内容を、優先順位(必須・次点・得点アップ)に沿って整理しました。
本記事での優先度の考え方
各章の内容は、以下の基準で整理しています。
| カテゴリ | 基準 |
|---|---|
| 必須 | 試験対策・実務利用の両面で最低限押さえておきたい内容 |
| 次点 | 理解していると全体像がつかみやすく、応用もしやすくなる内容 |
| +1 | 得点アップや理解深化につながる発展的・補足的な内容 |
公式資料をすべて丸暗記するのではなく、
「どこに力をかけて読むか」の目安として使ってもらえればと思います。
第1章:生成AIと大規模言語モデルの基礎
-
必須
- AIの定義は、人間の知能を模倣し、学習や推論、意思決定を自動で行う技術です。
- 大規模言語モデル(LLM) は、従来のモデルに比べ、データセットサイズ、計算量、パラメータ数が大幅に増加しているのが特徴です。
- 学習手法には、正解ラベル付きデータを使う「教師あり学習」と、データの構造を見つけ出す「教師なし学習」があります。
-
次点
- AIの歴史において、1950年代に「人工知能」という言葉が提唱され、2010年代にディープラーニング革命が起きました。
- 特定のタスクに特化したAIを「Narrow AI(特化型AI)」、人間のように汎用的なタスクをこなすAIを「AGI(汎用型AI)」と呼びます。
-
+1
- LLMの性能を支えるトランスフォーマーアーキテクチャの核は、単語間の関連性を重み付けする「自己注意機構(Self-Attention)」です。
- 代表的なモデルとして、OpenAIのGPTシリーズ、GoogleのBERTやGeminiなどの変遷を把握してください。
第2章:プロンプトエンジニアリングの基本概念と技術
-
必須
- プロンプトの基本構成4要素は、指示(Instruction)、文脈(Context)、入力データ(Input Data)、出力形式(Output Indicator) です。
- 最も重要なのは「指示」であり、具体的かつ簡潔な目的を伝えることが重要です。
-
次点
- 例示を一切行わない「Zero-Shot」と、少数の例示を含める「Few-Shot」プロンプティングの違いを理解してください。
- 複雑な推論をさせるために、思考過程を書き出させる「Chain-of-Thought(CoT)」が有効です。
-
+1
- 複数の推論経路から多数決で答えを選ぶ「Self-Consistency」や、木構造で思考を探索する「Tree of Thoughts」などの高度な手法を整理してください。
- モデル自身にプロンプトを改善させる「Meta-Prompting」や、タスクを分割して連鎖させる「Prompt Chaining」も重要です。
第3章:生成AIの実務への活用
-
必須
- 実務での活用例には、ビジネス文書の作成、議事録作成、SEO記事の執筆、営業メールのテンプレート作成などがあります。
- AIが作成した文章はそのまま使わず、必ず人間が正確性やオリジナリティをレビューする必要があります。
-
次点
- テキストデータのクリーニング、要約、カテゴリ分類、異常検知などのデータ処理が可能です。
- CSVデータをアップロードして、データの集計やフィルタリング、グラフ作成のコード生成を行うことができます。
-
+1
- 外部システムとの連携時には、APIキーを環境変数やSecrets Managerで管理し、ソースコードに直接書かないことがセキュリティ上の鉄則です。
- APIエラー時の対策として、待機時間を指数関数的に増やす「エクスポネンシャルバックオフ」などのエラーハンドリングが推奨されます。
第4章:生成AIのカスタマイズ手法
-
必須
- カスタマイズの主な3手法は、プロンプトの工夫、外部知識を参照するRAG、モデルを再学習させるファインチューニングです。
- 外部の最新情報を反映させたい場合はRAG、特定の専門分野に深く特化させたい場合はファインチューニングを選びます。
-
次点
- RAGの構築ステップには、知識ベースの準備、検索エンジンの構築、生成モデルとの統合が含まれます。
- ファインチューニングには、高品質なデータセットとGPUなどの計算リソースが必要です。
-
+1
- 効率的なファインチューニング手法として、少ないパラメータ調整で済むLoRAやPEFTという技術があります。
- RAGにおいて情報の高速検索を可能にするのは、データを数値化した「ベクトルデータベース」です。
第5章:倫理・リスク管理・法律上の考慮事項
-
必須
- AIがもっともらしい嘘をつく「ハルシネーション」のリスクを常に意識する必要があります。
- モデルが学習を終了した「知識のカットオフ日」以降の情報については、正確に回答できません。
- 個人情報や機密情報はプロンプトに入力せず、匿名化などの処置を行う必要があります。
-
次点
- 学習データの偏りにより、特定の差別や偏見を助長する「バイアス」が発生する可能性があります。
- 生成物が他者の著作権、商標権、意匠権、特許権を侵害していないか確認が必要です。
-
+1
- 不正競争防止法の観点から、企業の「営業秘密」をAIに入力すると秘密管理性を失うリスクがあることを理解してください。
- 各国の法規制(個人情報保護法など)の最新動向を把握し、社内ガイドラインを整備することが求められます。
第6章:AIエージェントとコンテキストエンジニアリング
-
必須
- AIエージェントとは、LLMを核として自律的に判断し、ツールやAPIを使用してタスクを実行するシステムです。
- エージェントの行動サイクルは、Plan(計画)、Act(実行)、Observe(観察)、Reflect(改善)のPAORモデルで構成されます。
-
次点
- エージェントの構成要素は、LLM、ツール/API、メモリ(短期・長期)、RAGの4つに大別されます。
- 実行したアクションの結果を観察し、次の行動に繋げる「状態管理(State Management)」が重要です。
-
+1
- 長い文脈の中央にある情報をAIが見落とす「Lost-in-the-Middle」現象という課題があります。
- 安全性を高めるため、重要な判断に人間が介在する「Human-in-the-Loop(HITL)」の導入が有効です。
- エージェントに与えるシステムプロンプトの設計において、禁止事項や目標設定、有効なツールの定義を明確にすることが成功の鍵です。
理解すべき3つの重要エッセンス
合格のために、以下の3つの柱を重点的に学習してしようと思います。
-
LLMの基本構造とトレーニングプロセス
大規模言語モデル(LLM)は、大量のデータ、計算量、パラメータ数によってその性能が左右されます。
学習は、汎用的な知識を得る 「事前学習」 と、特定のタスクに最適化する 「ファインチューニング」 の2段階で行われることを理解すること。 -
効果的なプロンプト設計と高度な技術
プロンプトは、指示(Instruction)、文脈(Context)、入力データ(Input Data)、出力形式(Output Indicator) の4要素で構成されます。
さらに、推論精度を高める Chain-of-Thought(思考の連鎖) や、複数の思考経路を探索するTree of Thoughts(思考の木) といった高度な手法の仕組みを区別できる必要があります。 -
カスタマイズ手法の使い分け(RAG vs ファインチューニング)
低コストで手軽な「プロンプトエンジニアリング」、最新の外部情報を参照させる「RAG」、特定分野に深く特化させる「ファインチューニング」の3手法について、目的やコストに応じた適切な選択基準を整理しておくこと。
覚えやすいキーワード整理
試験直前まで見直すべき重要語句をカテゴリ別に分類しておきます。
| カテゴリ | 重要キーワード | 内容のポイント |
|---|---|---|
| 基礎知識 | 自己注意機構 (Self-Attention) | 単語間の関連性を重み付けし、文脈を深く理解するトランスフォーマーの核。 |
| ハルシネーション | AIが事実に基づかない情報を、もっともらしく生成してしまう現象。 | |
| 知識のカットオフ日 | 学習データの収集終了日。それ以降の最新情報はAIは知らない。 | |
| プロンプト | Few-Shot | 少数の例示をプロンプトに含め、回答精度を向上させる手法。 |
| Prompt Chaining | 複雑なタスクを分割し、複数のプロンプトを連鎖させるプロセス。 | |
| Meta-Prompting | AI自身に「より良いプロンプト」を考えさせ、改善する技術。 | |
| 運用・倫理 | RAG | 外部の知識ベース(ベクトルDB等)から情報を検索し、回答を補強する手法。 |
| PAORモデル | AIエージェントの基本サイクル(Plan/Act/Observe/Reflect)。 | |
| 不正競争防止法 | 企業の営業秘密を守る法律。プロンプトへの機密情報入力はリスクとなる。 |
今後やること
PEP検定の学習内容は、暗記で終わらせず、
実務や個人開発の中で実際に使いながら理解を深めていくつもりです。
具体的には、
- 業務設計や個人開発で、プロンプト設計・RAG・リスク整理を実際に使ってみる
- 「バイブコーディング」的な使い方だけでなく、
壁打ち相手・設計レビュー・悩み相談役としてLLMを活用し、
思考の整理や意思決定の質を上げる - 試験対策としてだけでなく、
「なぜそのプロンプトが有効なのか」を言語化できる状態を目指す
このあたりを繰り返しながら、
PEP検定の学習内容を自分の武器として使えるレベルまで落とし込んでいきたいと思います。