はじめに
先日、Agent SOPs なるものが発表されました。今回はこちらについて実際に試してみたいと思います。
SOPs とは?
あまり聞きなじみのない SOPs についてですが、これは、Standard Operating Procedures の略で、作業手順書のことです。
Agent SOPs は、AIエージェントのために書く Markdown の「作業手順書」といったところになるようです。
何が嬉しい?
AIエージェント開発における課題として、制御のトレードオフがあります。動作を LLM に任せると実装は柔軟で楽なものになりますが、実行結果が安定せず、逆に、コードで制御しようとすると再現性が高くなる代わりに、柔軟性が低く管理コストが高まります。
この制御のトレードオフに対して、(LLM に丸投げするでもなく、コードでガチガチに管理するでもない)ちょうどいい感じに扱えるのが Agent SOPs ということのようです。
どう書くのか?
SOP は Markdown で記述し、さらに RFC 2119(MUST / SHOULD / MAY)に従って制約を明確化します。
RFC 2119 についての詳細は以下リンクをご参照ください。
以下の SOP を例に確認してみましょう。
**Constraints:**
...
- You MUST read CODEASSIST.md if found and apply its constraints throughout (see Important Notes)
- You MUST notify the user when the structure has been created
- You MUST handle directory creation errors gracefully and report specific issues to the user
見てもらえばわかると思いますが、MUST を使って記載することで、すべきことなどを明確化できているようです。(ということは日本語で書くのはあまり意味がない...かも?)
一応以下の通り日本語で書くことはできそうです。どのくらい効果があるのかは時間があるときに試してみたいと思います。
実際に試してみる
上記のリポジトリで公開されている、コーディングを行う SOPs(code-assist.sop.md)を使ってエージェントを実行してみます。
SOPs を Claude に要約させたところ、以下の手順が書かれていることがわかります。
Code Assist SOP 要約
目的: TDD(テスト駆動開発)でコードを実装するためのガイド
4ステップのフロー
ステップ 内容 Explore 要件を理解し、既存コードのパターンを調査 Plan テストケースと実装計画を作成 Code テスト→実装→リファクタリング(TDDサイクル) Commit 全テスト通過後にコミット 2つのモード
- Interactive: 都度ユーザーに確認
- Auto: 自動で進め、決定事項を記録
核心ルール
- テストを先に書く(RED→GREEN→REFACTOR)
- ドキュメントは
.sop/planning/、コードはリポジトリ本体に分離- 既存コードのスタイルに合わせる
- シンプルに保つ(YAGNI・KISS)
README に記載の通り、システムプロンプトにこの SOP を指定して実行してみます。今回は足し算を行うシンプルなスクリプトを作ってもらいました。
ログが長いので抜粋していますが、最初に与えた SOP の通りの手順を踏んで作業を行っていることがわかります。
また、各種ドキュメントが以下のように生成されていました。
中身はそれぞれこんな感じです。
以上のように、指示通りの手順でタスクを実行していることがわかりました。
おわりに
以上、簡単ではありましたが、Agent SOPs を試してみました。これくらいしっかり作り込まれていればうまく制御できそうですね。
今回は事前作成された SOP を利用させていただいた形ですが、カスタムしたものを使う際には、最初から完ぺきなものを作るのではなく、育てていく意識が重要そうです。
これからも触っていくことで理解を深めていきたいと思います。
ありがとうございました。










