GitHub 9万スターの『superpowers』入門 — AIコーディングエージェントに『スキル』を与えて自律開発を実現する
AIエージェントにコードを書かせていると、こんな経験ありませんか。
「勝手に進められて、あとで見返したら全然違うものができている」
正直なところ、私も何度も経験しました。Claude Codeに「この機能を実装して」とお願いして、戻ってみたら想定と全然違う方向に進んでいる。テストは書かれていない。エラーハンドリングも雑。でも、全部自分で書くのは時間がかかるし...
そこで気づいたことがあります。
「エージェントに『やり方』を教える仕組みが必要なんじゃないか」
それが、今回紹介する superpowers です。GitHubで 92,100スター を獲得した、AIコーディングエージェント向けのスキルフレームワーク。Shellベースで軽量、Claude CodeやCursor、Codexなど複数のプラットフォームで動きます。
この記事では、superpowersの基本的な使い方から、TDDを強制する仕組み、サブエージェントによる自律開発、さらにはカスタムスキルの作り方まで解説します。
1. superpowersとは — 92,100スターの衝撃
まず、数字から見ていきましょう。
| 指標 | 数値 |
|---|---|
| スター数 | 92,100 |
| フォーク数 | 7,300 |
| GitHubトレンド | 2026年3月18日時点で#1 |
| ライセンス | MIT |
これだけの数字が出るということは、何かが刺さっているということ。
superpowersは、Jesse Vincent氏が中心となって開発している、AIコーディングエージェント向けのスキルフレームワークです。特徴は3つあります。
Shellベースの軽量さ
Pythonでエージェントの振る舞いを制御しようとすると、どうしてもボイラープレートが増えます。仮想環境の管理、依存関係の解決、デプロイの手間...
superpowersはShellベースです。設定ファイルを置くだけで動きます。「インストール」といっても、プラグインマーケットプレイスからワンクリックで追加するだけのものが多い。
Pythonの requirements.txt や pyproject.toml を気にする必要はありません。
クロスプラットフォーム対応
Claude Code、Cursor、Codex、OpenCode、Gemini CLI。主要なAIコーディングエージェントのほとんどに対応しています。
| プラットフォーム | インストール方法 | 難易度 |
|---|---|---|
| Claude Code | プラグインマーケットプレイス | かんたん |
| Cursor | プラグインマーケットプレイス | かんたん |
| Codex | 手動設定(INSTALL.mdを指定) | ふつう |
| OpenCode | 手動設定(INSTALL.mdを指定) | ふつう |
| Gemini CLI | 拡張機能コマンド | かんたん |
プラットフォームを乗り換えても、スキルはそのまま使える。これが意外と大きいです。ツールの移行コストって、設定の移行が大変なんですよね。superpowersなら、スキルは共通なので、ツールを変えても振る舞いは変わらない。
「スキル」という単位で振る舞いを定義
「TDDで開発してほしい」「体系的にデバッグしてほしい」「設計を深掘りしてほしい」。こうした振る舞いを、 SKILL.md というMarkdown形式で定義します。
エージェントがタスクを始める前に、自動的に該当するスキルを読み込んで実行する。明示的に「TDDでやって」と言わなくても、test-driven-developmentスキルが有効なら、自然とTDDで進むようになる。
2. 対応プラットフォームとインストール
まず、お使いの環境を確認しましょう。
Claude Codeの場合
Claude Codeには公式のプラグインマーケットプレイスがあります。そこからインストールします。
# まずマーケットプレイスを登録
/plugin marketplace add obra/superpowers-marketplace
# 次にプラグインをインストール
/plugin install superpowers@superpowers-marketplace
これだけで完了。マーケットプレイスを追加して、プラグインをインストールするだけです。
Cursorの場合
Cursorも同様に、プラグインマーケットプレイスからインストールできます。
/add-plugin superpowers
または、プラグインマーケットプレイスで「superpowers」を検索してインストール。Claude Codeと同じく、数クリックで完了です。
Codex / OpenCodeの場合
少し手間がかかります。インストール用のMarkdownファイルを指定して、そこから指示に従う必要があります。
Codex:
Codexに次のように伝えます:
Fetch and follow instructions from
https://raw.githubusercontent.com/obra/superpowers/main/.codex/INSTALL.md
OpenCode:
OpenCodeも同様です:
Fetch and follow instructions from
https://raw.githubusercontent.com/obra/superpowers/main/.opencode/INSTALL.md
Gemini CLIの場合
Gemini CLIは拡張機能としてインストールします:
gemini extensions install https://github.com/obra/superpowers
更新する場合は:
gemini extensions update superpowers
動作確認
インストールが終わったら、新しいセッションを開始して「この機能の設計を手伝って」と頼んでみましょう。
「brainstorming」スキルが自動的にトリガーされ、深掘りの質問が始まれば成功です。例えば:
- 「この機能のゴールは何ですか?」
- 「どのようなユーザーを想定していますか?」
- 「既存の実装とどう違いますか?」
こうした質問が返ってくれば、superpowersは正しく動いています。
3. スキルの全体像 — 何ができるのか
superpowersには、現時点で以下のスキルが用意されています。
開発フロー系
| スキル名 | 説明 |
|---|---|
| brainstorming | 設計の深掘り。Socraticな質問でアイデアを磨く |
| writing-plans | タスクを2〜5分単位に分解 |
| executing-plans | 計画をバッチ実行(チェックポイント付き) |
| using-git-worktrees | 隔離環境(worktree)で作業 |
| finishing-a-development-branch | ブランチの完了処理(マージ/PR/破棄) |
品質管理系
| スキル名 | 説明 |
|---|---|
| test-driven-development | TDD(RED-GREEN-REFACTOR)の強制 |
| requesting-code-review | タスク完了時の自動レビュー |
| receiving-code-review | レビューフィードバックへの対応 |
デバッグ系
| スキル名 | 説明 |
|---|---|
| systematic-debugging | 4フェーズの根本原因分析 |
| verification-before-completion | 完了前の動作検証 |
協調系
| スキル名 | 説明 |
|---|---|
| subagent-driven-development | サブエージェントによる自律開発 |
| dispatching-parallel-agents | 並列エージェント実行 |
メタ系
| スキル名 | 説明 |
|---|---|
| writing-skills | 新しいスキルの作り方ガイド |
自動トリガーの仕組み
スキルは自動的にトリガーされます。明示的に呼び出す必要はありません。
例えば「この機能を実装して」と言えば、次のような流れになります:
- brainstorming が起動 → 設計を深掘り
- 設計が承認されると writing-plans が起動 → タスクを分解
- subagent-driven-development が起動 → 各タスクをサブエージェントで実行
- 各完了時に requesting-code-review が起動 → レビュー
- 全タスク完了後に finishing-a-development-branch が起動 → マージ判断
この「自動連鎖」が、superpowersの最大の特徴です。
4. TDDを強制する — test-driven-developmentスキル詳解
ここからは、特に重要なスキルを詳しく見ていきましょう。
まずは test-driven-development。名前の通り、TDD(テスト駆動開発)を強制するスキルです。
鉄則:テストなしにプロダクションコードは書かない
このスキルには、以下の「鉄則」が定義されています:
NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST
テスト前に書かれたコードは、どうなるか。
削除されます。
「参考として残す」もダメ。「テストを書きながら調整する」もダメ。見ることすらダメ。
本当に削除して、テストから書き直す。これがこのスキルの「鉄則」です。
RED-GREEN-REFACTORサイクル
TDDの基本サイクルは、次の3ステップです。
RED — 最初にテストを書く。テストは失敗する(まだ実装がないから)
GREEN — 最小限のコードを書いて、テストを通す
REFACTOR — コードを整理する
このサイクルを人間が守るのは、意外と大変です。「あとでテスト書けばいいや」と思って実装を進めてしまう。あるあるです。
superpowersのtest-driven-developmentスキルは、これを強制します。
テストの質を保証するガイドライン
このスキルには、テストの品質基準も含まれています:
| 品質 | 良い例 | 悪い例 |
|---|---|---|
| 最小性 | 1つのことをテスト。「and」が入るなら分割 | test('validates email and domain and whitespace') |
| 明確性 | 名前が振る舞いを説明 | test('test1') |
| 意図表示 | 期待するAPIを示す | 何をテストしているか不明 |
なぜ「テスト後」ではダメなのか
このスキルのドキュメントには、よくある言い訳への反論が書かれています。
「後でテスト書けばいいでしょ」
テスト後に書かれたテストは、すぐに通ってしまいます。すぐに通るということは、何も証明していないということです。
- 間違ったものをテストしているかもしれない
- 実装の詳細をテストしているかもしれない
- エッジケースを忘れているかもしれない
- テストがバグを検知したところを見ていない
「手動でテストしたから大丈夫」
手動テストは場当たり的です。何をテストしたか記録に残らない。コードが変わったとき再実行できない。プレッシャーのかかった状況では忘れがち。
自動テストは体系的です。毎回同じように実行されます。
5. サブエージェントで数時間の自律開発
次に、 subagent-driven-development。これが個人的に一番ワクワクした機能です。
仕組み
エージェントがタスク計画を実行する際、各タスクごとに「新しくサブエージェント」を起動します。
サブエージェントは、そのタスクだけに集中して実行。完了したら、メインエージェントがレビューして、次のタスクに進む。
この 2段階レビュー が重要です。
- 仕様準拠チェック — 計画通りに実装されているか
- コード品質チェック — 命名、構造、テストなど
何が嬉しいのか
- 数時間、エージェントを放置できる
- 途中で人が介入しなくても、品質が保たれる
- 大きな機能開発も、小さなタスクに分解して進められる
実践例:ユーザー認証機能を追加する
例えば、「ユーザー認証機能を追加して」とお願いしたとします。
そうすると、次のような流れで進みます:
1. brainstormingで設計を深掘り
エージェント: この機能のゴールは何ですか?
あなた: 既存のアプリにJWT認証を追加したいです
エージェント: パスワードリセットは必要ですか?
あなた: はい、メールでリセットリンクを送りたいです
エージェント: ソーシャルログイン(Google等)の要否は?
あなた: 今回は不要です
...
2. writing-plansでタスクを分解
タスク1: Userモデルの作成(3分)
タスク2: パスワードハッシュ化(2分)
タスク3: ログインエンドポイント(5分)
タスク4: JWT生成(3分)
タスク5: 認証ミドルウェア(4分)
タスク6: パスワードリセットメール(5分)
...
(合計20タスク)
3. subagent-driven-developmentが各タスクを実行
各タスクでサブエージェントが起動:
- テストを書く
- 実装する
- テストを通す
- 完了報告
メインエージェントがレビュー:
- 仕様通りか確認
- コード品質確認
- 問題なければ次へ
4. 全タスク完了後に統合テスト
この流れが、人の介入なしで進みます。
コストについて
サブエージェントを使うと、APIコストは積み上がります。試算してみましょう。
前提条件:
- タスク数: 20個
- 1タスクあたりのトークン: 入力10,000 / 出力5,000
- モデル: Claude Sonnet 4.6(入力$3/1M、出力$15/1M)
計算:
- 入力: 20 × 10,000 = 200,000 tokens → $0.6
- 出力: 20 × 5,000 = 100,000 tokens → $1.5
- 合計: $2.1
1回の機能開発で$2程度。これを高いと見るか、安いと見るか。自分で全部書く時間を考えると、コストは妥当かもしれません。
6. カスタムスキルの作り方
superpowersの面白さは、自分でスキルを作れることです。
SKILL.mdの構造
スキルは、 SKILL.md というMarkdownファイルで定義します。実際の構造を見てみましょう。
---
name: my-custom-skill
description: "スキルの説明。トリガー条件を含める"
---
# スキルのタイトル
## 概要
エージェントに読み込ませる指示をここに書きます。
## プロセス
1. 最初にやること
2. 次にやること
3. 最後にやること
## チェックリスト
- [ ] 項目1
- [ ] 項目2
## 注意点
- 注意すべきこと1
- 注意すべきこと2
YAMLフロントマターに name と description を書き、本文に指示を書きます。
強制ルールの定義
<HARD-GATE> タグを使うと、絶対に守るべきルールを定義できます。
<HARD-GATE>
このスキルが有効な間、絶対にXXしてはいけない。
</HARD-GATE>
brainstormingスキルでは、このように使われています:
<HARD-GATE>
Do NOT invoke any implementation skill, write any code,
scaffold any project, or take any implementation action
until you have presented a design and the user has approved it.
</HARD-GATE>
作成手順
カスタムスキルを作る手順は、次の通りです:
-
skills/ ディレクトリに新しいフォルダを作る
skills/ └── my-custom-skill/ └── SKILL.md -
SKILL.mdを記述する
- スキル名と説明
- トリガー条件(descriptionに含める)
- エージェントへの指示
-
writing-skillsスキルを参照する
- superpowersには、スキルの書き方を教える「writing-skills」というスキルがあります
- これを参照すると、ベストプラクティスに従ったスキルが作れます
-
テストして調整する
- 実際にエージェントに使わせてみる
- 振る舞いが期待通りでない場合は調整する
コミュニティへの共有
作ったスキルは、GitHubでフォークしてPRを送ることで共有できます。
superpowersのスキールは、すべてリポジトリ内の skills/ ディレクトリに存在しています。コントリビュートのハードルが低いのも特徴です。
「自分のプロジェクトで便利なスキルを作った」 → 「共有する」 → 「他の人も使える」 という循環が生まれやすい構造です。
7. コスト・セキュリティ・ベストプラクティス
最後に、注意点を整理しておきましょう。
APIコスト
subagent-driven-developmentを使うと、複数のサブエージェントが同時に動きます。APIコストは積み上がります。
事前に見積もりを立てておくのが賢明です。確認すべきポイント:
- 1時間の自律開発で、どのくらいのトークン消費になるか
- 使用するモデルのコスト単価
- 1日の予算上限
目安として、中規模の機能開発で$2〜5程度かかることが多いです。
セキュリティ
エージェントがコードを書き換えるため、意図しない変更が入るリスクがあります。
対策として:
- git worktreesで隔離環境を使う — using-git-worktreesスキルが自動でやってくれます
- 変更は必ずレビューする — requesting-code-reviewスキルで強制できます
- 本番環境への直接アクセスを避ける — エージェントには開発環境のみ見せる
チーム導入のベストプラクティス
チームで使う場合は、以下を検討しましょう:
- スキルのバージョン管理 — どのバージョンのスキルを使うか統一する
- カスタムスキルの共有方法 — プロジェクト固有のスキルをどう配布するか
- コーディング規約との整合性 — スキルの指示が規約と矛盾しないか
- レビュー体制 — エージェントが書いたコードを誰がレビューするか
まとめ — 明日から始める「スーパーパワー」ライフ
この記事では、GitHubで92,100スターを獲得したsuperpowersについて解説しました。
要点を振り返ると:
- superpowersは、AIコーディングエージェントに「スキル」を与えるフレームワーク
- Shellベースで軽量、複数のプラットフォームに対応
- TDDを強制したり、サブエージェントで自律開発したりできる
- カスタムスキルを作って共有することも可能
まずは、お使いのエージェントにインストールして、「この機能の設計を手伝って」と頼んでみるところから始めてみてください。brainstormingスキルが自動的に起動して、深掘りの質問が始まります。
そこから、あなたのエージェントが少しずつ「スーパーパワー」を身につけていくはずです。
参考リンク
- GitHub: obra/superpowers — 公式リポジトリ
- Discord コミュニティ — 質問・情報共有
- Jesse Vincent's Blog — 作者による解説記事