0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

GitHub 9万スターの『superpowers』入門 — AIコーディングエージェントに『スキル』を与えて自律開発を実現する

0
Posted at

GitHub 9万スターの『superpowers』入門 — AIコーディングエージェントに『スキル』を与えて自律開発を実現する

AIエージェントにコードを書かせていると、こんな経験ありませんか。

「勝手に進められて、あとで見返したら全然違うものができている」

正直なところ、私も何度も経験しました。Claude Codeに「この機能を実装して」とお願いして、戻ってみたら想定と全然違う方向に進んでいる。テストは書かれていない。エラーハンドリングも雑。でも、全部自分で書くのは時間がかかるし...

そこで気づいたことがあります。

「エージェントに『やり方』を教える仕組みが必要なんじゃないか」

それが、今回紹介する superpowers です。GitHubで 92,100スター を獲得した、AIコーディングエージェント向けのスキルフレームワーク。Shellベースで軽量、Claude CodeやCursor、Codexなど複数のプラットフォームで動きます。

この記事では、superpowersの基本的な使い方から、TDDを強制する仕組み、サブエージェントによる自律開発、さらにはカスタムスキルの作り方まで解説します。


1. superpowersとは — 92,100スターの衝撃

まず、数字から見ていきましょう。

指標 数値
スター数 92,100
フォーク数 7,300
GitHubトレンド 2026年3月18日時点で#1
ライセンス MIT

これだけの数字が出るということは、何かが刺さっているということ。

superpowersは、Jesse Vincent氏が中心となって開発している、AIコーディングエージェント向けのスキルフレームワークです。特徴は3つあります。

Shellベースの軽量さ

Pythonでエージェントの振る舞いを制御しようとすると、どうしてもボイラープレートが増えます。仮想環境の管理、依存関係の解決、デプロイの手間...

superpowersはShellベースです。設定ファイルを置くだけで動きます。「インストール」といっても、プラグインマーケットプレイスからワンクリックで追加するだけのものが多い。

Pythonの requirements.txtpyproject.toml を気にする必要はありません。

クロスプラットフォーム対応

Claude Code、Cursor、Codex、OpenCode、Gemini CLI。主要なAIコーディングエージェントのほとんどに対応しています。

プラットフォーム インストール方法 難易度
Claude Code プラグインマーケットプレイス かんたん
Cursor プラグインマーケットプレイス かんたん
Codex 手動設定(INSTALL.mdを指定) ふつう
OpenCode 手動設定(INSTALL.mdを指定) ふつう
Gemini CLI 拡張機能コマンド かんたん

プラットフォームを乗り換えても、スキルはそのまま使える。これが意外と大きいです。ツールの移行コストって、設定の移行が大変なんですよね。superpowersなら、スキルは共通なので、ツールを変えても振る舞いは変わらない。

「スキル」という単位で振る舞いを定義

「TDDで開発してほしい」「体系的にデバッグしてほしい」「設計を深掘りしてほしい」。こうした振る舞いを、 SKILL.md というMarkdown形式で定義します。

エージェントがタスクを始める前に、自動的に該当するスキルを読み込んで実行する。明示的に「TDDでやって」と言わなくても、test-driven-developmentスキルが有効なら、自然とTDDで進むようになる。


2. 対応プラットフォームとインストール

まず、お使いの環境を確認しましょう。

Claude Codeの場合

Claude Codeには公式のプラグインマーケットプレイスがあります。そこからインストールします。

# まずマーケットプレイスを登録
/plugin marketplace add obra/superpowers-marketplace

# 次にプラグインをインストール
/plugin install superpowers@superpowers-marketplace

これだけで完了。マーケットプレイスを追加して、プラグインをインストールするだけです。

Cursorの場合

Cursorも同様に、プラグインマーケットプレイスからインストールできます。

/add-plugin superpowers

または、プラグインマーケットプレイスで「superpowers」を検索してインストール。Claude Codeと同じく、数クリックで完了です。

Codex / OpenCodeの場合

少し手間がかかります。インストール用のMarkdownファイルを指定して、そこから指示に従う必要があります。

Codex:

Codexに次のように伝えます:

Fetch and follow instructions from 
https://raw.githubusercontent.com/obra/superpowers/main/.codex/INSTALL.md

OpenCode:

OpenCodeも同様です:

Fetch and follow instructions from 
https://raw.githubusercontent.com/obra/superpowers/main/.opencode/INSTALL.md

Gemini CLIの場合

Gemini CLIは拡張機能としてインストールします:

gemini extensions install https://github.com/obra/superpowers

更新する場合は:

gemini extensions update superpowers

動作確認

インストールが終わったら、新しいセッションを開始して「この機能の設計を手伝って」と頼んでみましょう。

「brainstorming」スキルが自動的にトリガーされ、深掘りの質問が始まれば成功です。例えば:

  • 「この機能のゴールは何ですか?」
  • 「どのようなユーザーを想定していますか?」
  • 「既存の実装とどう違いますか?」

こうした質問が返ってくれば、superpowersは正しく動いています。


3. スキルの全体像 — 何ができるのか

superpowersには、現時点で以下のスキルが用意されています。

開発フロー系

スキル名 説明
brainstorming 設計の深掘り。Socraticな質問でアイデアを磨く
writing-plans タスクを2〜5分単位に分解
executing-plans 計画をバッチ実行(チェックポイント付き)
using-git-worktrees 隔離環境(worktree)で作業
finishing-a-development-branch ブランチの完了処理(マージ/PR/破棄)

品質管理系

スキル名 説明
test-driven-development TDD(RED-GREEN-REFACTOR)の強制
requesting-code-review タスク完了時の自動レビュー
receiving-code-review レビューフィードバックへの対応

デバッグ系

スキル名 説明
systematic-debugging 4フェーズの根本原因分析
verification-before-completion 完了前の動作検証

協調系

スキル名 説明
subagent-driven-development サブエージェントによる自律開発
dispatching-parallel-agents 並列エージェント実行

メタ系

スキル名 説明
writing-skills 新しいスキルの作り方ガイド

自動トリガーの仕組み

スキルは自動的にトリガーされます。明示的に呼び出す必要はありません。

例えば「この機能を実装して」と言えば、次のような流れになります:

  1. brainstorming が起動 → 設計を深掘り
  2. 設計が承認されると writing-plans が起動 → タスクを分解
  3. subagent-driven-development が起動 → 各タスクをサブエージェントで実行
  4. 各完了時に requesting-code-review が起動 → レビュー
  5. 全タスク完了後に finishing-a-development-branch が起動 → マージ判断

この「自動連鎖」が、superpowersの最大の特徴です。


4. TDDを強制する — test-driven-developmentスキル詳解

ここからは、特に重要なスキルを詳しく見ていきましょう。

まずは test-driven-development。名前の通り、TDD(テスト駆動開発)を強制するスキルです。

鉄則:テストなしにプロダクションコードは書かない

このスキルには、以下の「鉄則」が定義されています:

NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST

テスト前に書かれたコードは、どうなるか。

削除されます。

「参考として残す」もダメ。「テストを書きながら調整する」もダメ。見ることすらダメ。

本当に削除して、テストから書き直す。これがこのスキルの「鉄則」です。

RED-GREEN-REFACTORサイクル

TDDの基本サイクルは、次の3ステップです。

RED — 最初にテストを書く。テストは失敗する(まだ実装がないから)

GREEN — 最小限のコードを書いて、テストを通す

REFACTOR — コードを整理する

このサイクルを人間が守るのは、意外と大変です。「あとでテスト書けばいいや」と思って実装を進めてしまう。あるあるです。

superpowersのtest-driven-developmentスキルは、これを強制します。

テストの質を保証するガイドライン

このスキルには、テストの品質基準も含まれています:

品質 良い例 悪い例
最小性 1つのことをテスト。「and」が入るなら分割 test('validates email and domain and whitespace')
明確性 名前が振る舞いを説明 test('test1')
意図表示 期待するAPIを示す 何をテストしているか不明

なぜ「テスト後」ではダメなのか

このスキルのドキュメントには、よくある言い訳への反論が書かれています。

「後でテスト書けばいいでしょ」

テスト後に書かれたテストは、すぐに通ってしまいます。すぐに通るということは、何も証明していないということです。

  • 間違ったものをテストしているかもしれない
  • 実装の詳細をテストしているかもしれない
  • エッジケースを忘れているかもしれない
  • テストがバグを検知したところを見ていない

「手動でテストしたから大丈夫」

手動テストは場当たり的です。何をテストしたか記録に残らない。コードが変わったとき再実行できない。プレッシャーのかかった状況では忘れがち。

自動テストは体系的です。毎回同じように実行されます。


5. サブエージェントで数時間の自律開発

次に、 subagent-driven-development。これが個人的に一番ワクワクした機能です。

仕組み

エージェントがタスク計画を実行する際、各タスクごとに「新しくサブエージェント」を起動します。

サブエージェントは、そのタスクだけに集中して実行。完了したら、メインエージェントがレビューして、次のタスクに進む。

この 2段階レビュー が重要です。

  1. 仕様準拠チェック — 計画通りに実装されているか
  2. コード品質チェック — 命名、構造、テストなど

何が嬉しいのか

  • 数時間、エージェントを放置できる
  • 途中で人が介入しなくても、品質が保たれる
  • 大きな機能開発も、小さなタスクに分解して進められる

実践例:ユーザー認証機能を追加する

例えば、「ユーザー認証機能を追加して」とお願いしたとします。

そうすると、次のような流れで進みます:

1. brainstormingで設計を深掘り

エージェント: この機能のゴールは何ですか?
あなた: 既存のアプリにJWT認証を追加したいです
エージェント: パスワードリセットは必要ですか?
あなた: はい、メールでリセットリンクを送りたいです
エージェント: ソーシャルログイン(Google等)の要否は?
あなた: 今回は不要です
...

2. writing-plansでタスクを分解

タスク1: Userモデルの作成(3分)
タスク2: パスワードハッシュ化(2分)
タスク3: ログインエンドポイント(5分)
タスク4: JWT生成(3分)
タスク5: 認証ミドルウェア(4分)
タスク6: パスワードリセットメール(5分)
...
(合計20タスク)

3. subagent-driven-developmentが各タスクを実行

各タスクでサブエージェントが起動:

  • テストを書く
  • 実装する
  • テストを通す
  • 完了報告

メインエージェントがレビュー:

  • 仕様通りか確認
  • コード品質確認
  • 問題なければ次へ

4. 全タスク完了後に統合テスト

この流れが、人の介入なしで進みます。

コストについて

サブエージェントを使うと、APIコストは積み上がります。試算してみましょう。

前提条件:

  • タスク数: 20個
  • 1タスクあたりのトークン: 入力10,000 / 出力5,000
  • モデル: Claude Sonnet 4.6(入力$3/1M、出力$15/1M)

計算:

  • 入力: 20 × 10,000 = 200,000 tokens → $0.6
  • 出力: 20 × 5,000 = 100,000 tokens → $1.5
  • 合計: $2.1

1回の機能開発で$2程度。これを高いと見るか、安いと見るか。自分で全部書く時間を考えると、コストは妥当かもしれません。


6. カスタムスキルの作り方

superpowersの面白さは、自分でスキルを作れることです。

SKILL.mdの構造

スキルは、 SKILL.md というMarkdownファイルで定義します。実際の構造を見てみましょう。

---
name: my-custom-skill
description: "スキルの説明。トリガー条件を含める"
---

# スキルのタイトル

## 概要

エージェントに読み込ませる指示をここに書きます。

## プロセス

1. 最初にやること
2. 次にやること
3. 最後にやること

## チェックリスト

- [ ] 項目1
- [ ] 項目2

## 注意点

- 注意すべきこと1
- 注意すべきこと2

YAMLフロントマターに namedescription を書き、本文に指示を書きます。

強制ルールの定義

<HARD-GATE> タグを使うと、絶対に守るべきルールを定義できます。

<HARD-GATE>
このスキルが有効な間、絶対にXXしてはいけない。
</HARD-GATE>

brainstormingスキルでは、このように使われています:

<HARD-GATE>
Do NOT invoke any implementation skill, write any code, 
scaffold any project, or take any implementation action 
until you have presented a design and the user has approved it.
</HARD-GATE>

作成手順

カスタムスキルを作る手順は、次の通りです:

  1. skills/ ディレクトリに新しいフォルダを作る

    skills/
    └── my-custom-skill/
        └── SKILL.md
    
  2. SKILL.mdを記述する

    • スキル名と説明
    • トリガー条件(descriptionに含める)
    • エージェントへの指示
  3. writing-skillsスキルを参照する

    • superpowersには、スキルの書き方を教える「writing-skills」というスキルがあります
    • これを参照すると、ベストプラクティスに従ったスキルが作れます
  4. テストして調整する

    • 実際にエージェントに使わせてみる
    • 振る舞いが期待通りでない場合は調整する

コミュニティへの共有

作ったスキルは、GitHubでフォークしてPRを送ることで共有できます。

superpowersのスキールは、すべてリポジトリ内の skills/ ディレクトリに存在しています。コントリビュートのハードルが低いのも特徴です。

「自分のプロジェクトで便利なスキルを作った」 → 「共有する」 → 「他の人も使える」 という循環が生まれやすい構造です。


7. コスト・セキュリティ・ベストプラクティス

最後に、注意点を整理しておきましょう。

APIコスト

subagent-driven-developmentを使うと、複数のサブエージェントが同時に動きます。APIコストは積み上がります。

事前に見積もりを立てておくのが賢明です。確認すべきポイント:

  • 1時間の自律開発で、どのくらいのトークン消費になるか
  • 使用するモデルのコスト単価
  • 1日の予算上限

目安として、中規模の機能開発で$2〜5程度かかることが多いです。

セキュリティ

エージェントがコードを書き換えるため、意図しない変更が入るリスクがあります。

対策として:

  • git worktreesで隔離環境を使う — using-git-worktreesスキルが自動でやってくれます
  • 変更は必ずレビューする — requesting-code-reviewスキルで強制できます
  • 本番環境への直接アクセスを避ける — エージェントには開発環境のみ見せる

チーム導入のベストプラクティス

チームで使う場合は、以下を検討しましょう:

  • スキルのバージョン管理 — どのバージョンのスキルを使うか統一する
  • カスタムスキルの共有方法 — プロジェクト固有のスキルをどう配布するか
  • コーディング規約との整合性 — スキルの指示が規約と矛盾しないか
  • レビュー体制 — エージェントが書いたコードを誰がレビューするか

まとめ — 明日から始める「スーパーパワー」ライフ

この記事では、GitHubで92,100スターを獲得したsuperpowersについて解説しました。

要点を振り返ると:

  • superpowersは、AIコーディングエージェントに「スキル」を与えるフレームワーク
  • Shellベースで軽量、複数のプラットフォームに対応
  • TDDを強制したり、サブエージェントで自律開発したりできる
  • カスタムスキルを作って共有することも可能

まずは、お使いのエージェントにインストールして、「この機能の設計を手伝って」と頼んでみるところから始めてみてください。brainstormingスキルが自動的に起動して、深掘りの質問が始まります。

そこから、あなたのエージェントが少しずつ「スーパーパワー」を身につけていくはずです。


参考リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?