はじめに
Y Combinator代表のGarry Tanが、60日間で60万行のコードを書いたClaude Codeワークフローをオープンソース化しました。そのツールが「gstack」です。
公開から48時間でGitHub Stars 10,000を突破し、2026年3月時点でもっとも注目を集めているClaude Code拡張の一つとなっています。
本記事では、gstackの設計思想・全スキル一覧・インストール手順・実践的なワークフローを公式情報をもとに解説します。
この記事で学べること
- gstackが解決する「単一AIアシスタント問題」とは何か
- 15以上のスラッシュコマンドスキルの役割と使い方
- インストールから実践投入までのステップ
- 安全ガードレール(
/careful・/freeze・/guard)の活用法
対象読者
- Claude Codeを業務で使っているエンジニア
- AIエージェントを活用した開発効率化に関心がある方
- オープンソースのAI開発ワークフローを探している方
前提環境
- Claude Code(インストール済み)
- Git
- Bun v1.0 以上
TL;DR
- gstackはClaude Codeを「CEO・EM・QA・Release Manager」など役割別AIチームに分割するスキルフレームワーク
- インストールはgit clone 1コマンド、CLAUDE.mdに設定ブロックを追加するだけ
- Garry Tan本人が60日間で600K行(35%テスト)を生産したワークフローを完全公開
- MIT ライセンス、GitHub: garrytan/gstack
gstackとは
「単一AIアシスタント問題」を役割分担で解決
従来のAIコーディングツールは、単一のジェネリストとして動作します。設計・実装・レビュー・テストを同じモデルが担うため、文脈によって出力品質のブレが生じます。
gstackのアプローチは異なります。ソフトウェア開発ライフサイクルを専門領域ごとに分割し、それぞれに特化したClaude Code「役割」を割り当てるという設計です。
実際のエンジニアリングチームに倣った発想です。QAエンジニアはプロダクトリードとは異なる視点で問題を見ます。gstackの各スキルはその思考モデルをClaude Codeの中に再現します。
Garry Tanの実績
60日間で600K+ 行の本番コード(35%がテストコード)、1日10K〜20K行を記録
— GitHub - garrytan/gstack
Garry TanはYC代表として多忙な本業を抱えながら、gstackを使ってこの数字を達成しています。直近7日間のデータでは140,751行追加・362コミット・約115K行のネット増加が記録されています。
全スキル一覧
gstackは以下のスラッシュコマンドスキルを提供します。
計画・設計フェーズ
| スキル | 役割 | 主な用途 |
|---|---|---|
/office-hours |
アドバイザー | 自由な相談・ブレインストーミング |
/plan-ceo-review |
CEO視点レビュー | 「正しいものを作っているか?」を検証 |
/plan-eng-review |
EMレビュー | アーキテクチャ・障害モード・テストカバレッジの設計 |
/plan-design-review |
デザインレビュー | UIの設計方針確認 |
/design-consultation |
デザインコンサルタント | 競合調査・モックアップ生成・DESIGN.md作成 |
/autoplan |
自動計画 | タスク分解と実装計画の自動生成 |
実装・レビューフェーズ
| スキル | 役割 | 主な用途 |
|---|---|---|
/review |
シニアエンジニア | CIを通過するバグ(N+1・競合状態・信頼境界違反)を発見 |
/careful |
安全監視 | 破壊的コマンド実行前に警告 |
/freeze |
変更ロック | 1ディレクトリに変更を制限してデバッグ |
/guard |
複合ガード |
/careful + /freeze を同時有効化 |
/investigate |
調査モード | 調査対象モジュールを自動フリーズして深掘り |
/codex |
Codex連携 | OpenAI Codex エージェントとの統合タスク |
テスト・QAフェーズ
| スキル | 役割 | 主な用途 |
|---|---|---|
/qa |
QAエンジニア | 差分を読んでブラウザで影響ページを全テスト |
/qa-only |
QA専念モード | 実装なし・QAのみ実行 |
/benchmark |
ベンチマーク | パフォーマンス計測・ボトルネック特定 |
デプロイ・リリースフェーズ
| スキル | 役割 | 主な用途 |
|---|---|---|
/ship |
Release Manager | main同期・テスト・push・PR作成を一括実行 |
/land-and-deploy |
デプロイ担当 | PRマージからデプロイまでを自動化 |
/canary |
カナリアリリース | 段階的ロールアウトの管理 |
/document-release |
ドキュメント担当 | リリースノート・変更ログの自動生成 |
ユーティリティ
| スキル | 役割 | 主な用途 |
|---|---|---|
/browse |
ブラウザ操作 | Web検索・スクレイピング(gstack推奨のブラウザ制御) |
/retro |
ふりかえり | コミット・LOC・品質サマリーの集計 |
/design-review |
デザイン確認 | 実装後のUI検証 |
/cso |
カスタマーサクセス | ユーザーフィードバック分析 |
/unfreeze |
ロック解除 |
/freeze 状態の解除 |
/setup-browser-cookies |
ブラウザ設定 | 認証クッキーのセットアップ |
/setup-deploy |
デプロイ設定 | デプロイ環境の初期設定 |
/gstack-upgrade |
アップグレード | gstack自体のバージョン更新 |
インストール手順
グローバルインストール(全プロジェクトで使用)
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack \
&& cd ~/.claude/skills/gstack \
&& ./setup
その後、~/.claude/CLAUDE.md にgstackセクションを追加します。
プロジェクト別インストール(特定リポジトリのみ)
cp -Rf ~/.claude/skills/gstack .claude/skills/gstack \
&& rm -rf .claude/skills/gstack/.git \
&& cd .claude/skills/gstack \
&& ./setup
プロジェクトルートの CLAUDE.md に以下のブロックを追加します。
## gstack
Web閲覧はすべて `/browse` スキルを使用する(`mcp__claude-in-chrome__*` ツールは使わない)。
利用可能なスキル:
- /plan-ceo-review — プロダクト方向性のレビュー
- /plan-eng-review — アーキテクチャ設計レビュー
- /review — コードレビュー(CI通過バグを発見)
- /ship — テスト・push・PR作成を一括実行
- /qa — ブラウザでの自動QAテスト
- /careful — 破壊的コマンドの事前警告
- /freeze — 変更範囲を1ディレクトリに制限
インストールが機能しない場合は cd .claude/skills/gstack && ./setup を再実行します。
インストール全体は .claude/ ディレクトリに閉じており、グローバル環境を汚染しません。
実践ワークフロー
フィーチャー実装の標準フロー
Garry Tanが実際に使っているシーケンスです。
1. /plan-ceo-review → 「正しいものを作っているか?」を確認
2. /plan-eng-review → アーキテクチャ・テスト設計
3. 実装
4. /review → CIを通過するバグを発見・修正
5. /ship → mainと同期 → テスト → push → PR
6. /qa → 変更差分を読んでブラウザでテスト
各役割の出力は次のフェーズの自然なコンテキストになります。CEO視点の要件定義がEMのアーキテクチャ設計を導き、それが実装を導きます。この順序づけによりリビジョンサイクルが減少します。
安全ガードレールの使い方
デバッグ中に意図しないファイルが変更されることへの対策として、gstackには3種類のガードレールが用意されています。
| シナリオ | 使用スキル |
|---|---|
rm -rf や DROP TABLE などの破壊的コマンドを実行する前に警告が欲しい |
/careful |
| 特定ディレクトリ以外を変更させたくない | /freeze |
| 両方同時に有効にしたい | /guard |
# 調査中は調査対象モジュールへの変更を自動ロック
/investigate
並列セッション(Conductor)
Conductorを使うと複数のClaude Codeセッションを並列実行できます。各セッションは独立したワークスペースで動作します。
例:
- セッション1:
/office-hoursで新機能を検討 - セッション2:
/reviewでPRをレビュー - セッション3: フィーチャー実装
- セッション4:
/qaでステージング環境をテスト
Garry Tan本人はこの並列実行によって1日の処理量を6ワーカーから12ワーカーへ倍増させたと報告しています1。
設計上の注意点
トークンコストへの対処
役割をチェーンして使用するとトークンと APIコストが累積します。複雑なフィーチャーでは、コンテキスト長が問題になる場合はセッションを分割することが推奨されています2。
LOCメトリクスの解釈
600K行という数字は、AIが生成したコードと35%のテストコードを含みます。コード行数は品質と直結しないため、構造化されたレビュー・テストプロセスと組み合わせて活用することが前提です。
Superpowersとの違い
同カテゴリのフレームワークとして Superpowers が存在しますが、gstackはGarry Tanの特定のワークフロー・思想・スコープを直接エンコードしている点が異なります。「特定の人物の意思決定プロセスを再現する」というコンセプトが独自です。
まとめ
- gstackはClaude Codeを役割ベースの仮想開発チームに変換するオープンソーススキルフレームワーク
- CEO→EM→QA→Release Managerへの順序立てたチェーンが、AIの出力品質と一貫性を高める
-
/careful・/freeze・/guardによる安全ガードレールで本番環境へのリスクを低減 - MIT ライセンス・インストール1コマンドで即導入可能
- 定量的な効果: YC代表が60日間で600K行を達成した実証済みワークフロー
Claude Codeを使った開発効率化を追求するエンジニアにとって、gstackは最初に試すべきワークフロー拡張の一つです。
参考リンク
- garrytan/gstack — GitHub — 公式リポジトリ
- GStack Tutorial: Garry Tan's Claude Code Workflow — SitePoint
- gstack Fully Explained — YouMind Blog
- gstack Setup Install Guide — gstacks.org(非公式解説サイト)
-
GitHub - garrytan/gstack README —
/retroコマンドの集計データより ↩