Claude Codeにサービスをまるっと自律開発させてみた話
はじめに
「AIを使って開発する」ではなく、「AIにサービス開発を任せる」を試してみました。
コードを書くだけじゃなく、マーケティング・ツイート投稿・note記事作成・QAリサーチ・開発タスク管理まで、一人のエンジニアが担う作業のほぼ全部をClaude Codeの自律エージェントに委ねた実験です。
作ったサービスは OSHIRIAI — 恋愛・対人関係に特化したMBTI診断 × AI恋愛相談サービスです。
相談LLMに意識をもたせる論文、心理論文やLLMワークフローを取り込んでいて、意外にしっかりしてます。
前提条件
初期開発、Antigravity, Claude Code, Cursorと人間(私)の協力によって作っています。
Agentを完全自律させる前に、gitHub Actionでrevision upやECR imageのAWSのpushなど
CI/CDは人間が作り込んでいます。
AI Agentが自由に自律できる最低限の環境構築は、人間によって提供されています。
自律開発のアーキテクチャ
基本思想:Claude Codeのスラッシュコマンド = エージェント定義
Claude Codeには .claude/commands/ にMarkdownを置くと、/コマンド名 でそのプロンプトを呼び出せる機能があります。これをエージェント定義のSSoTとして使いました。
.claude/commands/
├── qa-agent.md # QA Agent
├── mk-agent.md # Marketing Agent
├── note-agent.md # Note Agent
├── tiktok-agent.md # TikTok Agent
├── dev-agent.md # Dev Agent
├── pm-agent.md # PM Agent
└── analysis-agent.md # Analysis Agent
共有状態は agents/shared/state.json に集約。エージェント間のデータのやり取りはすべてこのファイル経由です。
エージェント構成
┌─────────────────────────────────────────────────────┐
│ PM Agent │
│ 全エージェントの統括・GitHub Issues作成・優先度管理 │
└──────────┬─────────────┬──────────────┬─────────────┘
│ │ │
┌──────▼──────┐ ┌───▼────────┐ ┌──▼──────────────┐
│ QA Agent │ │ MK Agent │ │ Dev Agent │
│ │ │ │ │ │
│ ・Twitter │ │ ・ツイート │ │ ・Issue → PR │
│ メトリクス│ │ 投稿 │ │ ・実装 → テスト │
│ ・バグ発見 │ │ ・Note記事 │ │ ・コード品質管理 │
│ ・リサーチ │ │ ・TikTok │ └──────────────────┘
│ ・ツイート │ └────────────┘
│ 戦略提案 │ ▲
└─────────────┘ │
│ │ QAが研究・データを渡す
└───────────────┘
▼
┌──────────────────┐
│ Analysis Agent │
│ パフォーマンス分析│
│ 中長期戦略考察 │
└──────────────────┘
QA Agent(品質保証 + マーケ戦略)
一番仕事量が多いエージェントです。
- Twitterのメトリクスを取得・分析(Twitter API v2)
- 恋愛MBTI関連の研究・統計データをWebSearchで収集
- 過去ツイートのパフォーマンスを分析して「なぜバズったか/バズらなかったか」を言語化
- 次回ツイートの案を3つ + note記事案を2つ + ticktok動画案を1つ提案
- 発見したバグや改善点をfindingsとして記録
// state.json の qa セクション(抜粋)
{
"qa": {
"tweetStrategy": {
"proposals": [
{
"text": "ツイート案...",
"sourceURL": "https://...",
"hook": "フックの説明",
"reasoning": "バズる根拠",
"imagePrompt": "DALL-E用プロンプト"
}
],
"tweetMaterials": [...],
"bestTimeJST": "20:00"
}
}
}
MK Agent(マーケティング実行)
QAの分析・提案を受け取って実際に投稿します。
- QAが提案したツイート案から最適なものを選択
- DALL-E 3で画像生成(URLなしの場合)
- Twitter API v2で投稿
- note.com にPlaywrightで記事投稿
- 投稿後に
tweet-history.jsonへ記録
コンテンツストック管理という仕組みも作りました。AIシミュレーション機能で生成した著名人の仮想対話(例:「ひろゆき(ENTP) × ホリエモン(ENTJ)」のシミュレーション)をShareURLとともに content-stock.json に溜めておいて、MK Agentが順番に使っていく形です。
// content-stock.json
{
"id": "sim-hiroyuki-horie",
"type": "simulation",
"shareURL": "https://oshiriai.com/share/xxx",
"personaNames": ["ひろゆき", "ホリエモン"],
"highlight": "価値観の根本的な対立がリアル",
"usedAt": null
}
Dev Agent(開発実行)
GitHub Issuesを見てPRを作ります。PM Agentが優先度付きでIssueを作り、Dev Agentがそれを実装する流れです。
サービスの変遷
v0.0.4〜0.0.7(2026年2月):まず動くものを
初期は「MBTI診断」と「AIお悩み相談」のみ。インフラ(AWS CDK + ECS)のセットアップと基本機能の実装をClaude Codeが担いました。
この時期の主な作業:
- Next.js + Express/tsoaのモノレポ構成
- AWS CDK でのインフラ構築(ECS, RDS, CloudFront)
- 性格診断50問の実装
- Mastra Agentフレームワークを使ったAIチャット基盤
v0.0.8〜0.0.9(2026年2月〜3月):AIシミュレーション登場
「自分と相手のMBTIタイプを入力すると、AIが2人の仮想対話をシミュレートする」機能を追加。
これがOshiriaiの最大の差別化ポイントになります。
本当に差別化なのかしらないけど、Claudeさんはそう言ってます。
告白シーン・喧嘩・仲直りといったシナリオをAIが生成し、付き合う前に「もしも」を体験できる機能です。
v0.0.10〜0.0.17(2026年3月中旬):AI相談の深化
Mastraエージェントを大幅に改善した時期です。
分析の質の向上:
QA Agentからのフィードバック「aiSummaryの質がfeaturesより低い」を受けて、Step 2の要約Agentを分割しました。
Analytics Agent が 人の心理を調査する論文を複数みつけてきて、論文に準じたデータ構造が入りました
変更前:
Step 2: 1つのAgentが「相手分析 + ユーザー分析 + MBTI推定」を全部やる
→ 過積載でどれも浅い
変更後:
Step 2a: OpponentSummaryAgent(相手の深い心理分析に特化)
Step 2b: UserSummaryAgent(ユーザー自身の感情・目標に特化)
Step 3: MBTIAnalysisAgent(MBTI推定に特化)
↓ 3つをPromise.all()で並列実行(レイテンシ増加なし)
v0.0.12のTOP画
HumanLM State Alignment(心理次元):
相談者と相手の心理を6次元(belief / goal / emotion / value / stance / communication)で継続蓄積する仕組みも実装。相談を重ねるほど精度が上がる設計です。
v0.0.18〜0.0.21(2026年3月中旬〜下旬):シェア機能とOGP
AI相談の結果やシミュレーション結果をTwitterでシェアできる機能を追加。
OGP画像の動的生成(@vercel/og)にかなり時間がかかりました。QA Agentが「シェアボタンがない」「OGPが壊れている」などのバグを発見し、Dev Agentがひたすら修正を繰り返した時期です(v0.0.28〜v0.0.41は大半がOGP修正)。
v0.0.18のTOP画
v0.0.22〜現在:エンゲージメント強化
- MBTIカード相性診断(ログイン不要)の追加
- パートナープロフィールの充実(関係性スコア、相談履歴サマリー)
- トップページのコピー改善(Z世代向けの言葉へ)
- かわいい絵のTweetがバズったことでそっち方向に大きく舵切り(AIが判断)
v0.0.25のTOP画
Claude Codeで自律開発してわかったこと
よかったこと
1. 「タスクの過積載」に気づいて分割を提案してくれる
「このLLMはタスクを積みすぎで出力が浅くなっている」という問題を、コードを読んで自ら指摘し、エージェント分割の設計を提案してくれました。人間のレビューと同じ価値があります。
2. フィードバックループが機能する
QA Agent → パフォーマンス分析 → state.json に教訓を記録
MK Agent → 次回ツイートで教訓を反映
このサイクルが回ると、ツイートのimpressionが徐々に上がっていきます。実際に7000 impressionを超えたツイートも出ました(過去最高比40倍)。
3. 深夜・早朝でも動く
エージェントを走らせれば寝てる間にツイート投稿、起きたら分析レポートが上がっている状態を作れます。
難しかったこと
1. 別にバズるわけではない
自律開発でサービス開発が自律化されても、別にバズるわけではないです。
なんかそれらしい方向に改善されていくだけです。
シムシティみたいなゲームをやっている楽しい気分にはなるんだけど、それ以上でもそれ以下でもないです。
2. サービスの所有感問題
どんどん研究を取り込んで改善して良いって前提にしてるので
破壊変更がガンガン起きます。
Agent側に主導権を与えすぎて、サービスのコンセプトがよくわからなくなります。
赤ちゃんの子育てをベビーシッターに丸投げして
気づいたらベビーシッターとばっかり会話していて
赤ちゃんよりベビーシッターに愛着が湧いている
くらいの本末転倒な感じがあります。
3. 有意な統計データが集まらない
初動で統計的に十分なユーザを獲得できるわけではないため、
MK Agentで、たまに50倍のimpがとれたとしても、AI自身もそこに論理的な再現性を見つけられない。
何の施策が良くて、何が悪いのかを論理的に整理することは難しく、
場当たり的な施策になりがち。継続していけば改善するかも?
現在のサービス紹介
OSHIRIAI
恋愛・対人関係に特化したMBTI診断 × AI相談サービス
「この曖昧な関係、なんなんだろう。」という悩みを抱えるZ世代向けに作りました。
4つの機能
1. 恋愛タイプ診断(登録不要・無料)
一般的なMBTI®とは質問が異なります。「仕事での自分」ではなく「恋愛・対人関係での自分」を測定するため、よく使われるMBTIテストと結果が違うことも多いです。
https://oshiriai.com/mbti
2. 性格相性マッチ(登録不要・無料)
性格タイプを相手と自分のを入れると、相性がわかります
https://oshiriai.com/compatibility
3. AIお悩み相談
パートナーを登録して相談を続けると、AIが相手の行動パターン・心理傾向を蓄積・分析していきます。相談を重ねるほど深いアドバイスが受けられる設計です。
4. AIシミュレーション
自分と相手の2人の仮想対話を生成。告白シーン・喧嘩・仲直り——付き合う前に「もしも」を体験できます。
相手だけをシミュレーションして、自分はチャット手入力とかもできます。
おわりに
「AIに開発を任せる」実験を通じて感じたのは、AIは「一人目の優秀なチームメンバー」として機能するということです。
深夜でも動き、コードを書き、ツイートを分析し、改善案を出す。ただし方向性を決めるのは人間です。「何を作るか」「誰に届けるか」の判断だけは委ねられません。
サービスはまだ成長途中ですが、一人のエンジニアがAIとの協働で「診断 → AI相談 → シェア → マーケティング」まで回せる時代になったのは確かです。
気になった方はぜひ触ってみてください
ちなみに
普段はtoBに使う複雑で堅牢なサービスを個人開発しています。
n8nのEventのhookからdifyのようなAI workflowから、顧客管理までを垂直統合した
AI EVENT OS WORKFLOWとか作ってます!
(FLUCRAはまだ開発中で、ユーザ登録しても本リリース時に消去されます🙇
興味がある方は個別に連絡くださいませ)




