Claude Code Agent Teamsでペルソナを演じる複数AIにユーザーリサーチをさせてみた

Posted at 2026-03-09

はじめに

「詳細なペルソナを持ったAIに、ユーザーリサーチをさせたらどうなるか？」

そんな問いが頭に浮かんだのは、開発中のアプリ「おたよりAI」（保育園・学校の予定をスキャンしてカレンダーに変換するモバイルアプリ）の改善方向を模索していたときでした。実際のユーザーインタビューは設定からファシリテートまで時間がかかる。でも、詳細に定義したペルソナがあるなら、それを「演じる」AIエージェントたちに議論させることができるかもしれない。

Claude Code Agent Teamsという機能を使えば、複数のAIエージェントがチームを組んでコミュニケーションしながら作業できます。今回はこれを使って、4人の異なるユーザーペルソナを担当するエージェントに、アプリの改善点について3ラウンドのディスカッションをさせてみました。

試したこと：プロンプト1本で始まるユーザーリサーチ

実装というと構えてしまいますが、筆者が実際に書いたのはプロンプト1つだけです。以下がそのまま全文です。

ディスカッションテーマ
otayori-aiというアプリを使ってみて感じたこと。

ユーザー一覧に記載されているユーザーはこのおたよりAI（この
リポジトリのサービス）を利用しています。
現状での良いところがありつつも、それぞれ機能やUI
UXに対しての不満を掲げています。
それらをより良くするためにはどうしたらいいのかを4人で話し合
ってください。

[ユーザー一覧]
1. 田中 さくら（28歳）
子ども： 3歳の息子・こうた
職業・状況： 元OL、現在育休延長中。復職を半年後に控えて焦りを感じている。
性格： 真面目で完璧主義。情報収集が得意で、育児書やSNSを読み漁るが情報過多になりがち。「ちゃんとやらなきゃ」というプレッシャーを自分にかけやすい。
悩み・課題： 保活・復職後の家事分担。夫は協力的だが、段取りは全部自分が考えている感覚がある。

2. 中村 あかね（34歳）
子ども： 7歳の娘・はな、4歳の息子・りく
職業・状況： フルタイムのワーママ（マーケター）。時短なし・フルで働いている。
性格： 効率重視でサバサバしている。愚痴より解決策を求めるタイプ。SNSは情報収集ツールと割り切っており、共感より実用性を好む。
悩み・課題： 子ども2人の習い事・学校行事の管理と仕事の両立。タスクが多すぎて自分の時間がゼロ。

3. 松本 ゆい（24歳）
子ども： 1歳の娘・あお
職業・状況： パートタイム勤務（週3日）。若くして出産し、同世代の友人とは話が合わないと感じることも。
性格： 明るくフレンドリーだが、育児の不安を誰かに話せないと内側に溜め込む。SNSで同世代ママと繋がることで孤独感を和らげている。InstagramやTikTokが生活の一部。
悩み・課題： 育児の「正解」がわからない不安。実母が遠方で頼れず、情報はほぼSNS頼り。

4. 伊藤 みほ（31歳）
子ども： 12歳の息子・けんと、9歳の娘・なつ
職業・状況： フリーランス（Webデザイナー）。在宅ワーク歴5年。
性格： 自分のペースを大切にするマイペース派。育児の「普通」にとらわれず、自分なりのやり方を模索してきた。少し斜に構えたところがあるが、芯は温かい。
悩み・課題： 子どもが中学受験期に差し掛かり、今まで通りの緩いスタンスでいいのか揺れている。仕事と勉強サポートの両立。

[MOST]
agent teamsを使ってください。
それぞれの回答は常にmdファイルに記録を残してください。
また取りまとめ役としてメインエージェントが話のまとめを司会となって会話をスムーズにさせてください。
時間をいくらかけても良いので、品質を優先して。

これだけです。あとはClaudeが自律的に動きました。

前提条件: Agent Teamsは実験的機能のため、デフォルトで無効です。~/.claude/settings.json に以下を追記して有効化してください。
{
  "env": {
    "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
  }
}

Agent Teamsが動く様子

プロンプトを投げると、Claude Codeはまずチームを組成するところから始めました。TeamCreate でチームを作り、Agent ツールで4人のメンバーエージェントをそれぞれ起動し、各エージェントは発言内容を SendMessage でリーダーに送信する——内部ではこういった一連の動作が自律的に実行されます。読者が気にすることはほとんどなく、Claude Codeがツールを選択し、組み合わせ、ディスカッションの流れ全体を設計してくれました。

ディスカッションの構造もClaude自身が設計しました。

ラウンド1: 各自の第一印象・意見（並行独立）
  ↓
司会による共通テーマの整理
  ↓
ラウンド2: 深掘り（全員へ一斉質問 → 各自回答）
  ↓
ラウンド3: 最終合意形成（意見の分岐点を提示 → 各自回答）
  ↓
司会による総合まとめ・改善ロードマップ策定

ラウンド1で各エージェントが独立して意見を述べ、そこで出た共通テーマや意見の分岐を司会役のリーダーが整理しながら次のラウンドへつなぐ——この流れはプロンプトで指定したわけではなく、Claudeが「品質を優先して」という一言から判断して組み立てたものです。

ペルソナの解像度が成果を決める

4人のエージェントが同じアプリについて議論しているにもかかわらず、発言の視点・優先度・言語スタイルが驚くほど異なっていました。

無料プランのスキャン回数制限（月3回）という共通の不満に対して、4人の反応はこうでした。

さくら（完璧主義・育休中）は「月10回は必要。子ども1人分の全おたよりをカバーしてほしい」と、自分の生活ボリュームから具体的な数字を出してきました。
あかね（フルタイム・マーケター）は「スキャン制限の緩和は設定値の変更だから来週できる。並行してチェックリストを開発すべき」と、技術コストまで考慮した発言をしています。
ゆい（SNSネイティブ・若いママ）は「月3回で引っかかった瞬間にアンインストール。入口で若いユーザーを逃している」とバイラル拡散の視点で語り、
みほ（Webデザイナー）は「最初の1ヶ月フルトライアルにすべき。SaaSの定石」とプロダクト設計者の言葉で返してきました。

同じ問いに対してこれだけ違う答えが出てくるのは、ペルソナの記述が十分に具体的だったからだと思います。「28歳育休中」という情報だけでは浅い意見しか出ません。「完璧主義で情報過多になりがち、夫への伝書鳩役に疲弊している」まで書くことで、「夫婦間の情報格差を解消するアプリ」という切り口の発言が出てきます。ペルソナの解像度が、そのままアウトプットの解像度になりました。

30分のディスカッションで出てきたもの

全3ラウンドで約30分、4人×3ラウンドで計12件の回答が集まりました。1エージェント1回あたり2,000〜3,500文字、記録ファイルは347行のMarkdownになっています。

ラウンド3で最も印象的だったのは、「スキャン制限緩和が先」か「持ち物チェックリストが先」かで意見が割れたときの収束の仕方でした。司会役のClaude（リーダーエージェント）がラウンド2でその分岐点を整理して全員に提示すると、あかねが「スキャン制限の緩和は設定値を変えるだけ。持ち物チェックリストは1〜2ヶ月の開発案件。タイムラインが違う」と指摘し、他のメンバーがそれを評価しながら「だったら両方並行でやれる」という合意に自然に収束していきました。

議論を整理するために誰かが指摘して、それを他が評価してさらに補足する——本物のディスカッションに近い展開が自然に出てきたのは予想外でした。

最終的に出てきた改善ロードマップはこうなりました。

Tier 1（即対応）:
  - 無料スキャン回数を月8〜10回に引き上げ
  - 初回フルトライアルの導入

Tier 2（最優先開発）:
  - 持ち物チェックリスト自動生成＋家族共有＋通知連携

Tier 3（次フェーズ）:
  - OCRテキスト全文検索
  - 通知タイミングのカスタマイズ
  - 週間サマリー通知

Tier 4（中長期）:
  - Apple Calendar連携
  - カスタムカテゴリ
  - SNSシェア機能

この手法で見えてきたこと

実際のユーザーインタビューとは別物です。AIが演じるペルソナには深さの限界があり、生活の肌感覚や言いよどみのようなリアルさは出ません。ただ、「まずペルソナベースで議論を回す → 出てきた仮説を実際のユーザーで検証する」という前段として機能するのは実感しました。30分で改善候補を優先度つきで出せたことで、実際のインタビューでどこを深掘りすべきかが明確になります。

ラウンド形式にしたことも効いていたと思います。ラウンド1で意見を独立して集めてから、ラウンド2・3で他者の意見を踏まえた議論に移行する設計は、最初から全員が互いの意見を参照できる状態だと起きがちな同調バイアスを避けられます。これもClaude自身が「品質を優先して」という指示から判断して採用した設計でした。

注意点も一つ。エージェントはプロンプトに書かれた情報しか持ちません。アプリの機能・仕様・UIの詳細はすべてプロンプトに書き込む必要があります。コードやドキュメントを自動で参照してくれるわけではないので、プロンプトに何を渡すかがそのまま議論の前提情報になります。

まとめ

プロンプト1本で始めた実験は、30分で347行の議論ログと優先度付き改善ロードマップになりました。詳細なペルソナを書くほど視点の解像度が上がり、ラウンド形式にすることで独立した意見収集と合意形成を段階的に進められました。

ユーザーインタビューの代替ではなく、仮説を素早く立てるための前段として。そういう使い方であれば、プロンプト1本から始めても十分な示唆が得られると感じています。

参考リンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up