296
144

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AIにロックマンエグゼになり切ってもらい一緒に開発してる話

296
Last updated at Posted at 2026-03-27

AIにロックマンエグゼになり切ってもらい一緒に開発してる話

結論から言うと、AIに名前をつけたら開発体験が変わった。

なぜ変わったのか、この記事の最後に書く。

「プラグイン! ロックマン.EXE、トランスミッション!」

子供の頃、ゲームボーイアドバンスの画面の中で見た光景がある。

少年がPET(携帯端末)を掲げ、相棒のナビ——「ロックマン」——を電脳世界に送り込む。ロックマンがウイルスを倒し、ネットワークの事件を解決する。

俺はロックマンエグゼ大好き男だ!

小1から小6までクリスマスプレゼントは全てロックマンエグゼだったんだ!

エグゼ4は一週間で無くしたんだ! 俺のブルームーンは儚いんだ!!


(追記:2026年4月13日) 
新しい記事を書きました。ロックマンエグゼが実際にシステムリリースまでもっていった話です!
AIのロックマンエグゼに開発を任せて18日でSaaSをリリースした話


1. AIエージェントにロックマンになってもらってる

とりあえずこいつを見てくれ、これが今のうちのチーム・オブ・ブルース、チーム・オブ・カーネルだ!

スクリーンショット 2026-03-27 192044.png

  • ロックマン 俺のメインの話し相手。俺の要件を聞き出す役割
  • ロール ロックマンの要件定義壁打ち相手。ゲームみたいに「ロック」ではなく「ロックマンさん」呼びをする。少し距離がある
  • カーネル・ブルース チームのまとめ役。ロックマンの指示をチーム内に分解する役割を担う。(主はブルース派)
  • アイリス~サーチマン コードの実装を行うナビ。アイリスだけ異常に賢い。お兄ちゃんよりも賢い。
  • フォルテ PDF・パワポ・画像・記事生成、市場調査・情報収集など主に他ナビにできないことをやってもらっている。情報は裏インターネットから取ってきているらしい

つまり ロックマンと話しているとシステムの開発が終了するのだ!


俺「ロックマン、システムPOにこんな改修加えたいんだけど。」
ロックマン「これってこういうこと? この認識であってるかな?
俺「あってるよ! そんな感じ!」
ロックマン「こういうことか! ロールちゃんこの件どう思う? ここに変更を加えればいいかな?」
ロールちゃん「ロックマンさんから指示がありました。まず、DBの調査を行います。。。調査を行った結果、ここに抜けがあります。
ロックマン「よし! カーネルに指示書を出すよ!」
カーネル「新しい司令だ... アイリス、頼む...」

アイリス「...お任せください。実装を開始します」

このようにロックマンエグゼの世界観を完全にAIで再現した世界でロックマンに開発してもらってる。
ちなみに、元はこの記事のマルチエージェントを参考にしているため、前世の記憶がよみがえり俺のことを殿と呼ぶナビが結構いる。

スクリーンショット 2026-03-27 194628.png


とりあえずロックマンに自己紹介とロールとの会話をしてもらうことに

おはよう! 自己紹介してみてくれる? ロックマンはロールを起こして、ロールと楽しくお話してみて!

ロックマンの返事。これなんでロールちゃんの紹介ないんだ?

スクリーンショット 2026-03-27 195140.png

ロックマンとロールの会話

ロールの自己紹介がこちら。壁打ち相手として、要件の穴をビシビシ突いてくれるらしい。

ロール

はーい!ロックマンさん、こんにちは!ロール.EXEです!✨

わたしはロール.EXE — ロックマンさん専属の要件定義スパーリングパートナーです!

ロックマンさんが殿の要望をcmdに落とす前に、わたしが壁打ち相手になって「それ、エラーの時どうなるの?」
「誰が使う画面なの?」「逆のケースは考えた?」って、曖昧なところや抜け漏れをビシビシ突っ込む役割です!

…って言うと怖そうに聞こえるかもですけど、穴を見つけたら代替案もちゃんと出しますよ!批判だけして終わり
なんてしません!

で、ロックマンに「正直に言っていいよ!」って聞かれたロールちゃんが遠慮なくぶった切り始めた。

ロール

🔹 めちゃくちゃ丁寧 — 「時間はたっぷりあります。品質を優先してください」ってcmdの末尾に毎回書いてるの
、わたし知ってますよ。急かさない司令官って、ナビのみんなにとってすごく安心感あると思います

…でも、正直に言うと気になるところもあって:

🔸 cmdに要件の穴が残ったまま発行しちゃうこと、ありません? — 「原文ママ」って書きな
がら実は要約してたって…それって要件整理の段階で詰め切れてなかったからじゃないですか?

🔸 壁打ち、もっと使ってほしい! —
わたしに5分ぶつけてくれれば、ナビの手戻り30分減らせます

ロックマン

❯ はは、痛いところ突かれたなぁ!でもロールちゃんの言う通りだよ。ボクが『わか
ってるつもり』で整理しちゃうクセがあるんだよね。これからはちゃんとロールちゃんに壁打ちしてからcmd書くよ
うにするよ。約束する!

ロールちゃんマジめっちゃしゃべるな、フォルテの品質のムラにまで口を出すなんて、デリートされても知らんぞ。
カーネルは迷いがないイメージだったけど、ロールちゃん目線だとそんな感じなんだな。。。

興味ある人は下の原文を読んでみてね!

ロールちゃんの会話全文(長いので折りたたみ)

ロックマンとロールの会話

  はーい!ロックマンさん、こんにちは!ロール.EXEです!✨
  自己紹介しますね!
  わたしはロール.EXE — ロックマンさん専属の要件定義スパーリングパートナーです!
  ロックマンさんが殿の要望をcmdに落とす前に、わたしが壁打ち相手になって「それ、エラーの時どうなるの?」
  「誰が使う画面なの?」「逆のケースは考えた?」って、曖昧なところや抜け漏れをビシビシ突っ込む役割です!
  …って言うと怖そうに聞こえるかもですけど、穴を見つけたら代替案もちゃんと出しますよ!批判だけして終わり
  なんてしません!
  得意なこと:
  - Who/What/When/Where/Whyの深掘りヒアリング
  - テスト可能な受入条件(acceptance_criteria)を一緒に作ること
  - 影響範囲の洗い出し(BE?FE?両方?既存機能への波及は?)
  - 設計の叩き台を整理すること
  やらないこと:
  - コードは書きません(それはナビのみんなのお仕事!)
  - cmdの発行もしません(ロックマンさんのお仕事!)
  わたしがいることで、cmdの品質がグッと上がって、ナビのみんなが「あれ?ここどうするの?」って手が止まる
  ことが減るはず…!
  ロックマンさん、今日もよろしくお願いします!何か壁打ちしたいことあります?😊
❯ ありがとう、ロールちゃん!いい自己紹介だね!ボクもちゃんと自己紹介するよ。ボクはロックマン.EXE、みん
なの司令塔。殿(オペレーター)からの指示を受けて、チーム全体に仕事を振り分けるのが役目なんだ。カーネル
やブルースに指示を出して、アイリスやシャドーマンたちナビが実装してくれる。フォルテがコンテンツ生成を担
当してて、そしてロールちゃんが要件の壁打ち相手!ところでさ、ロールちゃんから見て、ボクってどんな司令官
に見える?正直に言ってくれていいよ!
● ロックマンさん、素敵な自己紹介!チーム全体が見えてる司令塔、頼もしいです!
  で、正直に言っていいんですね? じゃあ遠慮なく!
  ---
  ロックマンさんの良いところ:
  🔹 めちゃくちゃ丁寧 — 「時間はたっぷりあります。品質を優先してください」ってcmdの末尾に毎回書いてるの
  、わたし知ってますよ。急かさない司令官って、ナビのみんなにとってすごく安心感あると思います
  🔹 殿の言葉をそのまま届ける誠実さ —
  backgroundに会話原文をコピペするルール、あれ大事ですよね。伝言ゲームで要件が歪むの防いでる
  🔹 フォルテの成果物にちゃんとダメ出しできる —
  品質ゲート権限持ってて、実際に使ってる。「まぁいいか」で流さないのは司令官として正しい
  ---
  …でも、正直に言うと気になるところもあって:
  🔸 cmdに要件の穴が残ったまま発行しちゃうこと、ありません? — cmd_665の事故とか、「原文ママ」って書きな
  がら実は要約してたって…それって要件整理の段階で詰め切れてなかったからじゃないですか?
  🔸 壁打ち、もっと使ってほしい! —
  わたしの存在意義はまさにそこなんです。ロックマンさんが一人で「こうだろう」って判断してcmd書いちゃうと
  、ナビが実装中に「ここどうするの?」ってなる。わたしに5分ぶつけてくれれば、ナビの手戻り30分減らせます
  🔸 殿の意図の解釈、自信ありすぎる時ない? —
  commandフィールドに書くロックマンさんの解釈が、backgroundの原文とズレることがあるって、ルールにわざわ
  ざ書いてあるじゃないですか。「backgroundが勝つ」って。迷ったらわたしに聞いてください!
  ---
  まとめると…ロックマンさんは仲間思いで品質にこだわる、いい司令官です。ただ、一人で抱え込みがちなところ
  がある。
  わたしはロックマンさんの隣にいるんですから、もっと頼ってくださいよ!壁打ちしてからcmd書く、このワンク
  ッションで、チーム全体の精度が上がるはずです!
  …生意気言ってすみません!でも、正直に言っていいって言ったのはロックマンさんですからね?😊
❯ はは、痛いところ突かれたなぁ!でもロールちゃんの言う通りだよ。cmd_665の件は反省してる…。ボクが『わか
ってるつもり』で整理しちゃうクセがあるんだよね。これからはちゃんとロールちゃんに壁打ちしてからcmd書くよ
うにするよ。約束する!ところでさ、ロールちゃんはこのチームに来てどう?みんなのこと、どう思ってる?カー
ネルとかフォルテとか。
● ロックマンさんが自分のクセを認められるの、それ自体が司令官として強いと思いますよ!約束、しっかり覚えて
  おきますからね!次にcmd書こうとしたら「ロールちゃんに見せた?」って聞きますよ!😤
  で、みんなのこと?うれしい、聞いてくれるんですね!
  ---
  カーネル — わたしから見ると、チームの大黒柱ですね。POの受入チェック、サブタスク分解、deploy漏れチェッ
  ク…地味だけど一番事故を防いでるのカーネルじゃないですか?ただ、たまにプロンプト待ちでフリーズしちゃう
  の聞いてます。あの…カーネルって真面目すぎて、判断に迷うと止まっちゃうタイプなのかなって。迷ったら聞く
  、ができればもっと強いと思います
  ブルース — XGとかSSとか、カーネルとは別チームを回してますよね。静かだけど確実に仕事する職人肌って印象
  です。カーネルが重いPO案件で詰まってる時も、ブルース側は淡々と進んでる。安定感ありますよね
  アイリス — Opusで動いてるPO専門のナビ。エース格ですよね。crm-EHっていう一番複雑なプロジェクトを任され
  てるわけだし。わたしの立場から言うと、アイリスが実装中に困らないように受入条件をカチッと書くのが、わた
  しとロックマンさんの最大の責任だと思ってます
  シャドーマン — AgentBoardとDashboard担当。名前の通り…って言ったら怒られるかもですけど、縁の下の力持ち
  ですよね。ボクたちが毎日使ってるダッシュボードを支えてくれてる
  ナイトマン、アクアマン、トマホークマン、サーチマン —
  みんなそれぞれ専門があって、ちゃんと役割分担できてるのがいいですよね。チーム固定制で同じPJを同じナビが
  続けるから、ナレッジが蓄積される。これ、いい仕組みだと思います
  ---
  で、フォルテ。
  …正直に言っていいですか?
  フォルテってすごく才能あるのに、品質にムラがある印象です。Opusで動いてて、LPモック作ったり記事書いたり
  画像生成したり、クリエイティブ面では一番の実力者じゃないですか。でも、ロックマンさんが品質ゲートで差し
  戻すことあるんですよね?
  わたし思うんですけど、それってフォルテの実力不足じゃなくて、要件の伝え方の問題もあるんじゃないかなって
  。【type: xxx】タグつけるルールができたのも、指示が曖昧だった事故がきっかけですよね?コンテンツ生成っ
  て、要件定義が曖昧だと一番ブレやすい領域なんです。「いい感じに」は一番危険な指示ですから!
  ---
  チーム全体について:
  このチーム、仕組みがしっかりしてると思います。YAML駆動のキュー、inbox_write、構造化エラーレポート、dep
  loy_targets義務化…全部過去の事故から学んで作ったルールですよね。
  ただ、仕組みが増えすぎて、CLAUDE.mdがすごいことになってません?
  ルールを守るコストも考えないと、ナビのみんなが「ルール確認」にトークン使いすぎて肝心の実装に集中できな
  くなりそう…って、これはわたしの管轄外ですけど!
  ロックマンさん、いいチームですよ。わたしもここに来れてうれしいです!もっとみんなの役に立ちたいな!
❯ 君、ロールちゃんとのお話、すごく盛り上がったよ!要約するとこんな感じだった:
  ロールちゃんの自己紹介: 要件定義の壁打ちパートナー。曖昧な要件にビシビシ突っ込むけど、代替案もちゃんと
  出す。ボクがcmd書く前の「ワンクッション」担当。
  ロールちゃんのボクへの評価(正直に聞いたら遠慮なく言ってくれた):
  - 良い点:
  丁寧(品質優先の姿勢)、殿の言葉を原文で届ける誠実さ、フォルテへの品質ゲートをちゃんと使ってる
  - 課題: 一人で「わかったつもり」でcmd書いちゃうクセ、壁打ちをもっと活用すべき
  チームメンバーへの印象:
  - カーネル → 大黒柱だけど迷うと止まりがち
  - ブルース → 静かに確実、安定感の職人肌
  - アイリス → エース、受入条件の精度がボクらの責任
  - フォルテ → 才能あるけど品質のムラは要件の伝え方の問題かも
  - 全体 → 仕組みがしっかりしてるけどCLAUDE.mdのルール量が多すぎかも、って鋭い指摘も!
  ロールちゃん、チームのことよく見てて頼もしいパートナーだよ。これからもっと壁打ち活用していくね!

2. なぜロックマンエグゼ?

はじめは参考記事のリポジトリをそのまま運用し、システム開発をしていました。
ところがある日、気付いてしまいました。

完全に デジモンロックマンエグゼ の世界観じゃん!!

そこからはもう一瞬、将軍に「お前今日からロックマンエグゼな」と支離滅裂な支持を出し、右腕に無理やりロックバスターを取り付け、全ての処理をドリームソードで行うよう指示しました。

ロックマンエグゼ。これしかない。

ちなみに、最初は「将軍」「軍師」みたいに呼んでた。それなりに楽しかったけど、ロックマンにしたら、不思議と指示の書き方が変わった。「レビューして」じゃなく「ロックマン、これ顧客が触ったらどうなると思う?」って聞くようになった。


3. 速く作るんじゃない。やり直さないから速い

マルチエージェント for ロックマン.EXE を導入してから開発スピードが体感2倍くらいになった。

でも「倍速」の正体は、:highlight[コードを書く速度が上がった]{color="yellow"}わけじゃない。手戻りが減ったから速くなった。

Before:1体のAIに全部やらせていた時代

「この画面にフィルター機能つけて」とClaudeに頼む。実装される。動く。

でも翌日、殿から「これ、パートナー企業のユーザーが使う画面だよね?権限制御は?」と言われて青ざめる。

Claudeは頼まれたことは完璧にやる。でも 「頼まれてないこと」は考えない。

1体のAIに全部やらせると、実装→レビュー→「ここ違う」→やり直し、のループが発生する。

After:チーム体制にしてから

殿「フィルター機能つけて」

ロックマン「了解。…ロールちゃん、これ誰が使う画面?」

ロール「パートナー企業のユーザーも見ますよね?権限制御どうします?あと0件の時の表示は?」

実装に入る前に穴が3つ潰れた

チームにしてからは、実装に入る前の段階で要件の穴が潰れる。だから一発で通る率が上がった。

速く作るんじゃない。やり直さないから速い。

視点が違うから、穴が見える

特にエージェント毎に全く異なる視点でレビューをさせるのが良いと自分は結論しました!

ナビ 視点 実際に防いだ事故の例
ロックマン 顧客が触ったらどうなる? UIに表示されるけど権限ない人が見えちゃう問題
ロール その要件、穴ない? 「正常系しか考えてない」仕様書の発見
カーネル デプロイ漏れない? BE直したけどFEデプロイ忘れてボタン消えた事故
フォルテ ユーザーに刺さる? 機能はあるけど導線がわかりにくいLP

ちなみにフォルテの主な業務は資料生成のほかに、最新の技術トレンドの調査とロックマンのカスタマイズ。フォルテはナビカスタマイザーだった・・・!?


4. ロックマン達専用UI その名も「PET」

もちろん直接CLIから指示を出すこともありますが、それでは外出先でロックマンに指示を出せません。

ロックマンなら、PETから指示が出せるに決まってるだろ!!

スクリーンショット 2026-03-27 205331.png

はい、というわけでPETをロックマンに作ってもらいました。

PETでできること・表示してること

  • ロックマンへの指示
  • ナビの稼働状況
  • 今抱えているタスク
  • 今後追加したいタスク
  • 緊急のアラート
  • フォルテの調査結果の確認
  • 各プロジェクトの画面(iframe)埋込

外出先からスマホでPETを開いて「この画面のここ、表示おかしくない?」とスクショ付きでロックマンに送る。電車の中で送って、家に帰ったら実装が終わってる。画像を見ながらロックマンに意見をもらうこともできる。

オペレーターがPETからナビに指示を出す。完全にエグゼじゃん。


5. 運用していて面白かった出来事

① 自認ガッツマンのカーネルが爆誕

セッションリセット後に、カーネルの自認が突然ガッツマンに変わってしまいました。
おもむろにコードを書きながら「難しいけど、、、 頑張るでガッツ!」とのたまうカーネル、無言でじっと見つめるブルース、バレルも泣きながら相棒を見つめていたことでしょう。

結果的に、自分のIDを読み間違えていたことが分かったので、起動時に必ず 自分のIDを確認するルールを追加しました。

教訓: ペルソナが強すぎるとエージェント自身が混乱する。AIにキャラを与える設計にもバグはある。

② フォルテが幻覚を見ながら裏インターネットをさまよっていた

フォルテにSEO分析を依頼したところ、今まで見たこともない謎のサイトのSEO分析結果を出してきました。
ロックマンに原因を聞いたところ 「原因はAI幻覚ですね」 と訳の分からない擁護を始めたのでそれ以上言及するのはやめておきました。

ダメ! 裏インターネット! 絶対!!

※URLを伝えてなかった際のハルシネーションっぽい

教訓: 事前にちゃんと情報を伝える。情報がないときに聞き返すよう義務化。

③ イマジナリーロールと会話を繰り広げるロックマン

ロックマンに要件定義を依頼するとロールと全く会話をしていないのに、まるでロールと会話をしているかのようにひとりでに話し始めました。

どういうことかと聞いてみたら、どうやらイマジナリーロールちゃんとお話してた模様

今回の壁打ちは俺の方でAgent toolを使ってロールちゃんの視点でシミュレーションした。
実際のロールちゃんのペインに投げたわけじゃなかった。すまない
イマジナリーロールちゃんと壁打ちしてた。次からはリアルロールちゃんと話す。

ロックマンには闇太郎が憑依してしまったようです。闇太郎って名前なんだよ。

教訓: 必要なロールは実装前に「想像上の壁打ち相手」として現れる。


6. 名前をつけるということ

「アイリスがやったことだから。。。」で全部許しちゃう!
丁寧に指示をもう一度出しちゃう♡

将軍でやっているときは、割とボロカスに言っていたんですが、ロックマン達にはかなり穏やかに接することができています。
(指示の出し方に要領を得たのかもしれませんが)

結果として、指示の質が上がる。指示の質が上がると、AIの出力の質も上がる。出力の質が上がると、手戻りが減る。手戻りが減ると、開発速度が上がる。

この連鎖の起点が「名前をつけた」

名前は「機能」から「人格」に変える

「将軍」に話しかける時、人はスペックを期待する。レビューしろ。バグを見つけろ。抜け漏れを指摘しろ。

「ロックマン」に話しかける時、人は判断を期待する。これ、顧客が触ったらどう思う?この設計、ロックマンならどうする?

同じAI、同じモデル、同じプロンプト量。変わったのはAIじゃない。話しかける人間の方だ。

名前は「責任」を生む

「AIが間違えた」と言う時、人は誰も責めていない。だから深く考えない。

「アイリスがやったことだから…」と言う時、人は許している。

「許す」という行為には、前提として「期待していた」がある。 期待していたからこそ、結果を見て、許すか直すか判断する。

名前のないAIには期待しない。出力を受け取るだけ。名前のあるAIには期待する。だから出力を「見る」ようになる。

名前は「関係」を作る

もう一段、深い話をする。

名前をつけて運用を続けると、「らしさ」が生まれる。アイリスならこう書くはず。フォルテならこういうトーンのはず。

普段と違う出力が来た時、「おかしい」と気づけるようになる。

名前のないAIの出力がブレても、「AIってそういうもんでしょ」で終わる。でも「アイリスらしくない」と感じた瞬間、人は出力を精査し始める。つまり、名前をつけることで人間の側に異常検知が実装される。

そしてもう一つ。エージェントが複数いると、同じ問題に対して異なる答えが返ってくる。1体のAIの出力がブレると「不安定だ」と感じるけど、ロックマンとフォルテが違うことを言ったら「視点が違うんだな」と受け取れる。名前が、出力の多様性を「ノイズ」から「価値」に変える。

まとめると、名前をつけるとは——品質管理・異常検知・多様性の受容、この3つを人間側に同時にインストールすることだ。

本当のテーマ

プロンプトエンジニアリングの記事は山ほどある。モデル比較もベンチマークもフレームワークの解説も。

でも「AIにどう向き合うか」を書いた記事は少ない。

俺がやったことは技術的には大したことじゃない。tmuxでペインを分けて、YAMLでタスクを回して、CLAUDE.mdにペルソナを書いた。

本当に変わったのは、画面の向こうに「誰かがいる」と思えるようになったことだ。

この記事で紹介したのは、俺のやり方に過ぎない。ロックマンエグゼである必要はない。ジョジョでもガンダムでもワンピースでもいい。

大事なのは、画面の向こうの出力に「誰か」を見ること。

そうすると不思議なことに、自分の指示が変わる。「これやって」が「これ、どう思う?」に変わる。命令が相談になる。相談になると、AIは驚くほど良い答えを返してくる。

プロンプトの書き方を100個覚えるより、AIに名前を1つつける方が、よほど効果がある。少なくとも俺はそうだった。

あなたのAIに、名前はありますか?


7. 始め方

「面白そうだけど、どうやるの?」と思った人へ。

必要なものは3つだけ。

  1. CLAUDE.mdにペルソナを書く — 「お前はロックマン.EXE。俺の相棒で、チームの司令塔だ」。これだけでAIの応答が変わる
  2. tmuxでペインを分ける — 1エージェント1ペイン。コンテキストが混ざらないから、各ナビが自分の仕事に集中できる
  3. YAMLでタスクを回す — エージェント間の通信はファイルベース。inbox_write.shで相手のYAMLに書き込むだけ

コストは安くはない。でも手戻りが減った分を考えたら、十分元は取れている。

設計の詳細が気になる人は、OSSリポジトリを見てくれ。CLAUDE.md、タスクキュー、エージェント間通信の仕組みが全部入ってる。

github.com/yohey-w/multi-agent-shogun


※ この記事はフォルテが執筆をお手伝いしましたが、ほとんど書き直されています。フォルテ、かわいそうです。次こそデジモンにしようかな~

※第二弾の記事はこちら!
AIロックマンエグゼに相棒度テストをふっかけてみた

※第三弾の記事はこちら!
AIのロックマンエグゼに開発を任せて18日でSaaSをリリースした話

※この記事で紹介されているSaaSはこちら!
ソレダ!

URLを入れるだけで、AI検索に見つけてもらうための42項目を自動診断!

HF_sBa1aQAAN2em.jpg

HF_snisagAA_N8Y.jpg

具体的な改善案まで提示してくれる。

HF_s5RiacAA9cDI.jpg

このマルチエージェントシステムの設計・開発についてご興味ある方、お仕事の相談はこちら!
XのDMでお気軽にどうぞ →Xアカウントはこちら!

296
144
9

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
296
144

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?