YouTube動画を「ざっくり要約して」とAIに投げると、だいたい綺麗に5箇条書きが返ってくる。これは便利だけど、動画を意思決定の素材として使いたいときには情報量が足りない。
「自分が事業をやってる視点」「エンジニア視点」「逆張り視点」「ライフスタイル視点」 — 同じ動画でも、見る立場が違えば拾うポイントが全然違うはず。
それを単一のClaude Codeセッション内で4人分担でやらせてみたら、要約より圧倒的に深い議事録が出てきたので、その作り方をまとめます。
実例として、ある起業家YouTuberの12,993字の動画を分析した結果(匿名化)も最後に貼ります。
全体像
YouTube URL
│
▼
youtube-transcript-api で字幕取得 (Python)
│
▼
Claude Code に「4人合議で分析して」と投げる
│
├─ ビジネス視点 (松本)
├─ テック視点 (藤井)
├─ 逆張り視点 (川島)
└─ ライフスタイル視点 (西田)
│
▼
最後にチーフが総括 → 議事録Markdown
ポイントは2つ:
- 字幕取得は外部ライブラリ任せ (Claudeにブラウザを開かせない)
-
4人のキャラ設定は
CLAUDE.mdに静的定義 (毎回プロンプトで指示しない)
① 字幕の取得
youtube-transcript-api を使います。
import sys
sys.stdout.reconfigure(encoding='utf-8')
from youtube_transcript_api import YouTubeTranscriptApi
api = YouTubeTranscriptApi()
transcript = api.fetch('VIDEO_ID', languages=['ja', 'en'])
text = ' '.join(s.text for s in transcript.snippets)
print(f'LENGTH: {len(text)}')
VIDEO_IDはURLから抽出します:
-
https://youtu.be/r59VWUegxW4?si=...→r59VWUegxW4 -
https://www.youtube.com/watch?v=r59VWUegxW4→v=パラメータ
字幕が取れない動画 (自動字幕なし・非公開) はそもそも対象外なので、try/except で素直に落とせばOKです。
Windowsで日本語字幕を扱う場合は sys.stdout.reconfigure(encoding='utf-8') を入れておかないと UnicodeEncodeError: 'cp932' codec can't encode character で落ちるので注意 (実際にハマりました)。
② 4人のキャラを CLAUDE.md に書く
Claude Code は起動時に CLAUDE.md を自動で読み込みます。ここに4人のキャラを定義しておけば、毎回のプロンプトで「ビジネス視点で...テック視点で...」と書く必要がありません。
## 4人合議メンバー
| 名前 | 視点 | キャラクター |
|---|---|---|
| 松本 | ビジネス | LTV/CAC/AARRRで考える元PM。「ファネルのどこに効く?」を必ず聞く |
| 藤井 | テック | スタック・実装可能性・運用負荷で評価。「自分の環境に持ち込めるか?」 |
| 川島 | 逆張り | 「これ生存者バイアスでは?」「再現性は?」を必ず1回挟む |
| 西田 | ライフスタイル | 思考拡散時の閃き・読書習慣・長期視点。「ロングゲームで考えたら?」 |
### 4人合議の出力フォーマット
- 各発言は200字以内
- 最後にチーフが1段落で総括
- 採否判定が必要なら総括内で決める (合議は素材集めであって決定機関ではない)
これだけ書いておいて、あとは普通のセッションで:
このYouTube動画を4人合議で分析して
と投げれば、Claude Code は自動で4人分担して返してきます。
③ なぜ「ペルソナ」をつけるのか (重要)
実は、最近のいくつかのLLM研究で「LLMにペルソナを与えても事実ベースの精度は上がらない」と報告されています。むしろ立場の違いで結論が真逆になり、ベンチマーク回答精度はペルソナなし時より低下するケースすらある、と。
なのでペルソナ運用は要注意で、事実精度が命の領域 (経理・法令・契約) では使わないのが鉄則です。
ただし「多角検討の素材集め」としては有効です:
| 領域 | ペルソナ運用 |
|---|---|
| 事実判定 (計算・法令・契約) | ❌ ペルソナOFFで素のClaudeに独立検証させる |
| 論点抽出・多角検討 (動画分析・壁打ち・新規事業評価) | ✅ ペルソナONで素材を集める |
| 距離感調整 (秘書・窓口役) | ✅ ペルソナONで親しみやすさ |
YouTube動画の分析は完全に「論点抽出」のタスクなので、ペルソナ運用がハマる用途です。
④ 実際の出力例 (12,993字の動画を4人で分析)
ある起業家YouTuberが「個人開発で1日10万円売上」を語る動画。要約だと「Expoでスマホアプリ作ってXでバズった」で終わるところを、4人に分担させると↓のような議事録になります (一部抜粋・固有名詞は匿名化):
松本 (ビジネス視点)
数字が綺麗に逆算されている。月20万→1日6,300円→1,000円買切×6個×CVR1%=600DL/日。フレームワークは他事業に転用可能。
藤井 (テック視点)
技術スタック Expo + RevenueCat + PostHog + SQLite ローカル。バックエンドなし。Windowsからリリース可能。即トレース可能だが、Apple審査がボトルネック。
川島 (逆張り視点)
ちょっと待って、これ生存者バイアス全開。本人も「Xバズは運要素」と自白している。1日10万→翌日以降1万に減衰している時点でストックビジネスではない。著者は登録者10万・書籍・アカデミーの複合体だから集客のスタート地点が違う。
西田 (ライフスタイル視点)
"ゴールイメージ→脳内自動逆算"と"思考拡散時に閃く" (散歩・読書中) は再現性ある原則。ロングゲーム推奨も合う。
ここまで来ると、要約ではなく意思決定の素材になります。「あ、川島の指摘あったから飛びつくのやめよう」とか「松本のフレームワークだけ抜き出して自分のPJに転用しよう」とか、次の行動に直結する。
特に川島の逆張りパートは単純要約では絶対に出てきません。情報の受け取り手として「これ騙されてない?」を構造的に挟む装置として機能しています。
⑤ 運用Tips
実際にしばらく回してみて、効いたコツがいくつかありました。
自分なりの「視点軸」を決めておく
私の場合は「ビジネス / テック / 逆張り / ライフスタイル」の4軸ですが、ここは目的に合わせて変えるのがおすすめです:
- 採用判断の動画レビュー → 候補者視点 / 既存社員視点 / 投資家視点 / カルチャー視点
- 競合ツールのレビュー動画 → 既存ユーザー視点 / 新規ユーザー視点 / 営業視点 / セキュリティ視点
軸さえ決まれば、あとは CLAUDE.md を書き換えるだけです。
逆張り役は必須
これは強く言いたいのですが、逆張り役を入れないと合議全員が"いいね"で終わる現象が頻発します。
LLMは基本的に同意・賞賛バイアスがあるので、明示的に「これ生存者バイアスでは?」「再現性ないのでは?」を担当させるキャラを置かないと、4人いる意味がなくなります。
動画は「字幕が取れるか」で素材適性が決まる
自動字幕すらない動画 (BGM・無音動画・古い動画) は YouTube Transcript API では取れません。これは仕様。
その場合は yt-dlp で音声を落として → ffmpegで圧縮 → Whisper (Groq/OpenAI) でテキスト化、というルートに切り替えます。私は webm の29MB音声を ffmpeg で12MB mp3 にしてから Groq Whisper Large-v3 (無料枠) に投げる構成で運用しています。コストはほぼゼロです。
まとめ
- YouTube動画は単純要約だと意思決定の素材として弱い
- 4人キャラを
CLAUDE.mdに静的定義しておけば、Claude Code は分担してくれる - ペルソナ運用は「多角検討の素材」目的に限定する (事実判定には使わない)
- 逆張り役は必須 (同意バイアス除去装置)
- 字幕取れない動画は yt-dlp + Whisper でテキスト化
事業判断・新規アイデアの一次評価・競合ツールレビューなど、「多角的に見たいけど時間がない」場面で効きます。プロンプトを毎回打たなくていいのが地味に楽です。
何より、川島の「ちょっと待って」が入る瞬間が一番おいしいです。