Claude CodeでYouTube字幕13,000字を"4人合議"に分析させたら、単なる要約じゃ拾えない視点が出てきた話

Posted at 2026-05-17

YouTube動画を「ざっくり要約して」とAIに投げると、だいたい綺麗に5箇条書きが返ってくる。これは便利だけど、動画を意思決定の素材として使いたいときには情報量が足りない。

「自分が事業をやってる視点」「エンジニア視点」「逆張り視点」「ライフスタイル視点」 — 同じ動画でも、見る立場が違えば拾うポイントが全然違うはず。

それを単一のClaude Codeセッション内で4人分担でやらせてみたら、要約より圧倒的に深い議事録が出てきたので、その作り方をまとめます。

実例として、ある起業家YouTuberの12,993字の動画を分析した結果(匿名化)も最後に貼ります。

全体像

YouTube URL
   │
   ▼
youtube-transcript-api で字幕取得 (Python)
   │
   ▼
Claude Code に「4人合議で分析して」と投げる
   │
   ├─ ビジネス視点 (松本)
   ├─ テック視点 (藤井)
   ├─ 逆張り視点 (川島)
   └─ ライフスタイル視点 (西田)
   │
   ▼
最後にチーフが総括 → 議事録Markdown

ポイントは2つ:

字幕取得は外部ライブラリ任せ (Claudeにブラウザを開かせない)
4人のキャラ設定は CLAUDE.md に静的定義 (毎回プロンプトで指示しない)

① 字幕の取得

youtube-transcript-api を使います。

import sys
sys.stdout.reconfigure(encoding='utf-8')
from youtube_transcript_api import YouTubeTranscriptApi

api = YouTubeTranscriptApi()
transcript = api.fetch('VIDEO_ID', languages=['ja', 'en'])
text = ' '.join(s.text for s in transcript.snippets)
print(f'LENGTH: {len(text)}')

VIDEO_IDはURLから抽出します:

https://youtu.be/r59VWUegxW4?si=... → r59VWUegxW4
https://www.youtube.com/watch?v=r59VWUegxW4 → v= パラメータ

字幕が取れない動画 (自動字幕なし・非公開) はそもそも対象外なので、try/except で素直に落とせばOKです。

Windowsで日本語字幕を扱う場合は sys.stdout.reconfigure(encoding='utf-8') を入れておかないと UnicodeEncodeError: 'cp932' codec can't encode character で落ちるので注意 (実際にハマりました)。

② 4人のキャラを `CLAUDE.md` に書く

Claude Code は起動時に CLAUDE.md を自動で読み込みます。ここに4人のキャラを定義しておけば、毎回のプロンプトで「ビジネス視点で...テック視点で...」と書く必要がありません。

## 4人合議メンバー

| 名前 | 視点 | キャラクター |
|---|---|---|
| 松本 | ビジネス | LTV/CAC/AARRRで考える元PM。「ファネルのどこに効く？」を必ず聞く |
| 藤井 | テック | スタック・実装可能性・運用負荷で評価。「自分の環境に持ち込めるか？」 |
| 川島 | 逆張り | 「これ生存者バイアスでは？」「再現性は？」を必ず1回挟む |
| 西田 | ライフスタイル | 思考拡散時の閃き・読書習慣・長期視点。「ロングゲームで考えたら？」 |

### 4人合議の出力フォーマット
- 各発言は200字以内
- 最後にチーフが1段落で総括
- 採否判定が必要なら総括内で決める (合議は素材集めであって決定機関ではない)

これだけ書いておいて、あとは普通のセッションで:

このYouTube動画を4人合議で分析して

と投げれば、Claude Code は自動で4人分担して返してきます。

③ なぜ「ペルソナ」をつけるのか (重要)

実は、最近のいくつかのLLM研究で「LLMにペルソナを与えても事実ベースの精度は上がらない」と報告されています。むしろ立場の違いで結論が真逆になり、ベンチマーク回答精度はペルソナなし時より低下するケースすらある、と。

なのでペルソナ運用は要注意で、事実精度が命の領域 (経理・法令・契約) では使わないのが鉄則です。

ただし「多角検討の素材集め」としては有効です:

領域	ペルソナ運用
事実判定 (計算・法令・契約)	❌ ペルソナOFFで素のClaudeに独立検証させる
論点抽出・多角検討 (動画分析・壁打ち・新規事業評価)	✅ ペルソナONで素材を集める
距離感調整 (秘書・窓口役)	✅ ペルソナONで親しみやすさ

YouTube動画の分析は完全に「論点抽出」のタスクなので、ペルソナ運用がハマる用途です。

④ 実際の出力例 (12,993字の動画を4人で分析)

ある起業家YouTuberが「個人開発で1日10万円売上」を語る動画。要約だと「Expoでスマホアプリ作ってXでバズった」で終わるところを、4人に分担させると↓のような議事録になります (一部抜粋・固有名詞は匿名化):

松本 (ビジネス視点)

数字が綺麗に逆算されている。月20万→1日6,300円→1,000円買切×6個×CVR1%=600DL/日。フレームワークは他事業に転用可能。

藤井 (テック視点)

技術スタック Expo + RevenueCat + PostHog + SQLite ローカル。バックエンドなし。Windowsからリリース可能。即トレース可能だが、Apple審査がボトルネック。

川島 (逆張り視点)

ちょっと待って、これ生存者バイアス全開。本人も「Xバズは運要素」と自白している。1日10万→翌日以降1万に減衰している時点でストックビジネスではない。著者は登録者10万・書籍・アカデミーの複合体だから集客のスタート地点が違う。

西田 (ライフスタイル視点)

"ゴールイメージ→脳内自動逆算"と"思考拡散時に閃く" (散歩・読書中) は再現性ある原則。ロングゲーム推奨も合う。

ここまで来ると、要約ではなく意思決定の素材になります。「あ、川島の指摘あったから飛びつくのやめよう」とか「松本のフレームワークだけ抜き出して自分のPJに転用しよう」とか、次の行動に直結する。

特に川島の逆張りパートは単純要約では絶対に出てきません。情報の受け取り手として「これ騙されてない？」を構造的に挟む装置として機能しています。

⑤ 運用Tips

実際にしばらく回してみて、効いたコツがいくつかありました。

自分なりの「視点軸」を決めておく

私の場合は「ビジネス / テック / 逆張り / ライフスタイル」の4軸ですが、ここは目的に合わせて変えるのがおすすめです:

採用判断の動画レビュー → 候補者視点 / 既存社員視点 / 投資家視点 / カルチャー視点
競合ツールのレビュー動画 → 既存ユーザー視点 / 新規ユーザー視点 / 営業視点 / セキュリティ視点

軸さえ決まれば、あとは CLAUDE.md を書き換えるだけです。

逆張り役は必須

これは強く言いたいのですが、逆張り役を入れないと合議全員が"いいね"で終わる現象が頻発します。

LLMは基本的に同意・賞賛バイアスがあるので、明示的に「これ生存者バイアスでは？」「再現性ないのでは？」を担当させるキャラを置かないと、4人いる意味がなくなります。

動画は「字幕が取れるか」で素材適性が決まる

自動字幕すらない動画 (BGM・無音動画・古い動画) は YouTube Transcript API では取れません。これは仕様。

その場合は yt-dlp で音声を落として → ffmpegで圧縮 → Whisper (Groq/OpenAI) でテキスト化、というルートに切り替えます。私は webm の29MB音声を ffmpeg で12MB mp3 にしてから Groq Whisper Large-v3 (無料枠) に投げる構成で運用しています。コストはほぼゼロです。

まとめ

YouTube動画は単純要約だと意思決定の素材として弱い
4人キャラを CLAUDE.md に静的定義しておけば、Claude Code は分担してくれる
ペルソナ運用は「多角検討の素材」目的に限定する (事実判定には使わない)
逆張り役は必須 (同意バイアス除去装置)
字幕取れない動画は yt-dlp + Whisper でテキスト化

事業判断・新規アイデアの一次評価・競合ツールレビューなど、「多角的に見たいけど時間がない」場面で効きます。プロンプトを毎回打たなくていいのが地味に楽です。

何より、川島の「ちょっと待って」が入る瞬間が一番おいしいです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Claude CodeでYouTube字幕13,000字を"4人合議"に分析させたら、単なる要約じゃ拾えない視点が出てきた話

全体像

① 字幕の取得

② 4人のキャラを CLAUDE.md に書く

③ なぜ「ペルソナ」をつけるのか (重要)

④ 実際の出力例 (12,993字の動画を4人で分析)

松本 (ビジネス視点)

藤井 (テック視点)

川島 (逆張り視点)

西田 (ライフスタイル視点)

⑤ 運用Tips

自分なりの「視点軸」を決めておく

逆張り役は必須

動画は「字幕が取れるか」で素材適性が決まる

まとめ

② 4人のキャラを `CLAUDE.md` に書く