「動画作りたいけど、編集ソフト触りたくない」
プロダクトデモ、スプリントレビュー、解説動画 — 作りたいけどPremiere ProやDaVinci Resolveを開く気力がない。そんなエンジニアに朗報です。
claude-code-video-toolkit は、Claude Codeのターミナルから動画を自律生成するオープンソースツールキットです。/video と打つだけで、企画からレンダリングまでClaudeが担当します。
ツールキットの概要
| 項目 | 内容 |
|---|---|
| リポジトリ | digitalsamba/claude-code-video-toolkit |
| バージョン | v0.13.2 |
| ライセンス | MIT |
| Stars | 171+ |
| 動画エンジン | Remotion(React → MP4) |
できること
スラッシュコマンド
/setup # 初期設定(クラウドGPU、ストレージ、音声)
/video # プロジェクト作成・管理
/scene-review # Remotion Studioでシーン確認
/design # ビジュアル調整
/brand # ブランドプロファイル管理
/template # テンプレート一覧
/record-demo # Playwrightでブラウザ録画
/generate-voiceover # AI音声合成
/redub # 既存動画の音声差し替え
/voice-clone # カスタム音声の録音・統合
AI動画制作パイプライン
企画 → アセット生成 → レビュー → 音声合成 → 編集 → レンダリング → 完成
各フェーズは project.json で状態管理され、セッションを跨いでも途中から再開できます。プロジェクトごとに CLAUDE.md が自動生成され、Claudeが文脈を維持します。
使われているAIモデル
すべてオープンソースモデルを自分のクラウドGPUにデプロイして使います。APIキー課金ではなくコンピュート課金なので圧倒的に安い。
| モデル | 用途 | 1回あたりのコスト |
|---|---|---|
| Qwen3-TTS | 音声合成 | ~$0.01 |
| FLUX.2 Klein 4B | 画像生成 | ~$0.02 |
| ACE-Step | BGM生成(BPM/キー指定可) | ~$0.05 |
| SadTalker | トーキングヘッド(写真→動画) | ~$0.10 |
| LTX-2.3 22B | テキスト→動画 / 画像→動画 | ~$0.23 |
| ElevenLabs | プレミアム音声(フォールバック) | 従量課金 |
5分の動画を作るコスト: $1-3 — ElevenLabsの1/10以下です。
クラウドGPUの選択肢
Modal(推奨)
- 月$30の無料枠(Starterプラン)
- 通常の使用量なら月$1-2程度 → 実質無料
-
/setupコマンドで自動デプロイ
RunPod(代替)
- 秒単位課金、最低料金なし
- プリビルドDockerイメージ提供済み
Cloudflare R2(ストレージ)
- 10GB無料、エグレス料金ゼロ
- 生成したアセットの保存先として最適
トランジション効果
カスタムトランジションが7種 + Remotion公式4種:
// カスタム
glitch() // デジタルグリッチ + RGBシフト
rgbSplit() // 色収差エフェクト
zoomBlur() // ラジアルモーションブラー
lightLeak() // シネマティックレンズフレア
clockWipe() // 時計回りワイプ
pixelate() // ピクセレート
checkerboard() // チェッカーボード
// Remotion公式
slide(), fade(), wipe(), flip()
ブランドシステム
brands/your-brand/
├── brand.json # カラーパレット、タイポグラフィ
├── voice.json # ElevenLabs音声設定
└── assets/ # ロゴ、背景画像
/video でプロジェクト作成時にブランドが自動適用。色・フォント・音声が統一された動画が生成されます。
18個のPythonツール
音声系
-
voiceover.py— ElevenLabs or Qwen3-TTS -
music.py— BGM生成 -
sfx.py— 効果音プリセット -
redub.py— 音声差し替え -
addmusic.py— BGM合成
画像・動画系
-
flux2.py— テキスト→画像(FLUX.2) -
image_edit.py— スタイル転写、背景操作 -
upscale.py— 2x/4x解像度アップ -
ltx2.py— テキスト→動画(LTX-2.3) -
sadtalker.py— トーキングヘッド -
dewatermark.py— ウォーターマーク除去
セットアップ(5分)
git clone https://github.com/digitalsamba/claude-code-video-toolkit.git
cd claude-code-video-toolkit
pip install -r tools/requirements.txt # オプション
claude # Claude Code起動
Claude Code内で:
/setup # クラウドGPU設定(対話式)
/video # 最初の動画プロジェクト作成
必要環境: Node.js 18+, Claude Code, Python 3.9+(推奨), FFmpeg(オプション)
制作ワークフロー
1. /video → テンプレート選択 + ブランド適用
2. VOICEOVER-SCRIPT.md を編集(シーン構成)
3. アセット収集(/record-demo or 外部素材)
4. /scene-review でプレビュー確認
5. /design でスタイリング調整
6. /generate-voiceover で音声生成
7. npm run studio でライブプレビュー
8. npm run render で最終MP4出力
関連ツール
wilwaldon/Claude-Code-Video-Toolkit はキュレーションリポジトリで、digitalsamba版に加えて以下も紹介:
| ツール | 用途 |
|---|---|
| Remotion Agent Skills | React→MP4(6M+ビュー、25k+インストール) |
| Manim Skill | 数学・科学アニメーション |
| YouTube Clipper | YouTube動画の自動チャプター分割(633 Stars) |
| Playwright MCP | ブラウザ操作の動画録画 |
これが意味すること
動画制作の民主化が次のフェーズに入りました。
Before: Premiere Pro/After Effects + 編集スキル + 何時間もの手作業
After: /video → テンプレート選択 → スクリプト書く → レンダリング
コストも破壊的です。5分の解説動画が$1-3。月5本作っても$15以下。Modalの無料枠内なら実質ゼロ。
エンジニアが「動画も出せる」時代が来ています。ブログ記事を書くのと同じ感覚で、動画コンテンツを量産できる基盤がオープンソースで揃い始めました。
リンク
- digitalsamba/claude-code-video-toolkit — メインリポジトリ
- wilwaldon/Claude-Code-Video-Toolkit — キュレーション版
- Remotion — React動画フレームワーク
- Modal — クラウドGPUプラットフォーム