📺 「Claude Code でいろいろ作ってみた」シリーズ
ターミナルで動く AI「Claude Code」に、ふだんの作業道具を日本語で頼んで作ってもらう記録です。今回は 第1回:ずんだもんの掛け合い動画を作る道具 編。
「台本のテキストを用意したら、あとはコマンド一発でずんだもんと四国めたんがしゃべる動画が完成する」——そんな道具を、私は自分でコードをほとんど書かずに作りました。作ってくれたのは Claude Code(ターミナルで動く AI のプログラミング相棒)です。
この記事は「プログラミングはよく分からないけど、AI に道具を作らせるって実際どういう感じなの?」という人に向けて、できるだけかみ砕いてその流れを書いた記録です。専門用語は最小限にして、コードもほとんど出しません。雰囲気をつかんでもらえたら十分です。
何を作ったのか
ひとことで言うと、「セリフを書いた台本 → しゃべる動画(mp4)」に変換してくれる道具です。
たとえばこんなテキストを用意します。
めたん: 今日はSEOについて話すのだ。
ずんだもん: SEOってなんなのだ?
めたん: 検索で上位に出るための工夫のことよ。
これを道具に渡すと、
- ずんだもん・四国めたんの 声 が自動で付き
- 画面の左右に 立ち絵(キャラのイラスト) が立ち
- 画面下に 字幕 が出て
- しゃべっている方のキャラが明るく、聞いている方が暗くなり
- 必要なら BGM も流れる
——という動画が、最後に1本の mp4 ファイルとして出てきます。いわゆる「ゆっくり実況」っぽい動画ですね。
ポイントは、この道具そのものを Claude Code に作ってもらったということです。私がやったのは「こういう道具が欲しい」と相談して、出てきたものを確認する作業がほとんどでした。
そもそも Claude Code って?
ざっくり言うと、ターミナル(黒い画面)の中にいる、コードを書ける AI アシスタントです。
ふつうの AI チャットは「文章で答えてくれる」だけですが、Claude Code は違います。
- 自分でファイルを作ったり書き換えたりできる
- コマンドを実行して、動くかどうか自分で試せる
- エラーが出たら、それを読んで自分で直そうとする
つまり「相談相手」ではなく「手を動かしてくれる作業者」に近いです。私は日本語で「こうしたい」と伝えるだけで、実際の組み立ては Claude Code がやってくれました。
動画ができるまでの流れ(ここがキモ)
道具の中身は、料理でいう「ベルトコンベア式の流れ作業」になっています。台本という材料を入れると、工程を1つずつ通って、最後に動画が出てくる仕組みです。
実際の設計図にもこの流れがそのまま描いてあります。
台本テキスト
│ ①読み取り 「誰が」「何を」しゃべるかに分解する
▼
セリフのリスト
│ ②声を作る VOICEVOX で1セリフずつ音声にする
▼
音声ファイル
│ ③時間を計算 各セリフが何秒で、いつ始まるかを決める
▼
タイムライン
│ ④字幕を作る 画面に出す字幕の画像を1枚ずつ作る
▼
字幕の画像
│ ⑤全部合成 背景+立ち絵+字幕+声+BGM を重ねる
▼
完成した動画(mp4)
工程を1つずつ、できるだけやさしく説明します。
① 台本を「誰が・何をしゃべるか」に分解する
最初の工程は、台本の読み取りです。
めたん: 今日はSEOについて話すのだ。 という1行を見て、「しゃべる人=めたん」「セリフ=今日はSEOについて話すのだ。」というふうに、2つの情報に分けて整理します。
人間なら一目で分かることですが、コンピュータには「ここが名前」「ここがセリフ」と教えてあげる必要があります。その仕分け係を最初に作りました。
② セリフを「声」に変える(VOICEVOX)
次に、分解したセリフを音声にします。ここで活躍するのが VOICEVOX という無料の音声合成ソフトです。
VOICEVOX は「文字を入れると、ずんだもんや四国めたんの声で読み上げてくれる」道具です。今回の動画の声は、すべてこの VOICEVOX に作ってもらっています。
工夫したのは「同じセリフは作り直さない」という仕組みです。動画を何度も作り直すとき、毎回ぜんぶの声を作り直すと時間がかかります。そこで「一度作った声は保存しておいて、同じセリフが来たら使い回す」ようにしました(これを「キャッシュ」と言います)。おかげで2回目以降がぐっと速くなります。
③ 「いつ・何秒しゃべるか」を計算する
声ができると、それぞれの音声が「何秒の長さか」が分かります。
たとえば最初のセリフが3秒、次が2秒なら、「1つ目は0秒から、2つ目は3秒すぎから始める」というふうに、しゃべる順番とタイミングの一覧表を作ります。これが動画全体の進行表になります。セリフとセリフの間に少し「間(ま)」を入れるのもこの工程です。
④ 字幕の画像を1枚ずつ作る
画面下に出る字幕も、ここで用意します。
地味ですが、ここが一番こだわったところかもしれません。日本語の字幕は、適当に改行すると「。」や「、」が行の先頭に来てしまって、すごく読みづらくなります。そこで「句読点を行の頭に置かない」「SEO のような英語のまとまりは途中で切らない」といった、日本語として自然な改行のルールを入れてもらいました。
こういう「言われてみれば当たり前だけど、自分で作ると面倒」な部分こそ、AI に任せると楽でした。
⑤ 全部を重ねて1本の動画にする
最後に、これまで作ったものを全部重ね合わせます。
- 背景の画像
- 左右の立ち絵
- 字幕の画像
- 声とBGM
これらを進行表どおりに並べて、しゃべっているキャラを明るく・聞いているキャラを暗くしながら、1本の mp4 動画に書き出します。これで完成です。
実際に動かすのはコマンド1つ
ここまで工程は5つありましたが、使う側がやることはコマンドを1つ打つだけです。
python -m src.main
これを実行すると、①〜⑤が自動でぜんぶ走って、最後に動画ファイルが出てきます。途中の工程を意識する必要はありません。料理でいえば「材料を入れてスイッチを押すだけ」の状態です。
最初にちゃんと組んでおけば、あとは台本を差し替えてコマンドを打つだけで、何本でも動画が作れます。
Claude Code に作らせて、よかったこと
完全な未経験ではないものの、これだけの道具を一人で最初から書くのは私には大変でした。AI に任せてよかったと感じたのは次の点です。
| よかったこと | 中身 |
|---|---|
| 日本語で頼める | 「字幕の改行を自然にして」と言えば、面倒なルールも組んでくれる |
| 試して直してくれる | エラーが出ても、自分で原因を読んで直そうとしてくれる |
| 全体を覚えていてくれる | 「前に決めたこの方針」を踏まえて続きを作ってくれる |
| 設計図を残せる | 「どう作るか」の計画書も一緒に書いてくれるので後で迷わない |
特に最後の「設計図(計画書)を先に作る」のが効きました。いきなり作り始めるのではなく、「どんな工程を、どの順番で作るか」を文章にまとめてから進めたので、途中で迷子になりませんでした。
つまずいたところ・気をつけたこと
良いことばかりではありません。AI に任せるときに気をつけた点もあります。
- 声の準備は別で必要:VOICEVOX は別のソフトなので、先に起動しておく必要があります。これを忘れると「声が作れない」で止まります。
- 丸投げはしない:「こう作って」と頼んだあと、出てきたものが意図どおりか自分で確認しました。AI も完璧ではないので、最終チェックは人間の仕事です。
- 権利のルールを決めておく:使うキャラ(ずんだもん・四国めたん)や立ち絵には利用ルールがあります。商用利用できるか・クレジットは必要かを最初に整理しておくと安心です。
まとめ
| 項目 | 内容 |
|---|---|
| 作ったもの | 台本テキスト → しゃべる動画(mp4)に変換する道具 |
| 作ってくれた人 | Claude Code(ターミナルで動く AI) |
| 私がやったこと | 日本語で「こうしたい」と相談 → 出てきたものを確認 |
| 動画の流れ | 台本を分解 → 声を作る → 時間を計算 → 字幕を作る → 全部合成 |
| 使うとき | コマンド1つで①〜⑤が自動で走る |
「プログラミングが分からなくても、AI に相談しながら自分専用の道具が作れる」——これが一番伝えたかったことです。難しそうに見える動画の自動生成も、工程を1つずつに分ければ「材料を流す → 1本の動画が出てくる」というシンプルな流れでした。
同じように「こんな作業を自動化できたらな」と思っているものがあれば、まず Claude Code にふだんの言葉で相談してみるのがおすすめです。
📚「Claude Code でいろいろ作ってみた」シリーズ
このシリーズは、Claude Code に日常の作業道具を作らせた記録を1本ずつ書いていく全6回の予定です。
- 第1回(この記事):ずんだもんの掛け合い動画を作る道具
- 第2回:台本そのものを AI に書かせる(お題 → 台本)
- 第3回:サムネイル画像を自動で作る
- 第4回:タイトル・概要欄・字幕ファイルをまとめて作る
- 第5回:YouTube 投稿用の素材を一式そろえる
- 第6回:縦型ショート(Shorts)を量産する
「プログラミングは分からないけど、AI に相談しながら自分専用の道具を作る」をテーマに続けていくので、よかったら次回ものぞいてみてください。