🧠 はじめに
mulmocast(マルモキャスト) は、中島聡さんが開発したAIマルチモーダル動画生成ツールです。テキストスクリプトから、画像・音声・動画・スライド・ポッドキャストまで自動生成できます。
今回は、以下の GitHub リポジトリを参考にしながら、Windows 環境で実際に mulmocast を動かした手順をまとめました。
📘 GitHub(中島聡さん):
👉 https://github.com/receptron/mulmocast-cli
🔧 こんな人におすすめ
- ChatGPTやAIを使った動画制作に興味がある
-
mulmocast
を使って、実際に手元で動画を作ってみたい - JSONでスクリプトを書いて、画像や音声、映像を組み立ててみたい
- ElevenLabs、FFmpegなどを組み合わせたAIクリエイティブに挑戦したい
✅ 全体の流れ
ステップ | 内容 |
---|---|
Step 1 |
ffmpeg のインストール |
Step 2 |
Git のインストール |
Step 3 |
Node.js のインストール |
Step 4 |
mulmocast-cli のインストール |
Step 5 | 動作確認までやってみる |
🔧 Step 1:ffmpeg
をインストールする
ffmpegって?
動画・音声の変換や結合を行うコマンドラインツール。mulmocastでは音声・映像処理に必要です。
1. ffmpeg公式サイトへアクセス
2. "Release builds" から ffmpeg-release-full.7z をダウンロード
3. ZIPを解凍して任意の場所に置く(例:C:\ffmpeg
)
4. 環境変数PATHを追加
- Windows検索で「環境変数」と入力し「ユーザー環境変数」を開く
- 「ユーザー環境変数」の
Path
を選んで「編集」→C:\ffmpeg\bin
を追加
5. 動作確認
ffmpeg -version
バージョンが表示されれば成功!
🧰 Step 2:Git
をインストール
1. Git公式サイトからインストーラーをダウンロード
2. インストーラーを起動して基本は「Next」でOK(特別な設定は不要)
3. インストール後、確認
git --version
⚙️ Step 3:Node.js
をインストール
1. Node.js公式サイトへアクセス
2. 推奨版(LTS)を選んでインストーラーを実行(例:18系)
3. 確認
node -v
npm -v
📦 Step 4:mulmocast-cli
をインストール
ここからは、以下中島さんの Github とほぼ同じ内容です。
1. コマンドプロンプトまたはPowerShellで以下を実行
npm install -g mulmocast-cli
2. インストール確認
npx mulmocast --version
バージョンが出ればOK!
🔑 Step 5:APIキーの設定
mulmocast では、OpenAI APIキーやElevenLabsのAPIキーを .env ファイルで指定する必要があります。
.env ファイルをプロジェクトのルートディレクトリ(mulmocast-cli 配下)に作成し、以下のように記述します:
- OpenAI: https://platform.openai.com/account/api-keys
- ElevenLabs: https://www.elevenlabs.io/
.env
ファイルの中身(参考)
OPENAI_API_KEY=sk-xxxx...
ELEVENLABS_API_KEY=elevenlabs-xxxx...
🎬 Step 6:実際に動かしてみる(実践ワークフロー)
① 映像化したいURLをコピー
例)
https://xxx/article
② ChatGPTで指示を出す
Read this article: https://xxx/article
③ ターミナルで以下を実行
mulmo tool prompt -t business
④ ChatGPTに戻って、プロンプトを貼り付けて実行
→ スクリプトが生成される。
⑤ スクリプトが出力されたら、コピー
- 右上の
Copy
ボタンでOK!
⑥ ターミナルに戻って以下を実行
mulmo movie __clipboard
-
__
(アンダーバー2つ)です。 - clipboard の内容を使って movie 化するため、ペースト不要です。
- 画像や音声、JSONファイルなどが生成され、以下の構造になります:
./output
├── audio/
├── images/
├── script_20250608_xxxxxx.json
├── script_20250608_xxxxxx_studio.json
├── script_20250608_xxxxxx.mp3
└── script_20250608_xxxxxx.mp4 ← ⚠️ 今回は生成に失敗しました
❌ トラブル報告:mp4だけが生成されない
実際に __clipboard
で画像・音声・JSON までは正常に生成されましたが、mp4出力だけが失敗しました。
🔍 考えられる原因
- ffmpegのパス設定に問題なし
- .envも正しく認識
- json, mp3, pngはOK → 動画結合部分のみ不具合の可能性
- 対応策はGitHubの mulmocast-cli issues をチェック中
- まずは自分を疑うことが大事!
🇯🇵 日本語字幕や音声で映像を生成する
以下はJSONを指定して、字幕や音声付きにするコマンド例です。
mulmo movie output/script_20250608_xxxxxx.json -c ja # 日本語字幕付き
mulmo movie output/script_20250608_xxxxxx.json -l ja # 日本語音声付き
-
-c ja
→ 字幕(Caption) -
-l ja
→ 音声(Lang)
🗒 まとめ
ツール | 役割 |
---|---|
ffmpeg | 映像・音声変換 |
Git | CLI連携・コード取得 |
Node.js | CLI実行基盤 |
mulmocast-cli | スクリプト → 映像自動生成 |
🧭 補足と注意点
-
.env
設定ミスが多い - ffmpegのパス忘れがち
-
mulmo movie
でアンダーバー2つを忘れない
🎉 最後に
今回、Windows環境で mulmocast
を実際に試してみて、画像と音声(mp3)の生成までは成功しました。
残念ながら実力不足で mp4
動画の生成には至りませんでしたが、途中まででも十分にAIの強力な自動化力を実感できる素晴らしい体験でした。
何より、このツールは ChatGPT や ElevenLabs、などと連携しながら、テキストから一気にマルチモーダルコンテンツを作る基盤として非常に優れており、今後の**横展開(ブログ、SNS、YouTube、ポッドキャストなど)**にも最適です。
興味のある方はぜひ一度試してみてください!
mulmocast 公式ドキュメント(日本語):
👉 https://github.com/receptron/mulmocast-cli/blob/main/docs/beta1_ja.md