🎬【Windows版】AIで動画生成！mulmocast-cliを動かすための環境構築マニュアル（ffmpeg / Git / Node.js / mulmocast）

Last updated at 2025-08-07Posted at 2025-06-08

はじめに

こんにちは、エンジニア・営業・クリエイター・経営・大企業・中小企業全てを経験しておりますせいやです。

これまでNTTデータグループでシステムエンジニアを7年経験後、工業製品を扱う中小零細の商社に転職し、現在は営業・経営・DX支援などをしております。

デジタルとアナログの両極端の業界を経験した目線で、AIネイティブな組織に近づけるため、日々実践している仕組みやノウハウをQiitaでも発信しています。

💬 工業製品のご要望、DX関係の質問やご相談があれば、以下いずれかからお気軽にご連絡ください！

X：杉本誠也

メール：sugimoto@sawada5681.jp

会社HP：https://sawada5681.jp/

🧠 概要

mulmocast（マルモキャスト）は、中島聡さんが開発したAIマルチモーダル動画生成ツールです。テキストスクリプトから、画像・音声・動画・スライド・ポッドキャストまで自動生成できます。

今回は、以下の GitHub リポジトリを参考にしながら、Windows 環境で実際に mulmocast を動かした手順をまとめました。

📘 GitHub（中島聡さん）：
👉 https://github.com/receptron/mulmocast-cli

🔧 こんな人におすすめ

ChatGPTやAIを使った動画制作に興味がある
mulmocast を使って、実際に手元で動画を作ってみたい
JSONでスクリプトを書いて、画像や音声、映像を組み立ててみたい
ElevenLabs、FFmpegなどを組み合わせたAIクリエイティブに挑戦したい

✅ 全体の流れ

ステップ	内容
Step 1	`ffmpeg` のインストール
Step 2	`Git` のインストール
Step 3	`Node.js` のインストール
Step 4	`mulmocast-cli` のインストール
Step 5	動作確認までやってみる

🔧 Step 1：`ffmpeg` をインストールする

ffmpegって？

動画・音声の変換や結合を行うコマンドラインツール。mulmocastでは音声・映像処理に必要です。

1. ffmpeg公式サイトへアクセス

https://ffmpeg.org/download.html → Windows builds by Gyan.dev

2. "Release builds" から ffmpeg-release-full.7z をダウンロード

3. ZIPを解凍して任意の場所に置く（例：`C:\ffmpeg`）

4. 環境変数PATHを追加

Windows検索で「環境変数」と入力し「ユーザー環境変数」を開く
「ユーザー環境変数」のPath を選んで「編集」→ C:\ffmpeg\bin を追加

5. 動作確認

ffmpeg -version

バージョンが表示されれば成功！

🧰 Step 2：`Git` をインストール

1. Git公式サイトからインストーラーをダウンロード

https://git-scm.com/

2. インストーラーを起動して基本は「Next」でOK（特別な設定は不要）

3. インストール後、確認

git --version

⚙️ Step 3：`Node.js` をインストール

1. Node.js公式サイトへアクセス

https://nodejs.org/ja/

2. 推奨版（LTS）を選んでインストーラーを実行（例：18系）

3. 確認

node -v
npm -v

📦 Step 4：`mulmocast-cli` をインストール

ここからは、以下中島さんの Github とほぼ同じ内容です。

1. コマンドプロンプトまたはPowerShellで以下を実行

npm install -g mulmocast-cli

2. インストール確認

npx mulmocast --version

バージョンが出ればOK！

🔑 Step 5：APIキーの設定

mulmocast では、OpenAI APIキーやElevenLabsのAPIキーを .env ファイルで指定する必要があります。
.env ファイルをプロジェクトのルートディレクトリ（mulmocast-cli 配下）に作成し、以下のように記述します：

OpenAI: https://platform.openai.com/account/api-keys
ElevenLabs: https://www.elevenlabs.io/

`.env` ファイルの中身（参考）

OPENAI_API_KEY=sk-xxxx...
ELEVENLABS_API_KEY=elevenlabs-xxxx...

🎬 Step 6：実際に動かしてみる（実践ワークフロー）

① 映像化したいURLをコピー

例）

https://xxx/article

② ChatGPTで指示を出す

Read this article: https://xxx/article

③ ターミナルで以下を実行

mulmo tool prompt -t business

④ ChatGPTに戻って、プロンプトを貼り付けて実行

→ スクリプトが生成される。

⑤ スクリプトが出力されたら、コピー

右上の Copy ボタンでOK！

⑥ ターミナルに戻って以下を実行

mulmo movie __clipboard

__（アンダーバー2つ）です。
clipboard の内容を使って movie 化するため、ペースト不要です。
画像や音声、JSONファイルなどが生成され、以下の構造になります：

./output
├── audio/
├── images/
├── script_20250608_xxxxxx.json
├── script_20250608_xxxxxx_studio.json
├── script_20250608_xxxxxx.mp3
└── script_20250608_xxxxxx.mp4 ← ⚠️ 今回は生成に失敗しました

❌ トラブル報告：mp4だけが生成されない

実際に __clipboard で画像・音声・JSON までは正常に生成されましたが、mp4出力だけが失敗しました。

🔍 考えられる原因

ffmpegのパス設定に問題なし
.envも正しく認識
json, mp3, pngはOK → 動画結合部分のみ不具合の可能性
対応策はGitHubの mulmocast-cli issues をチェック中
まずは自分を疑うことが大事！

🇯🇵 日本語字幕や音声で映像を生成する

以下はJSONを指定して、字幕や音声付きにするコマンド例です。

mulmo movie output/script_20250608_xxxxxx.json -c ja   # 日本語字幕付き
mulmo movie output/script_20250608_xxxxxx.json -l ja   # 日本語音声付き

-c ja → 字幕（Caption）
-l ja → 音声（Lang）

🗒 まとめ

ツール	役割
ffmpeg	映像・音声変換
Git	CLI連携・コード取得
Node.js	CLI実行基盤
mulmocast-cli	スクリプト → 映像自動生成

🧭 補足と注意点

.env 設定ミスが多い
ffmpegのパス忘れがち
mulmo movie でアンダーバー2つを忘れない

🎉 最後に

今回、Windows環境で mulmocast を実際に試してみて、画像と音声（mp3）の生成までは成功しました。
残念ながら実力不足で mp4 動画の生成には至りませんでしたが、途中まででも十分にAIの強力な自動化力を実感できる素晴らしい体験でした。

何より、このツールは ChatGPT や ElevenLabs、などと連携しながら、テキストから一気にマルチモーダルコンテンツを作る基盤として非常に優れており、今後の**横展開（ブログ、SNS、YouTube、ポッドキャストなど）**にも最適です。

興味のある方はぜひ一度試してみてください！

mulmocast 公式ドキュメント（日本語）：
👉 https://github.com/receptron/mulmocast-cli/blob/main/docs/beta1_ja.md

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up