MulmoCast:AI時代の“話す・描く・伝える”を変えるマルチモーダル生成ツール
イントロダクション
あなたが語りたいストーリー、説明したいアイディア、伝えたい知識――。
それを「スクリプト1つ」で、動画・ポッドキャスト・PDF・マンガなど、多様な形に自動で変換できたら?
MulmoCastは、まさにそんな時代を拓く、OSS発の“AIネイティブ”マルチモーダル生成ツールです。
2025年6月、v0.0.11リリースでさらに進化した本プロジェクトは、従来のPowerPointやKeynoteとは一線を画します。
AIが台本を書き、素材をつくり、映像を編集する――まるでジブリ映画の魔法のような自動化を、あなたの手元に届けてくれます。
MulmoCastとは?
MulmoCastは、
- **LLM(大規模言語モデル)**が「何を伝えたいか?」を受け取り
- 独自の「MulmoScript」スクリプト(JSON/YAML)を生成
- そしてCLIで音声、画像、動画、PDFなどをワンコマンドで合成
する、人間とAIの協働ワークフローを実現します。
ポイントは、
“動画もマンガも、ひとつのスクリプトから生み出せる”
こと。たとえば「AI時代の学び方」というテーマでスクリプトを書けば、そのままSNS用の短尺動画やPodcast、配布用のPDFスライドや、マンガ風のストーリーまで生成できるのです。
コア技術と仕組み
MulmoScript
制作の中心となるのは「MulmoScript」と呼ばれるJSONベースの脚本フォーマット。
台本、画像指示、BGMや効果音、字幕テキストなど――
プレゼンの全要素を一元管理できます。
CLIによる自動生成
- スクリプト作成から
- 音声合成(mulmo audio)
- 画像生成(mulmo images)
- 動画合成(mulmo movie)
- PDF出力(mulmo pdf)
- 多言語翻訳(mulmo translate)
これらがすべて コマンドライン1本で完結。
しかもOpenAI(GPT-4o)、Anthropic Claude、Google Gemini、Groq Llama3など複数のAIモデルに対応し、将来的なモデル差し替えもコマンドだけで済みます。
多様な出力と使い道
MulmoCastの強みは「アウトプットの多様性」。
- SNS用ショート動画(16:9や9:16も対応)
- 本格的な解説動画(ジブリ風アニメもOK)
- Podcast番組(実際に“Mulmocast Tech Insights”がApple Podcastで配信中)
- スライド・PDF(配布用/ハンドアウト両対応)
- さらにマンガコマ割りも!
このすべてが MulmoScriptひとつから自動で生成されるため、
発信チャネルごとに内容を作り直す必要がありません。
AIとの連携と拡張性
2025年6月のv0.0.11からは、
- GraphAI callbackの導入により、ワークフローエンジンやエージェント型AIとの統合がより簡単に。
- 画像や音声の生成APIも“差し替え前提”で設計されており、今後新しいAI技術が登場してもMulmoCast側のコマンドで切り替え可能です。
コミュニティ開発も活発で、
テンプレートや機能追加、Node.js SDK化、YouTube Shorts特化などの新機能も続々と開発中です。
使い方:始めるには?
-
npm install -g mulmocast
でCLIを導入 -
brew install ffmpeg
などで動画合成環境も準備 -
.env
ファイルにOpenAI等APIキーをセット - まずは
mulmo tool scripting -i -t ghibli_strips -o ./ -s my_story
でスクリプト生成 - そのスクリプトを
mulmo audio ...
,mulmo images ...
,mulmo movie ...
で一気にコンテンツ化!
強みと課題
強み
- AI時代のクリエイター体験をCLIベースで実現
- 1つの脚本で何度も使いまわせる「再利用性」と「多様性」
- GraphAIなど最新AIワークフローともスムーズ連携
- プログラマブルな設計で自動化やCI/CD連携も容易
課題
- MulmoScriptは高度に抽象化されているため、ノンエンジニアには「最初の学習コスト」がある
- APIを多用するため、生成コスト(料金)にも注意が必要
- テンプレートの拡充やGUI化などは今後の課題
今後と展望
MulmoCastは「AIが書き、描き、話す」プレゼン・教育・広報の新しい標準を目指しています。
今後はGUIやテンプレートのマーケットプレイス、Node.jsライブラリ化、YouTube/Podcast等メディア連携の強化など、多くの進化が期待されています。
まとめ
MulmoCastは、“伝える”のあり方を根本から変えつつあるOSSです。
あなたのストーリーや知識を、世界中どこでも、どんなメディアでも、ワンコマンドで届けられる――。
AI時代の“話す・描く・伝える”を、ぜひ体験してみてください!
GitHub: receptron/mulmocast-cli
※本記事の内容は、ChatGPTによる生成結果と、公式GitHubリポジトリおよびgitの使用方法に関する情報を参考にまとめています。
MulmoCastの利用することによりプロンプトエンジニアリングでの操作が不要でかつ安定した成果物を取得できます。さらに利用して新しい発見があればまた記事で共有しようと思います。