英語スライドや技術ゴリゴリのドキュメント、読むのに苦労していませんか?
エンジニアやリサーチャーなら論文や海外情報をキャッチするときに英語は必須です。
PMや技術営業であれば専門用語などを含めた提案資料など理解しなければなりません。
ChatGPTやGeminiに解説してもらうのもいいですが、大量のテキストが一気に表示されて圧倒された経験がある人も少なくないと思います。
ところで最近、YouTubeが好きな人、コロナ世代の大学生や受験で塾で映像授業を受けた方、テレビ好きな方などは慣れ親しんでいると思いますが、動画で情報を理解するのがより一般化しているのが最近だと思います。
世代を問わず動画が一般化しています。
そんな中で普段の仕事でも動画で情報を理解できたらいいのに、、、と思うことが多かったです。
特に私は動画AIなどのリサーチもしているのですが、基本海外情報なので英語でのキャッチアップです。専門用語と英語が溢れる中で高速にキャッチアップすることに苦労していました。
もちろん、ChatGPTなどフル活用で進めていますが、個人的にはテキストが苦手な動画派なので研究も開発も動画でキャッチできればいいなと思っていました。
色々模索した結果納得できる中方法に辿り着きました…
今回の記事では、私のような英語が苦手で専門用語も自分のレベルに合わせて動画で解説してほしい!という欲張りな方に特にぴったりな、スライドを一瞬で自分専用の動画にしてしまう方法を紹介します。
具体的には、n8nというAIワークフローツールを使って、スライドを一瞬で自分専用解説動画にするAIワークフローを構築します。
AIの専門的な知識や、複雑なソフトウェアエンジニアリングの知識がなくても試せる内容になっているのでサクッと読み進めていただけると幸いです。
目次
1|作成したワークフロー
2|なぜ動画化をすると嬉しいのか
3|ワークフローの具体的な設計方法
対象読者
- マニュアルを作るのに苦労している人
- AIを使ってセミナー動画を作成したい人
- 動画もしくは生成AIに興味があるすべての人
Xではこのような動画とAIに関する情報を日々発信しているのでぜひフォローやいいねで応援いただけると励みになります。
動画AIやn8nを使った全自動の動画編集などの情報を発信しているので、フォローすると活用方法やエッジの事例をキャッチアップできます
それでは順番に解説していきます。
1|作成したワークフロー
まずは先に今回作成したスライドの動画化ワークフローを紹介します。
上図のようなワークフローに従ってスライドから自分に合わせた動画を自動で作成しています。
ノードの数が多くて仰々しいですが、実行していることは意外とシンプルです。
動画制作の過程をシステムに落とし込んで、順番に実行している状態です。ワークフローの仕組み上、10枚のスライドでも、100枚のスライドでも同じように動画にすることが可能です。
ワークフロー自体は反響があれば無料で配布しようと思っているので、Xなどで反応をもらえると嬉しいです。
2|なぜ動画化をすると嬉しいのか
なぜわざわざスライドを動画にする必要があるのか?こう思う方もいるかもしれません。
ですが専門的なスライドほど、パッと内容を理解するのは難しいです。
ビジネスマンの方でも、決算資料や技術提案資料をさっと読める方は多くないと思います。読めるのであればその道のプロの方だと思います。
スライドを動画化することのメリットは特に下記です:
- スライド数が何枚でも動画にできる
- 日本語以外の言語でも対応できる
- 専門知識がなくても資料を理解できる
個人利用以外では、チームメンバーに海外の方がいて手元に日本語の資料しかないという状態でも、メンバーの言語や理解度に合わせた動画にすることができてしまうのです。
スライドの動画化は、チームで資料をシェアする必要があるときに本領を発揮すると考えています。言語や知識の壁を超えて情報を分かりやすく伝達できるのです。
革命的ではないでしょうか。
一例として、スライドを動画化するシーンを紹介します:
- 研修資料の動画化
- 細かな仕様や規制が変化する業界や領域で、動画を作成するのが大変なシーンで活躍します
- Udemyなどのセミナーの自動作成
- Manusでセミナースライド作成 → セミナー動画を自動生成などで完全自動のコンテンツ販売が狙えます
- 大学の講義資料を動画にすることで、自分の学習レベルや理解度に合わせた解説動画にカスタマイズができる
- 多言語翻訳動画の自動作成
- 日本語資料しかなくても、外国人向けのマニュアル動画を自動化できます
- LT登壇の資料を動画にしてYouTubeやTikTokに公開してより多くの人に価値を届ける
- Slideshareに公開するだけでなく、動画にすることであなたの知見がより多くの人に届きます
- 専門外の技術資料を動画化
- 前提知識がない自分の状態に合わせてAIが動画を作成してくれます。
また、今回のワークフローは動画生成AIの「Diffusion Model」を使用していません(※ テキスト生成AIは使用しています)。
これによって、下記の嬉しいポイントがあります:
- 現場ですぐに活用できるレベルの動画が作成可能
- 生成が安定する。映像の生成に拡散モデルを使用しておらずスライドという既存のコンテンツをメインにしているので、知識がなくても意図した動画が簡単に作れます。
- 動画生成AIと比較して圧倒的にコストが安い
- 動画生成AIを使うと1分の動画に1,000円以上かかります。一方で今回の動画生成ワークフローは1分の動画で10円を切ります。単純なコスト比較だと100倍優れています。
- もちろん、生成する動画の目的が異なるので単純な比較はできませんが、多くの現場で必要とされる類の動画は今回の方が圧倒的に多いと思います。
利便性とコストの観点で、動画生成AIと比較して多くの現場で活用されるのはこちらの方法だと考えています。
3|ワークフローの具体的な設計方法
ここでは、スライドを動画化する自動ワークフローの設計について解説をします。
今回は、Googleスライドを読み込んで
他の形式のスライドや、PDFを読み込んで動画にするケースは別の記事で今後紹介するか、Xで作り方を発信します。
前準備:
まず、動画化したいスライドを準備します。今回紹介するのはGoogleスライドを自動で動画化する仕組みなので、Googleスライドをご用意ください。
ManusのようなAIを使ってスライドを準備してもいいですし、手元のスライドでもOKです。
ワークフロー:
実行スタート:
スライドリンクからスライドを取得します。
- クリックで実行開始できます
- スライドリンクをもとにn8n上でスライドを取得します
- そのスライドを、ページ単位でテキスト情報とスライドのサムネイルを取得します
- ワークフローの中で生成される中間ファイル(画像・音声・srt等)は全てGoogleドライブに保存します。
- 以降、スライドページ単位で処理を順番に進めていきます
トークスクリプトの作成
- スライド1枚ごとにトークスクリプトを作成します。全体のスライドの流れを意識しつつそのシーンの解説ができるように設計すると、より自然なスクリプトになります。
- 全体のスライドのサマリーをプロンプトに含めたり、シーンのサムネイルを入力に使用することでより精緻なトークスクリプトが作成できる等工夫の余地が大きい部分です
- トークスクリプトはシーン別にJSON形式で保持しておきます。
音声の生成
- 作成したトークスクリプトをもとに音声を生成します。音声生成系のシステムやサービスであればお好みでなんでもOKです。Elevenlabsは日本語音声も結構自然で使いやすい印象です。GoogleのTTSもかなり自然な日本語を生成してくれます。
- 今回はVOICEVOXで作成しました
テロップの作成
- テロップで重要な点:
- 解説系の動画はフルテロップ(全ての発話にテロップをつけている)のものが多いです。当然ですがテロップは音声とタイミングが同期していないとダメです。話している内容と全く関係のないテロップが表示されてしまっていては視聴者は混乱してしまいます。
- また、視覚的に自然なテロップであることもう重要です。例えば、句読点(、や。)が冒頭にきていたり、助詞が冒頭にあったりすると見ていてすごく違和感を覚えます。このようなテロップの視覚的最適化も重要です。
- 今回のワークフローではLLMを使って視覚最適化を補助しています。
- LLM(OpenAI API)で改行や表示のまとまり(ページング)の処理を実行しています。シーンごとにスクリプトを読み込ませてテロップの最適化をAIに提案させます。
- ちなみにsrtファイルを作成するときにはElevenlabsのSTTでタイムスタンプを取得して、その情報とテロップ表示情報を統合した処理を実装しています。
動画のレンダリング
- ffmpegを使って上記の処理で作成した素材をシーン別に統合して動画をレンダリングします。
- テロップは、srtからasrというファイルに変換することで簡単にデザインやアニメーションを適用可能です
- ffmpegのコマンドでスライドの配置やトランジション(シーンの切り替え時のアニメーション)を制御することが可能です。
- ちなみに今回の実装ではBGMを挿入する処理を追加しています。
以上のようにテキスト・画像・音声などを総合的に組み合わせることで、自動で動画を作成することが可能です。
ワークフローとしては長いですが、一つ一つの処理はシンプルなので噛み砕いて整理すると応用幅も広く可能性が大きいです。
まとめ
いかがだったでしょうか。
スライドからプレゼン動画を自動作成するn8nワークフローについて解説しました。プレゼン・解説系の動画は応用幅が圧倒的に広く、実利も大きい領域なので普段の業務や学習にも活用しやすいと思います。ぜひ自分オリジナルに最適化させて最高の動画を作ってみてください。
また、今回のワークフローの設計を自身で組めるようになると生成AIの業務活用という観点でかなりトレーニングになると思うのでぜひチャレンジしてみてください。構造化力と、システムへの落とし込み、AIの使い所の力が身につきます。
Xではこのような動画とAIに関する情報を日々発信しているのでぜひフォローやいいねで応援いただけると励みになります。
動画AIやn8nを使った全自動の動画編集などの情報を発信しているので、フォローすると活用方法やエッジの事例をキャッチアップできます
こちらの記事もどうぞ: