More than 1 year has passed since last update.

紙芝居方式で動画を作成

Last updated at 2024-10-03Posted at 2020-05-13

ffmpeg で複数枚の画像とセットにした音声から動画を作成します。

概要

個々の画像と対になる音声から個々の AVI ファイルを作成します。

test-00.png + test-00.wav → test-00.avi
test-01.png + test-01.wav → test-01.avi
（略）
test-99.png + test-99.wav → test-99.avi

※ 画像や音声は他のファイル形式でも構いません。

AVI ファイルを結合して MP4 ファイルを作成します。

test-00.avi + test-01.avi +（略）+ test-99.avi → test.mp4

※ AVI ファイルを経由しているのはファイルサイズを抑えるためです。ファイルサイズよりも画質を優先する場合、個々の動画も MP4 で作成して結合することが可能です。詳しくは以下の記事を参照してください。

ffmpegでMP4を作成する際に時間がずれる

テキストから画像と音声を生成して動画化する例も紹介します。ImageMagick などを使用します。

test.txt → test-*.png + test-*.wav → test-*.avi → test.mp4

作成方法

あまり凝ったオプションは付けずに、最低限のものだけを示します。

個々の画像と対になる音声から個々の AVI ファイルを作成します。

avi.sh

for png in test-*.png; do
    avi=`echo $png | sed s/png$/avi/`
    wav=`echo $png | sed s/png$/wav/`
    ffmpeg -loop 1 -i $png -i $wav -vcodec mpeg4 -acodec pcm_s16le -shortest $avi
done

結合するファイルのリストを作成します。

for avi in test-*.avi; do echo file $avi; done > test.lst

AVI ファイルを結合して MP4 ファイルを作成します。

ffmpeg -f concat -i test.lst -vcodec libx264 -acodec aac -pix_fmt yuv420p test.mp4

一連の流れをシェルスクリプトなどにまとめておけば良いでしょう。

音声合成

個々の音声は音声合成で生成することができます。

次の記事で作成した SAPI をラップしたコマンド wintts を使用して例を示します。

PythonでWindows 10の音声合成を使用する

画像の説明をテキストファイルで書いておき、それを音声に変換します。

test-00.txt → test-00.wav
test-01.txt → test-01.wav
（略）
test-99.txt → test-99.wav

wav.sh

for txt in test-*.txt; do
    wav=`echo $txt | sed s/txt$/wav/`
    wintts -v Sayaka -o $wav -i $txt
done

※ ここでは日本語を想定しています。Sayaka は日本語音声です。

システムに言語を追加すれば、他の言語を読み上げることも可能です。シェルスクリプトを工夫して音声を切り替えれば、複数の人物を登場させたり、英語と日本語を混ぜるようなことも可能です。

なお、Mac では say コマンドを使えば同じ事ができるようです。英語の音声が豊富なようです。

Macのsayコマンドの使い方

字幕

テキストから画像を生成することができます。ImageMagick を使用して例を示します。

test-00.txt → test-00.png
test-01.txt → test-01.png
（略）
test-99.txt → test-99.png

png.sh

for txt in test-*.txt; do
    png=`echo $txt | sed s/txt$/png/`
    convert -size 640x480 -font aquafont.ttf caption:"`cat $txt`" $png
done

【参考】ImageMagickで文字画像作成

字幕付き動画

字幕と音声合成を組み合わせれば、テキストファイルから簡単に字幕付き動画が作成できます。

改行ごとに区切って生成する例を示します。| は表示の都合で挿入する改行です。

cat.txt → cat-*.png + cat-*.wav → cat-*.avi → cat.mp4

cat.txt

吾輩は猫である。
名前はまだ無い。
どこで生れたか|とんと見当がつかぬ。
何でも薄暗いじめじめした所で|ニャーニャー泣いていた事だけは|記憶している。
吾輩はここで始めて|人間というものを見た。

【出典】吾輩は猫である - 青空文庫

txt2mp4.sh

target=cat.txt
prefix=`echo $target | sed 's/\.[^.]*$//'`
num=0
lines=()
while read line; do lines+=($line); done < $target
rm -f $prefix.lst
for line in ${lines[@]}; do
    name=`printf "%s-%02d" "$prefix" $num`
    echo "$name: $line"
    caption="`echo $line | sed 's/|/\n/g'`"
    convert -size 640x480 -font aquafont.ttf -gravity center caption:"$caption" $name.png
    wintts -v Sayaka -o $name.wav "`echo $line | sed 's/|//g'`"
    ffmpeg -loop 1 -i $name.png -i $name.wav -vcodec mpeg4 -acodec pcm_s16le -shortest $name.avi
    echo file $name.avi >> $prefix.lst
    num=$((num + 1))
done
ffmpeg -f concat -i $prefix.lst -vcodec libx264 -acodec aac -pix_fmt yuv420p $prefix.mp4

※ テキストの内容を配列に読み込んでいるのは、ffmpeg を挟むとパイプが文字化けするためです。WSL の問題なのか、詳細は不明です。

作成した動画です。

ImageMagickによる文字の画像化と組み合わせて、テキストファイルから字幕付き動画を作成する方法を追記しました。
例として、青空文庫から『吾輩は猫である』の冒頭を引用して動画を作成しました。 pic.twitter.com/ajhhljuGjL
— 七誌 (@7shi) May 14, 2020

↑ The media could not be played. となって再生できない場合、ツイートをクリックして Twitter を開いてください。

商用サービス

SAPI の音声は Windows があれば利用できるのですが、正直、それほど品質が高くありません。品質に満足できない場合は、Amazon Polly のような商用サービスを利用する方法もあります。

【ミニレビュー】入力したテキストを音声に変換するAWS「Amazon Polly」を無料で試す-Impress Watch

Amazon Pollyの初回利用から12カ月間は、500万字/月まで無料。500万字なら、音声の長さで100時間超は使える計算となるので、試しに使ってみるには十分です。

今回の記事では ImageMagick を使用しました。もっと凝ったことをする場合、HTML でデザインして画像化する方法があります。以下の記事では連続で画像化して専用サーバー経由でファイルにする方法を紹介しています。

既に存在する音声に対して、AI で字幕や背景を付ける方法です。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

紙芝居方式で動画を作成

概要

作成方法

音声合成

字幕

字幕付き動画

商用サービス

関連記事