スライドショーを作る
powerpointあれば
powerpointがあれば、その機能をつかって実現可能なのですが、ここではそれをつかわずに実現する方法を考えます。
音声の部分
音声は読み上げです。いわゆるTTSです。
voicevoxなどのTTSアプリで発生させます。
スライドショーの部分
Xの部分にはトータル上映時間をいれてください
ffmpeg -f concat -safe 0 -i image.txt -t X tmp.mp4
image.txtは次のような感じでつくりました。
file 'image1.jpg'
duration 5
file 'image2.jpg'
duration 3
file 'image3.jpg'
duration 7
音声と画像をあわせます
ffmpeg -i tmp.mp4 -i output1.mp3 -c:v copy -c:a aac -strict experimental SS1.mp4