Video Indexerとは?
MicroSoftが提供している動画・音声を分析してくれるAI。
分析情報には音声の文字起こし、話者の特定、字幕生成などが含まれる。
料金について
Azure Video Indexerより(2022年11月15日現在)
動画から音声を抽出してVideo Indexerの字幕生成コストを下げる
前述のように、1分あたりの価格が動画と音声で大きく異なる。
動画ファイルを分析すれば話者の特定など、より付加価値の高い分析が可能だが、
音声ファイルの分析でも音声の文字起こし・字幕生成は可能である。
そこでFFmpegの出番。動画から音声を抽出してくれる無料ツールである。
これを使って、文字起こししたい動画ファイルから音声ファイルを抽出し、Video Indexerに音声ファイルをアップすれば利用コストを下げれる。
どのぐらいコストを下げれるか?
1時間あたり約1000円のコストカットができる。
仮に1時間の動画100本を対象にしたら、1000円✖️100本 = 10万円の節約!