LoginSignup
1
2

More than 1 year has passed since last update.

動画の音声から文字起こしする

Posted at

目的

動画内で話している内容を文字列に変換してファイルに保存する。

背景

前回のNo.3記事により、shotcutのmltプロジェクトファイルに動画を追加出来た。次はテロップを追加するための文字列を、動画の音声から文字起こしして用意する。

環境

  • Windows10 バージョン21H1(OSビルド19043.1348)
    • Python3.9.1
    • SpeechRecognition 3.8.1
  • 動画撮影:iPhoneX

セットアップ

これまでの記事のセットアップを実施して、追加で以下のライブラリをセットアップする。
- Windowsキーを押す
- 検索ボックスに「cmd」を入力して決定する
- 以下のコマンドを実行する

cmd.exe
pip install SpeechRecognition

使い方

GitからSource code(zip)をダウンロードして、展開する。
展開したパスを「c:\Git\traning\」として、加工前の動画ファイルが「c:\temp\test.mov」なら以下のコマンドを実行する。

cmd.exe
cd c:\Git\traning\python\Movie
python movieHelper.py c:\temp\test.mov

動画と同じフォルダに、動画と同じファイル名で、文字起こしのテキストファイルが作成される。

自分のコードにimportして使うなら、movieHelper.pyファイルを取り込み、以下の通り記載する。

python
from movieHelper import MovieHelper
mh = MovieHelper('c:/temp/test.mov')
mh.mov_to_text()

おわりに

私は調べていませんが、SpeechRecognitionは最大で1分程度の音声ファイルしか変換できないそうです。
なるべく長く分割して変換しないと、文章が分かれてしまうので、良い変換がされないように思います。
そのうち、最適な区切り方も考えてみたいです。
次回は今回用意した文字列をテロップにする予定です。

関連リンク

参考サイト

以下の記事を参考にさせていただきました。ありがとうございました。

ドキュメント

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2