はじめに
Web会議や研究発表などで録画・録音した動画・音声ファイルを、MacBook、Pythonを使って文字起こしする方法を説明します。簡単なので試してみて下さい。ffmpeg、Pythonのopenai-whisperライブラリを使用します。
※Open AIのアカウントは不要です。
また、GeminiやChatGPTを使用すれば簡単では?と思うかもしれませんが、無料版では以下のような制限があります。
・ファイルのサイズの制限:例えば、100MB以上のファイルを入力できない等
・ファイルの長さの制限:動画や音声ファイルの時間が長すぎると入力できない等
上記の理由から、簡単に実施できる手順を整理しました。
環境構築
1. ffmpeg のインストール
以下のコマンドでffmpegをインストールします。
※homebrewのインストールは適宜実施して下さい。
brew install ffmpeg
2. openai-whisper ライブラリのインストール
次に、Pythonでopenai-whisperライブラリをインストールします。
※Pythonのインストールや、仮想環境の作成は適宜実施して下さい。
pip install openai-whisper
動画から文字起こし
いきなり、動画ファイルを文字起こしする事もできますが、動画ファイルを音声ファイルに変換し、ファイルサイズを小さくしてから、文字起こしする方法が効率良いです。
1. 動画ファイル → 音声ファイルに変換
ffmpeg -i video.mp4 -vn -acodec mp3 audio.mp3
2. 音声ファイル → 文字起こし
whisper audio.mp3 --language Japanese
音声から文字起こし
以下のコマンドを実施するだけです。
whisper audio.mp3 --language Japanese
終わりに
Web会議や研究発表などで録画・録音した動画・音声ファイルを、MacBook、Pythonを使って文字起こしする方法を説明しました。もし、上記のような状況に遭遇した際は、試していただければ幸いです。