【Python】動画・音声ファイルをAIで文字起こしする方法（無料、MacBook）

Last updated at 2026-03-08Posted at 2026-03-08

はじめに

Web会議や研究発表などで録画・録音した動画・音声ファイルを、MacBook、Pythonを使って文字起こしする方法を説明します。簡単なので試してみて下さい。ffmpeg、Pythonのopenai-whisperライブラリを使用します。

※Open AIのアカウントは不要です。

また、GeminiやChatGPTを使用すれば簡単では？と思うかもしれませんが、無料版では以下のような制限があります。
・ファイルのサイズの制限：例えば、100MB以上のファイルを入力できない等
・ファイルの長さの制限：動画や音声ファイルの時間が長すぎると入力できない等

上記の理由から、簡単に実施できる手順を整理しました。

以下のコマンドでffmpegをインストールします。
※homebrewのインストールは適宜実施して下さい。

brew install ffmpeg

次に、Pythonでopenai-whisperライブラリをインストールします。
※Pythonのインストールや、仮想環境の作成は適宜実施して下さい。

pip install openai-whisper

いきなり、動画ファイルを文字起こしする事もできますが、動画ファイルを音声ファイルに変換し、ファイルサイズを小さくしてから、文字起こしする方法が効率良いです。

ffmpeg -i video.mp4 -vn -acodec mp3 audio.mp3

whisper audio.mp3 --language Japanese

以下のコマンドを実施するだけです。

whisper audio.mp3 --language Japanese

Web会議や研究発表などで録画・録音した動画・音声ファイルを、MacBook、Pythonを使って文字起こしする方法を説明しました。もし、上記のような状況に遭遇した際は、試していただければ幸いです。