はじめに
音楽制作や音声編集をPythonで行いたいと思ったことはありませんか?pydubは、そんな願いを叶えてくれる強力なライブラリです。この記事では、pydubの基本的な使い方を紹介し、音声処理の世界への扉を開きます。
pydubとは?
pydubは、Pythonで音声ファイルを簡単に操作できるライブラリです。波形の生成、編集、エフェクト適用など、様々な音声処理が可能です。
インストール
pydubのインストールは非常に簡単です。以下のコマンドをターミナルで実行するだけです。
pip install pydub
注意:pydubは内部でFFmpegを使用しています。FFmpegがインストールされていない場合は、別途インストールが必要です。
基本的な使い方
1. 音声ファイルの読み込み
from pydub import AudioSegment
# WAVファイルの読み込み
sound = AudioSegment.from_wav("example.wav")
# MP3ファイルの読み込み
sound = AudioSegment.from_mp3("example.mp3")
2. 音量の調整
# 音量を6dB上げる
louder_sound = sound + 6
# 音量を3dB下げる
quieter_sound = sound - 3
3. 音声の切り取り
# 最初の5秒を切り取る
first_5_seconds = sound[:5000]
# 2秒から7秒までの部分を切り取る
slice = sound[2000:7000]
4. ファイルの書き出し
# WAVファイルとして書き出し
sound.export("output.wav", format="wav")
# MP3ファイルとして書き出し
sound.export("output.mp3", format="mp3")
簡単なプロジェクト: 音声ファイルの前後に無音を追加する
以下は、音声ファイルの前後に1秒間の無音を追加するシンプルなスクリプトです。
from pydub import AudioSegment
# 音声ファイルを読み込む
sound = AudioSegment.from_wav("input.wav")
# 1秒間の無音を生成
one_second_silence = AudioSegment.silent(duration=1000) # durationはミリ秒単位
# 音声の前後に無音を追加
padded_sound = one_second_silence + sound + one_second_silence
# 結果を保存
padded_sound.export("padded_output.wav", format="wav")
まとめ
この記事では、pydubの基本的な使い方を紹介しました。音声ファイルの読み込み、音量調整、切り取り、書き出しなど、基本的な操作方法を学びました。これらの基本を押さえれば、より複雑な音声処理も可能になります。