SPTK(Speech Signal Processing Toolkit)と言うコマンドライン上で音声信号処理ができるツールキットがあります。
約120個のコマンドが提供され、FFTやLPC分析など基本的な音声信号処理をコマンドの組み合わせで簡単に行うことができます。
SPTKのMacへの導入手順と簡単な使い方をまとめました。
##導入手順
- SPTKの公式サイトからSPTK-3.9.tar.gzをダウンロードします。
- ダウンロードしたフォルダ内で以下のコマンドを実行します。
tar xvzf SPTK-3.9.tar.gz
cd SPTK-3.9
./configure
make
sudo make install
3.特にエラーが出なければこれでインストール完了です。
##使い方
サンプルとして公式サイトからダウンロードできるデータ(SPTKexamples-data-3.5.tar.gz)を使って簡単な使い方をまとめます。
この中のdata.shortが音声データです。ファイル形式はraw形式と言うもので、これは一般的なwavファイルからヘッダ情報を取り除いたものになっています。
raw形式の音声データはPraatなどのフリーソフトで再生することが出来ます。
###波形の表示
dmpコマンドで信号の振幅を出力できます。オプションで指定している「+s」は振幅ががshort型であることを表しています。
dmp +s data.short | less
波形のグラフ表示はgwaveコマンドで行います。
「-s」で指定したポイントから「-e」で指定したポイントまでを表示します。
「-i」で表示するグラフの行数を指定できます。
gwave +s data.short -s 100 -e 10000 -i 1 | xgr