作ったもの
breath-picekr(GitHubリポジトリにリンクしています。)
目的
ブレスをDAWで張り付けたいなーと思った。
※東北きりたんの歌唱DBの場合、音声を直接素材とすることは研究用途ではないため、規約違反の可能性が高いです。
本当の所は、Pythonでの音声ファイル処理を練習したかっただけです。これは本心です。
切り出したファイルを直接使うのは控えた方が良いです。
開発環境
- Windows 10 Education 2004
- Python 3.8.3
使ったライブラリ
- pydub(wavファイルの切断に使った)
- utaupy(labファイルの読み取りに使った)
動作チェックに使った歌唱データベース
- 歌唱データベース
- 東北きりたん歌唱データベース
- 夏目悠李/男声歌声データベース(DB制作:アマノケイ、音声提供者:霧野蒼太)
- おふとんP歌声データベース(DB制作:おふとんP)
- モノフォンラベル
- 東北きりたん歌唱データベース は自前で加工(s→100ns の換算)
- 夏目悠李/男声歌声データベース は自前で加工(s→100ns の換算)
- おふとんP歌声データベース はそのまま使用
- 東北きりたん歌唱データベース は加工済みのものも使用。(https://github.com/r9y9/kiritan_singing_extra)
感想
Pydubとっても簡単!
他にも標準ライブラリのwaveとかPyAudioFileとかSciPyとかあるけれど一長一短なんだろうか。
PyAudioFileが使いやすそうだけどファイルを切断とかのやり方がわからんかった。
あと、きりたんのラベルの種類によってブレスの回数が違ったのはどうしてだろう。どう編集したのか調べてみようと思う。
↑ これは [r9y9](https://github.com/r9y9) さんによって加工済みのラベルを使った場合。201箇所。東北きりたん歌唱データベースのブレス一括切り出ししてみた pic.twitter.com/NQ1hKPxWhU
— くれいじー@開発垢 (@oatsu_c) June 17, 2020
↑ こっちは単位換算だけしたラベルを使った場合。1354箇所。やっぱりきりたん増えたわ
— くれいじー@開発垢 (@oatsu_c) June 17, 2020
1354
母音と桁以外も結構編集したのかな pic.twitter.com/vZD4Hz9iJ2