前段
ここ最近ずっとAIの流れ来てますよね。
やっぱ流行りには乗っていきたいよねという事でChatGPTとかをちょっと触るくらいの事はやってたのですが、コミュ障なものでAIと会話するテーマが見つからずにそっと閉じてました。
そんな折に諸事情でBGMが必要な状況になりました。
ちょうどそのタイミングでAIで作曲できるよねみたいな話も聞いたところだったので、
外部に発注するとお金かかるしAIにBGMを作ってみようかという事でやってみることにしました。
事前調査
使ってるツールの調査
そもそもどうやってAIで作曲できるかわからないのでAIで作曲してそうな人を探す。
すると落合陽一さんが動画メディアの中でいじってるのを発見。
引用:【落合陽一のシンギュラリティ論】シンギュラリティは2025年に来る/ディフュージョンモデルの衝撃/知的ホワイトカラーが没落する/最新版デジタルネイチャー/音楽と論文が数秒でできる
Mubert_Text_To_Musicなるものがあるらしいのでこいつを調査する。
Mubert_Text_To_Musicの調査
ぐぐると比較的すぐに見つかるったので、
セットアップ方法から手順を紹介してくれてるっぽいサイトを参考にする。
【音楽生成AI】Text to musicの使い方を解説!テキストから音楽を作成する魔法のツール
記事とリポジトリの情報によると、
Text to musicとは、その名の通りテキストにより指示を出すことで音楽を生成してくれる音楽生成AIです。
テキストから音楽を生成してくれるらしい。ほしかったやつです。
A custom license works for colab. You can use the music for free with attribution to sync with images and videos, but you can't release it on DSPs (Spotify, Apple Music, Deezer etc.) as your own. We also ask you to mention @mubertapp and hashtag #mubert. If you need a commercial license — please contact us.
これは詳しくはもうちょい調査が必要だけど、
自由に使ってもらっていいけど、デジタル音楽配信には載せないでね。
商用で使いたいときには問い合わせてねと解釈しておく。
セットアップ
手順に関してはまんま参考資料に載せたところで解説するので割愛。
ざっくりいうと
- Mubert-Text-to-Musicのgithubリポジトリに行く
- [Open in Colab]ボタンを押す
- Colabページで表示されてるsetupっぽいボタンを上から順に押していく
以上!
実に簡単。情弱の僕でも10分程度でセットアップできました。
いろいろ試してみる
promptをいじっていくつかbgmっぽいものを生成してみました。
同じpromptでも毎回違う音楽が生成されるので何度も試してみてそのうちいいのができたら採用みたいなのがいいかもしれません。
ただ実際に業務で使うのであれば、細かくここをこうして欲しいみたいな注文をしたくなるもので、
そのまま使うってのは厳しそう。(商用は相談してねと書いてあるのもあるし)
さらに結構コツが必要でまだ自分はそのコツを掴みきれてない印象。
なのでこういうサウンドがいいよねーというイメージを伝えたり、
明確にこういう音が良いとかがない雰囲気で良いような場面では良さそう。
ぜひお試しあれ。
参考資料
【落合陽一のシンギュラリティ論】シンギュラリティは2025年に来る/ディフュージョンモデルの衝撃/知的ホワイトカラーが没落する/最新版デジタルネイチャー/音楽と論文が数秒でできる
【音楽生成AI】Text to musicの使い方を解説!テキストから音楽を作成する魔法のツール