長尺の楽曲も作成可能だという、音を生成する AI の「Stable Audio 2.0」を、ブラウザから試してみます(※ 前に見かけて気になってたけど、試さないままにしていたやつ)。
Audio-to-audio などもあるようですが、今回は簡単に試せる Text-to-audio を使ってみます。
ちなみに、↓こちらが公式の紹介記事のようです。
●Introducing Stable Audio 2.0 — Stability AI
https://stability.ai/news/stable-audio-2-0
使い方の情報
ブラウザ版の Stable Audio 2.0 の使い方については、以下のサイトなどで既にやり方が紹介されているので、この記事では省略します。
- 文章で指示するだけで音楽を作れる音楽生成AI「Stable Audio 2.0」が登場したので使ってみた - GIGAZINE
- 【Stable Audio 2.0】Suno超え?最長3分のトラックを生成できる作曲AIの使い方と料金プランを解説 | WEEL
- 【音楽生成AI】長尺の楽曲が作れるStable Audio 2.0を試してみた!|AI-Bridge Lab こば
トップページにアクセスしてみる
上記のページなどに書かれたアカウントの作成などを完了させます。
そして、ブラウザ版でプロンプトを入力可能な以下のページへ進みます。
ここで実際に試してみる前に、公式情報を少し見てみようと思います。
公式のユーザーガイド
公式の FAQ のページを見てみます。
●Stable Audio - FAQs
https://stableaudio.com/faqs
その中で、以下の使い方のガイドの紹介がされていました。
●Stable Audio - User Guide
https://stableaudio.com/user-guide
テキストからの音の生成、音を入力にした音の生成など、いくつかのトピックのページがあるようです。
公式のユーザーガイドの「Prompt structure」
ユーザーガイドの中の「Prompt structure」というページを見てみます。
そうすると、以下のようにプロンプトで使える要素がリストで提示されていました。
●Stable Audio - User Guide
https://stableaudio.com/user-guide/prompt-structure
このあたりを適当に組み合わせて、今回のプロンプトを作ってみます。
実際に試してみる
プロンプト 1つ目
プロンプトを適当に決めてみます。
先ほどのユーザーガイドの、以下の中で気になるものをつなげる、という適当なやり方を試しました。
Video Games, Sci-Fi, Medium
長さは 1分くらいにしてみました。
生成した結果
生成が終わると、画面上で再生することができました。
また、以下の赤矢印で示した部分を押すと、共有用のリンク生成や動画のダウンロードができました。
こんな画面から、それらを選択できます。
ビデオのダウンロードのほうを試してみました。
生成された音
上記でダウンロードした共有用のビデオは、以下のとおりです。
ジャンル指定が、これだと広すぎる気がするので、もう少し特定報告に絞ると良いのかなと思ってみたり。
プロンプトを少し修正
もう少し試してみようかと、楽器指定「Piano」を加えてみて、そして時間を 2分に変えてみました。
Piano, Video Games, Sci-Fi, Medium
生成された内容は、以下のとおりです。
@StabilityAI の「Stable Audio 2.0」で音の生成②
— you (@youtoy) June 24, 2024
2分の長さで、プロンプトは「Piano, Video Games, Sci-Fi, Medium」#StabilityAI #StableAudio pic.twitter.com/4vfG5sfADG
指定した通りの音色になりましたが、やはり指定をもう少し加えたほうが良さそうな感じが。
ひとまず、今回はここまでにしてみます。
料金についてなど
記事執筆時点での料金は、Pricing のページを見ると、以下のようになっているようです。
- Monthly track generations: 20
- Track duration: Up to 3 minutes
- Monthly upload amount: 3 minutes Cropped at 30 secs
- License: Personal license
クレジット
先ほども見てみた FAQ のページを見ると、上記の「Monthly track generations: 20」という部分に関わる、クレジット消費の話が書いてあるようです。
●Stable Audio - FAQs
https://stableaudio.com/faqs
無料版の付 20 のクレジットだと、Stable Audio 2.0 は 10回使える、という感じのようです。
ラインセンスについて
FAQ の下のほうにライセンスについての記載もありました。
商用利用には、有償版を使う必要がありそうです。