Sunoで作った曲をTapNowでMV化してみた
はじめに
AIを使ってオリジナル楽曲を作り、その楽曲をもとにMVを制作してみました。
この記事では、以下の流れをまとめます。
1. ChatGPTで物語を作る
2. 物語を歌詞に変換する
3. 曲タイトルを決める
4. Suno用のStyle of Musicを作る
5. Sunoで作曲する
6. GPT Image 2でキャラクターを作る
7. キャラクターシートを作る
8. MVのルールブックを作る
9. 楽曲を15秒ごとに分割する
10. 15秒単位で絵コンテを作る
11. TapNowで動画化する
あとから同じ流れを再現しやすいように、実際に使ったプロンプトや、制作中に詰まった点も残しておきます。
完成物
今回作成したMVはこちらです。
テーマは、クラブが大好きなコーヒー豆です。
最終的には、このテーマをもとに以下を作成しました。
- 物語
- 歌詞
- 曲
- キャラクター
- キャラクターシート
- MVルールブック
- 絵コンテ
- MV
使用したツール
今回使った主なツールは以下です。
| 用途 | ツール |
|---|---|
| 物語・歌詞・プロンプト作成 | ChatGPT |
| 作曲 | Suno |
| キャラクター画像生成 | GPT Image 2 |
| 楽曲分割 | Codex |
| MV生成 | TapNow |
| 最終的な動画編集 | AviUtl |
1. まずは物語を作る
最初に、MVの元になる物語を作りました。
ChatGPTには以下のように依頼しました。
クラブが大好きなコーヒー豆についての物語を作成して
出力された物語のタイトルは、深煎りビートの夜です。
内容としては、焙煎所にいた一粒のコーヒー豆が、夜のクラブに憧れて外の世界へ飛び出し、音楽と低音に揺られながら「ビートでローストされていく」というストーリーです。
ポイントは、最初から歌詞を作るのではなく、まず物語として世界観を作ったことです。
先に物語を作っておくと、以下のような要素が決まりやすくなります。
- 主人公
- 世界観
- 曲の雰囲気
- 歌詞の方向性
- MVで使う映像表現
- キャラクターの設定
2. 物語を歌詞にする
次に、作った物語を歌詞へ変換しました。
使ったプロンプトは以下です。
この物語を参考に2:30秒以内で収まるような曲の歌詞を作成
サビは「ズン、ズン、ズン、ズン」を反復させること
生成された歌詞は以下です。
[Intro]
夜の焙煎所
麻袋の中
ひと粒だけが
目を覚ます
[Verse 1]
コロコロ転がる
ネオンの街へ
豆のくせして
夢だけでかい
遠くで鳴ってる
地下のベースライン
焦げる前に踊れ
香り出すまで
[Chorus]
ズンズンズンズン
体が跳ねる
ズンズンズンズン
香りが揺れる
ズンズンズンズン
夜に溶けてく
ズンズンズンズン
まだ踊れるだろ
[Verse 2]
クラブの入口
黒服が言う
「豆か、お前」
「でも音はわかる」
スピーカー前で
熱を帯びたなら
浅い夢さえ
深くロースト
[Final Chorus]
ズンズンズンズン
心が跳ねる
ズンズンズンズン
余韻が揺れる
ズンズンズンズン
朝に溶けても
ズンズンズンズン
まだ踊れるだろ
[Outro]
カップの底で
今も踊ってる
歌詞を短めにした理由
後工程で絵コンテ画像を作成します。
GPT Image 2で一度に生成できる画像枚数には上限があるため、今回は15秒 × 10枚 = 2分30秒以内に収まるように歌詞を作りました。
MV制作まで考える場合、最初から曲尺を短めに設計しておくと、あとで管理しやすいです。
3. 曲タイトルを決める
次に、曲タイトルを決めました。
使ったプロンプトはシンプルです。
曲タイトル10候補
出力された候補は以下です。
ズン、ズン、ズン、ズン
Midnight Roast
深煎りビート
踊るコーヒー豆
Roast on the Floor
地下室のコーヒービート
Bass Beans
夜にローストされて
カップの底のクラブ
まだ踊れるだろ
今回は、歌詞の最後にも出てくる 「まだ踊れるだろ」 を曲タイトルにしました。
4. Suno用のStyle of Musicを作る
Sunoでは、歌詞だけでなく「どんな曲調にしたいか」を指定できます。
今回は、作りたい曲の方向性を具体化するために、参考にしたい曲の雰囲気をChatGPTに分析してもらいました。
実際に渡したプロンプトは以下です。
目的:サカナクション 夜の踊り子 を分析
背景:
Sunoで音楽を作成したい。
サカナクション「夜の踊り子」のような雰囲気を参考にして、
Style of Musicに入れられる文章を作成してほしい。
出力されたStyle of Musicは以下です。
Nocturnal Japanese dance-rock and synth-pop with a driving four-on-the-floor beat, tight electronic drums, pulsing synth bass, and repetitive hypnotic grooves. Minimal synth sequences and cold atmospheric textures create a neon-lit urban night mood. Add Japanese festival-inspired melodic motifs and a ritualistic dance feeling, like a modern city festival at midnight. Vocals are cool, restrained, and slightly detached, with chant-like repetitive hooks and airy chorus layers. The arrangement should gradually build tension and momentum through repetition, rhythm, and layered synths, avoiding big EDM drops or heavy rock solos. Catchy, mysterious, danceable, slightly eerie.
5. Sunoで作曲するときの注意点
Sunoで実際に曲を作ってみて、特に気になった点が2つありました。
5-1. 漢字の読み間違いに注意する
今回は歌詞に以下のような表現を入れていました。
[Intro]
夜の焙煎所
麻袋の中
ただ、Suno上では「焙煎所」や「麻袋」が意図通りに読まれないことがありました。
そのため、AIが読みづらそうな単語は、ひらがなにしておいたほうが安全です。
焙煎所 → ばいせんじょ
麻袋 → あさぶくろ
5-2. 動画生成時のフィルターも考慮する
最初は恋愛要素のある曲も試していました。
ただ、人間の感覚では特に問題ない内容でも、後工程の動画生成で「不適切な内容を含む可能性がある」と判定され、生成できないことがありました。
そのため、MV化まで考えるなら、歌詞・キャラクター画像・MVルールブックの段階から、以下のような表現は避けたほうが進めやすいです。
- 過度に性的に見える表現
- 年齢が曖昧なキャラクター設定
- 露出の多い服装
- 恋愛描写が強すぎる演出
- 暴力的・危険に見える描写
AIで一連の制作をする場合、作曲だけでなく、後工程の画像生成・動画生成で通りやすい設計にしておくことが大事だと感じました。
6. キャラクターを作る
次に、MVに登場させるキャラクターを作りました。
今回はGPT Image 2を使いました。
使ったプロンプト例は以下です。
画像生成
女性
20代
コーヒー好き
クラブに行く格好
白背景
シンプル
日本人
ミドルロングヘアー
茶髪
リアル
以下のような画像が生成されました。
キャラクター画像を作るときのポイント
動画生成に使うなら、最初のキャラクター画像は以下のようにしたほうが扱いやすいです。
- 白背景
- 全身が見える
- 服装がわかりやすい
- 髪型がわかりやすい
- 小物を持たせすぎない
- 複雑なポーズにしない
- 顔と体の比率が自然
7. キャラクターシートを作る
今回は TapNow を使ってMVを制作します。
まずは新規プロジェクトを作成し、先ほど作成したキャラクター画像をアップロードします。
キャラクター画像が1枚だけだと、動画生成時に見た目がブレやすくなります。
そこで、追加でキャラクターシートを作成しました。
使ったプロンプトは以下です。
このキャラクターのキャラクターシートを作成してください。
正面、横向き、後ろ姿、表情差分がわかるようにしてください。
スタイルや画風は維持してください。
キャラクターシートがあると、TapNowで動画化するときにキャラクターの一貫性を保ちやすくなります。
今回は、アップロードした画像を選択し、画像処理からキャラクターシートを作成しました。
設定は以下です。
画像比率:16:9
画像生成クオリティ:高
8. MVのルールブックを作る
次に、MV全体のルールブックを作りました。
ルールブックは、動画生成時に毎回参照させるための設計書のようなものです。
使ったプロンプトは以下です。
このキャラクターが登場するMVを作成しようと思っています。
このキャラクターをもとにトンマナを分析し、MVを作るうえでのルールブックを作成してください。
彼女と彼氏が付き合う前の、どこか距離感のある青春を感じられるMVです。
様々なカメラアングル、被写体距離を駆使し、視聴者に与える視覚的インパクトを最大限に高める工夫を入れてください。
ルールブックを作る理由
動画生成では、毎回プロンプトだけでキャラクターや演出を安定させるのは難しいです。
そのため、事前にルールブックを作っておくことで、以下を揃えやすくなります。
- キャラクターの見た目
- 表情
- MV全体の色味
- カメラワーク
- 世界観
- 避けたい表現
特に、複数の15秒動画をつなげて1本のMVにする場合は、全カットで共通するルールがあったほうが破綻しにくいです。
9. 楽曲を15秒ごとに分割する
TapNowでMVを作るときは、フル尺の楽曲をそのまま扱うよりも、15秒単位に分割したほうが管理しやすいです。
今回はffmpegで分割しました。
Codexには以下のように依頼しました。
この楽曲をffmpegで15秒単位のMP3ファイルに分割し、
同じディレクトリ上に新規フォルダを作り、そこに出力してください。
出力されるファイル名のイメージは以下です。
output_000.mp3
output_001.mp3
output_002.mp3
...
分割した音源をTapNowにアップロードします。
10. 15秒単位で絵コンテを作る
次に、15秒ごとの音源に合わせて絵コンテを作ります。
ここでは、GPT Image 2が使える環境で以下の素材を渡しました。
- キャラクターシート
- フル楽曲データ
- MVルールブック
- 歌詞
使ったプロンプトは以下です。
# 目的
このキャラクターのMVを作るための絵コンテ画像を作成してください。
# 制約
- 15秒単位のストーリーボード画像を合計〇枚生成する必要があります
- 添付した音源を聴き込み、音楽のビートやリリックに合わせたシーンを作成してください
- MVのルールについては添付したルールブックを参照してください
- 各絵コンテには以下の情報をカラムで定義してください
- 各カットの画像
- スタートフレーム画像
- エンドフレーム画像
- このカットの秒数
- 各カットの描写を説明した文章
- 被写体
- 被写体の動き
- カメラワーク
- ライティング
- 雰囲気
- MV特有の演出
- エフェクト
- スピード感
- 演技に関する指示
- このカットに該当する歌詞
- 各絵コンテに含まれるカットは最大12カット
- 各カットの最大秒数は2秒
- 内容に合わせて0.0秒〜2.0秒の間で自由に調整してください
# 歌詞
以下の歌詞を参照し、実際に曲を分析したうえで、各カットにおける歌詞の該当箇所を記載してください。
※ ここに自分の楽曲の歌詞を記載
11. TapNowで動画を生成する
最後に、TapNowで動画を生成します。
今回はProプランで作成しました。
TapNowに渡した素材は以下です。
- 15秒単位の絵コンテ
- キャラクターシート
- MVのルールブック
- 15秒単位に分割したMP3ファイル
動画生成時のプロンプトは以下です。
@MVルールブック を参照し、@キャラクターシート が主役のMV映像を作成してください。
@MVルールブック は熟読し、徹底的にこのルールを順守してください。
# キャラクター
白石 澪: @キャラクターシート
# 楽曲
@音楽
# シーン
@絵コンテ に記載されている内容を漏れなく参照し、指示通りにカットを作成してください。
なお、各カットにはスタートフレーム/エンドフレーム画像が記載されていますが、ここに記載されている画像をそのまま使用することはNGです。
あくまで構図や情景の参考として、キャラクターシートやルールを参照の上、各カット映像を作成してください。
12. 生成した動画をつなげる
TapNowで15秒ごとの動画を生成したら、最後に動画編集ソフトでつなげます。
今回は無料の動画編集ツールである AviUtl を使いました。
ここまでで、1本のMVとして完成です。
補足
ジャケット画像は以下プロンプトで制作しました。
*キャラクターシートと音楽を添付
以下の歌詞から連想されるこの曲のジャケット画像を作成して。
16:9。
型にとらわれない常識をぶち破るようなジャケットにして。
フォントやエフェクトなども常識にとらわれない。
型にはまらないものにして。
とにかくインパクト重視。
この曲を歌っている女性アーティストのキャラクターシートを添付するので自由に使って。
曲名は「まだ踊れるだろ」アーティスト名は「Shin Yamamoto」
---
歌詞:
[Intro]
夜のばいせんじょ
あさぶくろの中
ひと粒だけが
目を覚ます
[Verse 1]
コロコロ転がる
ネオンの街へ
豆のくせして
夢だけでかい
遠くで鳴ってる
地下のベースライン
焦げる前に踊れ
香り出すまで
[Chorus]
ズンズンズンズン
体が跳ねる
ズンズンズンズン
香りが揺れる
ズンズンズンズン
夜に溶けてく
ズンズンズンズン
まだ踊れるだろ
[Verse 2]
クラブの入口
黒服が言う
「豆か、お前」
「でも音はわかる」
スピーカー前で
熱を帯びたなら
浅い夢さえ
深くロースト
[Final Chorus]
ズンズンズンズン
心が跳ねる
ズンズンズンズン
余韻が揺れる
ズンズンズンズン
朝に溶けても
ズンズンズンズン
まだ踊れるだろ
[Outro]
カップの底で
今も踊ってる











