4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

本記事は サムザップ Advent Calendar 2025 の17日目の記事です。

はじめに

はじめまして!
サムザップでゲームプランナーをしている @ko_ishii です。

生成AIを使えば、音楽や映像が一人で作れるようになったので、
ChatGPT・SUNO・Veoなどの生成AIを組み合わせて、一本のMVの完成までを一通り試してみました。
そのフローを紹介したいと思います。

今回はサムザップ Advent Calendar 2025にあわせて、クリスマスソング風の曲を作りました。

完成したMVは記事の最後に掲載しています。

使用ツール

  • ChatGPT : アイデア整理 / 歌詞生成 / 各種プロンプト制作
  • SUNO : 音楽生成 / 音楽調整
  • Google系(Gemini/Whisk/Flow) : 画像生成 / 動画生成
  • CupCut : 動画生成 / 動画編集
    ※いずれも個人利用の範囲で、個人契約の有料プランを使用しています。

1. ChatGPTで歌詞と音楽生成プロンプトを作る

アドベントカレンダーをテーマにMVを作ってみようと思ってみたものの、アイデアがふわっとしていたので、ChatGPTに要件を伝えつつ 「私にアンケートをして」 と依頼して、ヒアリングをしてもらいます。

「私にアンケートをして」 系のプロンプトはどんな状況でも気軽に使えるのでオススメです。

image.png
出力されたアンケートに答えていくと、頭の中のイメージが固まっていくのと同時に、ChatGPTとの意思疎通も進んでいきます。

音楽の方向性はだいたいこんな感じに

  • 青春ドラマ風の華やかなポップス(BPM190)
  • 日本語と英語で50%ずつの歌詞
  • ボーカルパートは男女が交互に歌う
  • 歌詞に「Thumbs up」を入れる(サムザップなので…)
  • Advent Calendar × 冬 × 光 がテーマ
  • 無難で明るい雰囲気

数回アンケートを往復すると、歌詞と音楽生成用のプロンプトを出力してくれます。
出力に対するFBを繰り返して歌詞と音楽生成プロンプトを調整し、完成させていきます。

できた歌詞

[Verse 1]
白い吐息がほどける winter line
Every step we take is glowing through the night
ページを開けば動き出す story
Guided by the Advent Calendar soft and bright
指先かすめた雪のつめたさに
Echoes in a silent drift of light

[Pre-Chorus]
胸の奥で揺れだす pulse
Shining like the stars that cut the quiet sky

[Chorus]
凍った空気に息を重ねて
Thumbs up, Christmas lights illuminate
影と光が滲むこの瞬間
Rising where the frozen rhythms resonate

[Verse 2]
街の静けさを縫って歩けば
Lantern glow folds neatly into our stride
肩越しに交わるまなざしの奥
Carving shapes the Christmas moon won’t hide
触れ合う距離が夜を変えていく
Tracing warmth that drifts beneath the tide

[Pre-Chorus 2]
雪の粒が落とす微かな shake
Holding to the Advent Calendar one last time

[Chorus]
白い街路に足音を刻んで
Thumbs up, Christmas lights illuminate
高鳴る鼓動が夜を震わせ
Moving where the distant signals elevate

[Bridge]
きらめく風が静かに触れて
When the bells ring out across the snow
積み重ねた瞬間がほどけていく
We lift off beyond the cold and glow

[Chorus (Final)]
重なった影がひとつに滲んで
Thumbs up, Christmas lights illuminate
漂う光の粒が空を満たしていく
Shining as the quiet northern stars ignite

[Outro]
冬の匂いが未来へ続いて
With a steady breath, we walk into the light


できた音楽生成プロンプト

Prompt
At 190 BPM, this J-POP Christmas anthem bursts with vibrant pop drums, crisp sleigh and jingle bells, and a bright, punchy bass groove, Sparkling chimes and glockenspiel riffs intertwine with lush holiday strings, while airy choir pads elevate each chorus, Alternating male and female vocals trade Japanese and English lines, building to jubilant group shout sections highlighting “thumbs up, ” Sleek production and radiant layers foster a modern, electrifying winter-night celebration, tastefully weaving “Advent Calendar” into two soaring English lines, Every sonic detail feels vivid, energetic, and youthful,

Negative
dark horror tone, trap beat, distorted vocals, heavy metal guitars, growl, screaming, lo-fi noise, glitch distortion, robotic monotone,‑harsh reverb, EDM drop, dubstep wobble, ambient drone, gothic choir, church hymn, pipe organ, overly religious tone, medieval carol style, sad ballad mood, whisper vocals, toy-like childish jingles

2. SUNOで音楽生成

歌詞と音楽生成プロンプトができたので、SUNOで音楽を生成していきます。
SUNOでの音楽を生成はガチャのような感じで、イメージ通りの曲が出力されるまでガチャを回していく感覚です。
プロンプトを調整しながら生成を繰り返していくと、
「良いのでは…?」と思える曲に出会います。

その曲をベースにしてSUNOの Cover機能 でブラッシュアップします。
これもまたガチャです。

今回はCoverで出来た曲を、さらにCoverをした曲を最終的に採用としました。

3. SUNO STUDIOで調整(Stem機能)

次は、SUNO STUDIOで曲の調整をしていきます。
Stem機能を使用すると、ボーカル、ドラム、ベース、ギター等、楽器ごとに分解された波形データを生成することができます。

  • ボーカルを少し強めたい
  • ギターを減らしたい
  • この部分の◯◯は消したい

などの調整が可能になります。

image.png

さらに追加で楽器を指定+プロンプトを書いてトラックを生成することも可能なので、
今回は、以下を追加しました。

  • Brass(トランペット系) → 豪華さUP
  • Percussion(打楽器系) → シャンシャン音でクリスマス感UP

これで音楽は完成!

4. 動画のキャラクター作り(Whisk & Gemini)

次は動画制作です。

動画の方向性

  • IT企業にいそうな普通の人がオフィスで歌う
  • 黒 × 黄色を基調にする
  • クリスマスツリーが登場
  • サムズアップのポーズを入れる
  • ゲーム会社っぽい演出も入れる

Text to Videoだけでは全体の一貫性がなくなるので、事前に画像生成でイメージを固定していきます。

主役のキャラクターはGoogle Whiskで作りました。
普通の男女を生成したいので、イメージを日本語で書き、そのまま画像生成をしてみます。

オフィスで撮影された日本人アーティストの男女2人の写真。
男性はグレーのパーカー、眼鏡、髭、前髪。
女性はワンピース、肩くらいまでの茶髪。
二人ともアーティストというよりはIT企業の社員といった感じ。

Whisk_bb943851a85a2c2886b4f3fbcaf7db66dr.jpeg
雑な日本語だけで一発でそれっぽい人を作ることができました。
masterpiece, high quality...などの記述は必要なさそうです。

次はGeminiで全身の三面図を作ります。

添付した画像の人物の三面図を作る。(正面・背面・横面)頭から靴まで入るようにする。背景は真っ白。
女性の靴がパンプスになってしまったので白いスニーカーに変えたり、 オフィスのイメージ、絵コンテを提案してもらうなどしました。

5. 歌唱シーンをどうするか

Veo3.1では喋らせたり歌わせたりすることが可能ですが、現段階では外部音声ファイルに合わせてシンクロする動画を作ることはできません。

歌詞をプロンプトに入力し適当に歌わせた動画が奇跡的に音楽に合うのを期待する方法も可能ですが、かなり大変です。(1シーンだけ、こちらの方法も使いました)

なので、静止画像と外部音声ファイルで動画を生成できる以下のサービスを試しました。

  • Klingの「AIアバター」機能
     → 簡単なプロンプトだけだと、微妙な仕上がりに。
     → プロンプト調整が難しく、今回は断念
  • CapCutの「AI会話シーン」機能
     → 簡単なプロンプトでも一発でそれっぽい動画に!
     → 今回はこちらを使ってみることに

左上に「☆AI」といったウォーターマークが出てしまうのですが、
どこがVeoで、どこがCapCutかの紹介にもなるので今回はそのまま使いました。
vlcsnap-2025-12-11-23h49m43s004.png
このAI会話シーン機能で使われている動画生成モデルは表示されていませんが、OmniHuman系の可能性が高そうです。

6. Veo3.1 → CapCutでMV編集

  • 歌唱パート → CapCutで生成したリップシンク動画
  • その他の演出パート → Veo3.1(Flow)で生成した動画

これらをCapCutで一本のMVへと編集します。
CapCutに用意されているトランジションや素材も使っていきます。


7. 完成したMVがこちら

*YouTubeサムネもGeminiで作りました。

8. おわりに

曲を繰り返し聞いているうちに、歌詞がおかしいことに気がついてしまいました。
日本語の途中で英語に切り替わるので、意味が全く伝わってきません。

冬の匂いが未来へ続いて
With a steady breath, we walk into the light

歌詞をしっかり整えてやり直したい…と思いましたが、手戻りが大変なのでココで終了としたいと思います。

結論:歌詞はめちゃくちゃ大事!


明日は、@hagiwara_akira さんの記事になります。お楽しみに!!

4
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?