29
11

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

音楽も映像も知識ゼロ。それでも生成AIを使えば無料でMVは作れるのか?

29
Last updated at Posted at 2025-08-11

はじめに

今、世の中には画像、映像、音楽、音声と、あらゆるものを生成できるAIツールが数多く存在します。

今回は、そんな「生成AIを駆使して何かを作りたい!どこまでできるか試したい!」という個人的な想いから、会社のMV(ミュージックビデオ)制作に挑戦してみました。

本記事は、いわば個人の趣味から始まったプロジェクトの物語です。
※ちなみに当社はSESの中小企業で音楽分野には特に関係はありません

対象読者

本投稿の内容は以下のような方を対象としています。

  • 生成AIを使ったコンテンツ制作に興味がある方
  • プログラミングやデザインの知識はないが、MVを作ってみたい方
  • 無料で使える便利なAIツールを探している方

作成したMV紹介

画像/動画/音楽生成AIを駆使してMVを作ってみましたので、まずはご覧ください!

いかがでしょうか?AIだけで、かなり「それっぽく」なっていると思いませんか!?

技術スタック

今回使用したツール・サービスは以下の通りです。

  • 作詞:ChatGPT, Gemini, Claude Sonnet, Perplexity
  • 画像生成:ImageFX, Ideogram
  • 動画生成:Google AI Studio
  • 楽曲制作:Suno AI
  • 動画編集:Filmora
  • プロンプト生成補助:Gemini

AI選択の決め手はコスト0円

  • 個人にMV制作を依頼するとおよそ10~30万、企業に依頼だともっとするそう。そこをAIの力でコストをかけないのが今回の前提条件です
  • 商用利用可否:商用利用は考えていないので重視せず、とにかくコストを0に!

制作フロー(全体の流れ)

1. MVのテーマ決め・作詞
2. 画像素材の作成
3. 動画素材の作成
4. 音楽素材の作成
5. 動画編集・仕上げ
6. MV完成!

1. MVのテーマ決め・作詞

最初に取り組んだのはMVのテーマ決めと作詞です。

まずは当社を連想させるキーワードをいきます。
当社はITインフラに特化したSES企業なので、こんな感じです。

  • IT
  • サーバーエンジニア
  • ネットワークエンジニア

そこに、個人的に好きな楽曲の定番要素を加えていきます。

  • 出会い
  • 楽しく過ごした日々
  • いつかみんなで会える日を楽しみに
  • 旅立ち

さらに、今の季節感を出すために以下のキーワードも追加しました。

  • 真夏
  • 爽やか

これらのキーワードを元に、以下のプロンプトを作成しました。

IT、サーバーエンジニア、ネットワークエンジニア、出会い、楽しく過ごした日々、いつかみんなで会える日を楽しみに、旅立ち、真夏、爽やかをテーマに作詞してほしい。
・Intro,verse,chorus,verse2,pre chorus,chorus,verse3,outro と分けて欲しい
・歌詞の中にキャッチーな単語の英語を混ぜる

ここで書いた、[Intro][verse][chorus]というのは、音楽を生成する際の「セクション」です。
以下によく使われるセクションを簡単にまとめておきます。

主要なセクション一覧

セクション名 意味
[Intro] 楽曲の導入部分
[Verse] 日本でいう「Aメロ」と呼ばれる部分
[Pre-Chorus] サビ前。 日本でいう「Bメロ」部分
[Chorus] サビ
[Outro] 楽曲の最後の部分

先ほどのプロンプトでは、これらのセクションを「よくある楽曲の構成例」で依頼しました。

それでは、このプロンプトを使って生成AIに作詞してもらいます。
せっかくなので、代表的な4つの生成AI(ChatGPT, Gemini, Claude, Perplexity)に作成を依頼して、それぞれの結果を比較していきます。

ChatGPTの歌詞(抜粋)

Sunshine pouring down,真夏のオフィスで
笑い声とKeyboardがDance 今日も“Connection”求めて
Wake up, coffee片手に メールに溢れる夢とHope
Server roomの冷たい風も 仲間といれば夏のBreeze
爽やかにRun, Brand-new Network あの日々は永遠のTreasure
いきなり英語から始まりましたね。
「Server roomの冷たい風も 仲間といれば夏のBreeze」は面白いですww

Geminiの歌詞(抜粋)

無機質なラックに並ぶ Server 色とりどりの Cableが走る迷路
叩き込んだ Command、交わす視線 最初はぎこちない Hello & Smile
共通の Mission、一つの Team 仮想(バーチャル)じゃないリアルな温もりを知った
モニター越しの顔が、いつしかかけがえない仲間に
駆け抜けた Summer days, Sunshine浴びて 僕らの Network、未来へ繋がってく
「モニター越しの顔が、いつしかかけがえない仲間に」のフレーズはかなり好きですね。

Claudeの歌詞(抜粋)

サーバールームの冷たい風 汗拭いながらTroubleshooting
画面の向こうのUser's smile それが僕らのMotivation
ネットワークの海を泳いで Packet飛び交うDigital world
君と出会えたあの瞬間 全てが変わったTurning point
真夏のMemory 爽やかなBreeze IT仲間とSharing dreams Server, Network,
繋がる心 みんなでMaking history
フレーズの最後に英語歌詞をもってきているのはお洒落です。
AI界隈では、サーバーエンジニア = サーバールームが寒い なんですかねw

Perplexityの歌詞(抜粋)

真夏のheat, 画面の前でコードが dance,
心が躍るサーバーが whisper, ネットワーク light
繋がる世界で生まれた spark
Shining days, summer breeze
ITの magic, feel so free
仲間と過ごすこの time
いつかまた meet again, 夢が fly
ちょっとよくわからない英語を挟みがちですが、リズムは良さそうです。

どの歌詞を選ぶか?

Geminiの歌詞が個人的に気に入りましたので、この歌詞をベースにGeminiとブラッシュアップをしていきました。具体的には以下を追加で依頼しました。

* 英語部分を少し減らしてほしい
* [Verse] [Pre-Chorus] [Chorus][Verse][Pre-Chorus] [Chorus][Bridge][Chorus]の順に変えてほしい。適宜歌詞の修正は構わない

こちらで完成したものが以下になります。

完成版の歌詞

[Verse 1]
無機質なラックに並ぶ Server
色とりどりのケーブルが走る迷路
打ち込んだコマンド 交わす視線
最初はぎこちないHello & Smile

[Pre-Chorus]
共通のミッションが僕らを繋いで
モニター越しの顔が かけがえない仲間になってく

[Chorus]
駆け抜けたSummer days 太陽浴びて
僕らのNetwork 未来へ繋がってく
思い出のServerにAccessしたら
鳴り止まない笑い声がする
心と心 Pingで確かめ合った
最強の仲間と過ごしたDigitalな夏

[Verse 2]
深夜3時 鳴り響くアラート
眠い目こすって挑んだTrouble shooting
朝日が昇る頃 解決のサイン
交わしたハイタッチと乾杯の "Cheers!"

[Pre-Chorus]
風の色が変わって 季節がサインを送る
それぞれのNext stageへ 寂しいけど
涙じゃない エールを贈るよ

[Chorus]
忘れない Summer days
太陽浴びて 僕らのNetwork 未来へ繋がってく
思い出のServerにAccessしたら
鳴り止まない笑い声がする
心と心 Pingで確かめ合った
最強の仲間と過ごしたDigitalな夏

[Bridge]
何でもない会話で 語り明かしたRoute map
そんな日々が 僕らを強くしたんだ
物理的な距離なんて関係ないさ
僕らの絆は消えないCacheだから

[Chorus]
忘れない Summer days 太陽浴びて
僕らのNetwork 未来へ繋がってく
思い出のServerにAccessしたら
鳴り止まない笑い声がする
心と心 Pingで確かめ合った
最強の仲間と刻んだDigitalな夏

2. 画像素材の作成

歌詞ができてMVのイメージが湧いてきたので、次に動画を作る下準備として、映像の元となる画像を作っていきます。

この時点で動画生成AIを使って映像を作ってもいいのですが、元となる画像があると出力が安定し、よりイメージ通りの映像を作ることができます

今回は特にコストをかけないことを前提にしていて、動画生成において貴重な無料クレジット枠の無駄な消費を避けたいのもあり、画像から作っています。

今回私の方では「Ideogram」とGoogleの「ImageFX」を使って、画像を生成しています。

生成した画像は以下の通りです。※一部抜粋しております
Qiita用.png

最初はIdeogramの無料プランで生成をしました。
一度のプロンプトの生成で異なる4枚が生成されます。設定によると思いますが、私は20枚生成したところでその日のクレジットを使い切りました。。。

その後はGoogleの「ImageFX」に切り替えて画像を生成していき、かなりの枚数を生成しましたが、今回の利用分では制限には至りませんでした。
※ImageFXの無料枠の制限は1日およそ30回程度と言われています

左上の画像だけIdeogramで、他はImageFXで生成したものですが、個人的には画像のクォリティに大きな違いは感じませんでした。なので、物は試しに画像生成AIを使ってみたいという方は、ImageFXの方が気楽に使えるかもしれませんね。

生成AIに画像生成のプロンプトを作成してもらう

クォリティの高い画像生成を行うためには、「英語」で「具体的に」記述する必要がありますが、私にとってはまだまだそれも難しいので、ここでも生成AIに頼ります。

具体的かつ英語のプロンプトを作成するために、以下のプロンプトを使います。

以下の画像生成AIに送るプロンプトの具体性を20点として、100点に近づけるためのプロンプトを作成してください。なお、プロンプトは英語にしてください。
・オフィスでギターを弾く女性
・アスペクト比は16:9で実写映画のようにしてほしい

将来的にyoutubeでも使いやすいよう16:9の画像を依頼します。また、映画のワンシーンのような画像にしたいので、実写映画のようにしてほしいと付け加えます。

今回はGeminiを使用したのですが、Geminiでこの指示をすると3パターンくらいの生成用のプロンプトを作成してくれるので、そこから自分で好きなパターンを選ぶことができます。

ここでGeminiが生成したプロンプトを、今度はIdeogramに依頼して生成されたものが、先ほどの左上の女性の画像となります。ideogramに依頼したプロンプトは以下の通りです。

Cinematic film still of a young Japanese female engineer in her late 20s, standing and playing an electric guitar in a modern, sun-drenched tech office during a quiet summer afternoon.

**Subject Details:**
- **Appearance:** She has an expression of focused joy, completely absorbed in the music. Her hair is shoulder-length, dark brown, and slightly wavy, gently catching the light.
- **Attire:** Dressed in smart casual: a light blue linen shirt with sleeves rolled up to her elbows, and dark gray chinos.

**Action & Object:**
- She is standing, holding a classic Fender Stratocaster in a 3-Color Sunburst finish with a maple neck. The guitar is supported by a classic black leather strap slung over her shoulder. She is slightly leaning into the music, her body posed dynamically as she strums a chord.

**Environment & Lighting:**
- **Setting:** She is positioned near the large floor-to-ceiling windows of a bright, open-plan office. In the soft-focus background (bokeh), there are minimalist workstations and green potted plants. A small, stylish combo amplifier (like a Fender Blues Junior) is on the floor nearby.
- **Lighting:** She is beautifully backlit by the warm, golden hour sunlight streaming through the windows. This creates a strong rim light effect, subtle anamorphic lens flare, and casts a long, soft shadow in front of her.

**Style & Quality:**
- **Composition:** A slightly low-angle shot to give her a more dynamic presence. Sharp focus on the woman and her guitar, with a shallow depth of field.
- **Aesthetics:** Shot on 35mm film, hyper-detailed, with subtle film grain and warm cinematic color grading. Professional cinematography, 8K, high resolution.
- **Camera:** Shot with an ARRI Alexa camera, Cooke S4/i 50mm prime lens.

--ar 16:9

とても細かく依頼内容が書かれているのが分かると思います。(これは今の私にはとても書けませんw)

そして、こちらが生成された画像です。
オフィスでギター1-1.jpeg
いい感じです!

このような手順で複数画像を生成し、生成した画像を基に、次は動画生成を行っていきます。

ここまでで既にかなりのボリュームの記事になってしまったので、恐れ入りますが、続きは次回の投稿にさせていただきます。

ここまでお読みいただきありがとうございました。

29
11
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
29
11

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?