最近話題の AIを使った架空のYouTuber ってご存知ですか?
なんだか面白そうなので、私も実際に作ってみることにしました👇
この記事では、実際に私がAIを使って架空のYouTuberを作った際の、使用したツール、苦戦したポイント、制作時間、制作費用 についてまとめてみました。これから挑戦してみたい方の参考になれば幸いです。
🤖 AI YouTuberって何?
YouTubeで検索すると、以下のような動画が見つかります。
AIの力により、現実では不可能な企画も実現できる のが特徴です。
🛠 AI YouTuberの動画制作に必要なツール
実際に私がAI YouTuberの動画を作成する際に使用したツールをご紹介します。
🎥 動画生成AI - Veo 3
💡これは必須ツールです。
Veo 3が必須である理由は、動画生成時に リップシンク や 効果音 などの音声が自動で付与されるからです。
Kling AI などの他のサービスでもリップシンクは可能ですが、Veo 3のように自動では対応していません。これらのサービスでは「人物の顔を認識できる動画」を用意し、喋らせたい内容を個別に入力 する必要があります。
4分程度の動画の各シーンにこれを適用するとなると、膨大な労力が必要になってしまいます😅
Veo 3の使用方法は大きく2種類あり、「Gemini」と「Flow」があります。
Geminiは720pにのみ対応しており、動画に透かしが入ってしまいます。 YouTubeの推奨解像度である1080pで動画を作成したい場合は「Flow」を使用する必要があります。
またGeminiには1日の生成制限があるため、「Flow」の使用をおすすめします。
ただし、現時点では Flowは日本語プロンプトに対応していないため、日本語を喋らせる場合は、以下の様にセリフの部分を ローマ字 で入力する必要があります。
・・・英語プロンプト・・・
He says:
Sore dewa, chikyuu ni kaeritai to omoimasu
・・・英語プロンプト・・・
🖼️ 画像生成
画像生成については「これが必須!」というものはありませんが、私は検証のため以下のツールを使用していたので、本記事の動画制作でも使用していました。
Midjourney:
Midjourneyはモデル作りやシーンの舞台作り(ロケット発射台、月着陸船、スペースシャトル、階段など)に使用していましたが、画像生成はRunwayやDzineでも可能なので必須ではありません。 私はMidjourneyが気に入っているため使用しています。
個人的にMidjourneyは人物や背景画像のクオリティが高いと感じているため、愛用しています。
Runway:
Runwayは画像参照機能が優秀なため、人物の一貫性を保つために使用しています。
例えばRunwayでは、以下のように指定すると同じ人物がプロンプトに従って画像を生成してくれます。
全員を指定:
IMG_1 に写っているメンバーがYoutubeの企画の説明をしている。カメラに向かって正面向き。
特定の人物を指定:
IMG_1 の黄色い服の女性が企画説明をしている。他のメンバーは少し後ろで聞いている。ジャングルの中。カメラに向かって正面向き。
Dzine:
DzineもRunwayと同様に 画像参照の機能が優秀で、同じ人物がプロンプトに従って画像を生成してくれます。
またDzineには「キャラクター学習」機能があり、キャラクターの画像を数枚用意して学習させることで、そのキャラクターを忠実に再現して画像が生成されます。
Kling AI:
今回の動画ではあまり使用しませんでしたが、こちらも画像参照機能が優秀なので、人物の一貫性を持たせたい場合は使用するのも良いと思います。
画像生成AIについては、色々触ってみて、これがいい!と思ったものを1つ使う のも良いと思います。
🎬 動画編集ソフト
動画編集ソフトは使いやすいものを選べば良いと思いますが、私は昔から使っていた「Final Cut Pro」を使用しています。
Adobe Premiere Pro や DaVinci Resolve なども優秀なソフトです。最近では「CapCut」や「Filmora」などのアプリも使いやすくておすすめです。
基本的には、使い慣れたソフトを選べばいいと思います。
💰 ツールの費用
動画制作に必要なツールは以下の通りですので、これらのツールの費用をまとめてみました。
- 動画生成AI(Veo 3)
- 画像生成AI(用途に合わせて選ぶ)
- 動画編集ソフト(自分が使いやすいものを選ぶ)
🎥 動画生成AI(Veo 3)
Veo 3を使用するには「Google AI Pro」または「Google AI Ultra」への加入が必要です。
また、Flowではクレジットを使用して動画を生成します。
Google AI Pro(月額2,900円、初月無料)
- 毎月1,000クレジット付与
- 動画生成1本につき20クレジット消費のため、50本分の動画が作成可能
- ⚠️注意点:動画に透かしが入ります。透かしを隠したい場合は動画編集時に少し拡大する必要があります。
Google AI Ultra(月額36,400円、初回3ヶ月間は18,000円)
- 毎月12,500クレジット付与
- 動画生成1本につき20クレジット消費のため、625本分の動画が作成可能 (かなり高額ですね… 😅)
🖼️ 画像生成
Midjourney:
Midjourneyには 4つのプラン がありますが、「Standard Plan」では「リラックスモード(生成に時間がかかる)」だと 画像生成が無料 で行え、「Pro Plan」では「リラックスモード」でも 動画生成が無料 で行えるようになります。
今回の場合、動画生成は Veo 3 を使用しているため、Pro Plan は必要はないので、使用するなら Basic Plan か Standard Plan が無難かと思います。
Runway:
Runwayには 5つのプラン がありますが、「Pro」だと毎月「2,250クレジット」が付与されるので、Gen-4という最新モデルでは、1080pの画像1枚で8クレジット使用するため、毎月約280枚の画像が生成可能 です。
「Unlimited」プランでは「Explore Mode(生成に時間がかかる)」であれば、画像と動画の生成が無制限 で行えます。
Dzine:
Dzineには 4つのプラン があります。
Dzineは画像生成と動画生成で別々のクレジットを使用する方式となっています。
「Creator」プランでは毎月「3,000クレジット」が付与され、単純な画像生成では1080pの画像1枚で「4クレジット」使用し、画像参照などで使用する「Instant Storyboard」では「24クレジット」使用します。
「Master」プランでは画像生成のクレジットが「無限」で、動画生成は「毎月9,000クレジット」が付与されます。
動画生成ではAIモデルを選ぶことができ「Veo 3」も選べますが、1動画の生成で「600クレジット」を使用するので、15本しか動画が生成できません。
これだけだと4分の動画を作るのは厳しいですね...
🎬 動画編集ソフト
最近よく耳にする代表的なものをいくつかご紹介します。
Adobe Premiere Pro
Adobe製品はサブスクリプション方式で、月々の料金がかかります。
Premiere Pro は 月々プランで「4,980円」、年間プランで「3,280円」となっています。
Final Cut Pro
Final Cut Pro は Apple製品専用の動画編集ソフトで、一度購入すれば永久に使用可能 です。現在の価格は「50,000円」となっています。
(私が購入した時は「30,000円程度」でしたが、久しぶりに見たら値上がりしていました😅)
DaVinci Resolve
基本的に無料で使うことができますが、「処理の高速化」や「ノイズ除去」などさらに機能を追加したい場合は「DaVinci Resolve Studio」を購入する必要があります。価格は「49,800円」となっています。
Filmora
Filmoraは基本的に無料で使用できますが、無料版だと透かしが入るため、透かしを消すには「Filmora Pro」を購入する必要があるとのこと。プランは色々ありますが、おすすめは永続ライセンス「8,980円」とプレミアム年間プラン「11,980円」です。
永続ライセンスは買い切りですが、メジャーアップデート(Filmora 14 → Filmora 15)などの際は、アップグレード費用が必要 になります。
また、「自動字幕起こし」や「AI翻訳」など、高度な機能を使用するには「クレジットを消費」する必要があります。プランとは別に、クレジットを購入する必要があります。
CapCut
CapCutは無料で使用できる動画編集ツールです。
有料プランに加入すると、さらに多くの機能やAI機能が使用できるようになります。
月額プランが「2,180円」、年間プランが「19,800円」となっています。
個人的には、費用面も考えて「DaVinci Resolve」「CapCut」がいいと思いました。
「Final Cut Pro」も直感的に使用でき、Macに最適化されているのでいいと思いますが、少し値段が高いのでお財布と相談が必要になると思います。
動画編集を本格的に、かつ高度な編集がしたい場合は、「Adobe Premiere Pro」を使用するのが良いと思います。
また、AIの機能をガンガン活用していきたい方は「Filmora」を使ってみるのも良いかもしれません。
😅 苦戦したポイント
👥 人物の一貫性
これが最も苦戦したポイントです 💦
前回の記事でも触れましたが、キャラクターや人物の一貫性を保ちながら動画を作ることは非常に困難 です😓
動画をよく見ると、顔が微妙に違ったり、髪型や服装が変わっていたりします。これはAI画像生成の特性上、画像参照を行っていても避けられない現象 です。
「AIの醍醐味」と割り切ることもできますが、私は一貫性を重視する性格のため、顔があまりにも違う場合はボツにして、画像や動画の生成をやり直していました。
また、人物の一貫性を保つということは、YouTuberのようなグループの場合、背景にいる人物も同じにする必要があります。
そのため動画の各シーンで毎回人物を指定したり、顔や服装が明らかに変わっていないか確認するのが非常に大変でした。
🗣 流暢な日本語を喋らせる
Flowが日本語プロンプトに対応していないため、ローマ字で入力する必要があります。しかし、ローマ字では 流暢な日本語を喋らせるのが困難 です。
Veo 3は 8秒の動画 を生成するため、短い文章だとカタコトになってしまう 傾向があるようです。長い文章にすると、テンポよく早口で話してくれるため、より自然な日本語に聞こえるようです。
一人が喋る場合は、ある程度セリフを長くすることで対応できます。しかし複数人での会話の場合は、それぞれのセリフが短くなりがちです。
そのため、セリフを適度に長くしつつ、8秒に収める絶妙なバランスが必要だと実感しました。
⚠️ ポリシー違反
著名人と類似する人物が写っている画像、プロンプトで名前、暴力的・性的な内容を含む場合はポリシー違反となり、動画生成ができないようです。
例えば今回は、赤い服の人が何故かポリシーに引っかかり、動画生成ができないことが何度かありました。
ポリシー違反の表示:
ただ、全く同じ画像で少しだけ顔が違うものを生成すると、ポリシー違反にならないこともありました。
そのため、画像を少し変えたり、プロンプトを変更したりすると動画生成ができることが多かったです。
⏰ 制作時間
制作期間は7月26日〜7月29日の 4日間 でした。1日あたり 約5時間 作業していたため、合計約20時間 かかった計算になります。
初回ということもあり、どのツールを使うかの調査やツールの使い方の習得など、動画作成以外の作業を含めると、実際にはもう少し時間がかかっていると思います。
ただ、生成AIの基礎知識(動画生成やプロンプトのコツ)をある程度持っていたため、これらを一から学ぶ方はもう少し時間がかかると思います。
💰 実際にかかった費用
この動画1本を制作するのにかかったAI関連の費用は以下の通りです。
🎥 動画生成AI
Veo 3(Google Ultra Plan): 18,000円(必須)
🖼️ 画像生成AI
私は今月、全てのサービスに加入して検証していましたが、以下のいずれか一つ、またはお気に入りのサービスがあればそれで十分だと思います。
- Midjourney Pro Plan: $60(約9,000円)
- Runway Unlimited: $95(約14,250円)
- Dzine Master: $60(約9,000円)
そのため、動画生成AIと画像生成AIの 合計で約30,000円 の初期費用がかかりました。
Flowはクレジット制で、12,500クレジットのうち、この動画では 約2,600クレジット を使用しました。
18,000円で12,500クレジットなので、1クレジットあたり1.44円 として計算すると、2,600 × 1.44円 = 約3,744円 となります。
つまり、実際の制作費用としては、動画1本あたり3,700円 + 約10,000円 = 約13,700円 程度の費用がかかったことになります。
🎉 おわりに
架空YouTuberの動画制作には、想像以上にお金と時間がかかることがわかりました。
継続的に制作するとなると、相当な根気、お金、時間 が必要になりますが、動画を作ること自体は非常に面白いため、趣味として挑戦してみるのは良いと思います。
私もAIを使った動画制作を趣味で行っていますが、自分が作ったキャラクターや人物が動いて動画になると、とても嬉しく、自己満足でも十分楽しめると思います。
お財布と相談しながらになると思いますが、趣味として挑戦してみてはいかがでしょうか。