📝 お父さん、VTuberになろうと思うんだ
現在個人開発でサービスを作っている。これを英語圏で広めたいと思って、プロモーションする方法をAIに聞いたところ、「短い動画を作るのがおすすめです」と言われた。自分は今まで動画を作ったことは一度もない。知識もない。この状態ではあるが、最近のAIの進化で、聞きながらやれば案外すぐに動画なんて作れるかもとは思った。VTuberに喋らせるなら自分を晒す必要もないし、楽かもしれないし、キャッチーかと思った。
🎮 VTuberの知識
とはいえ、自分は、動画経験はもちろん、VTuberの作成経験もない。ただ、プレゼンは多少慣れている。昨今のAI進化なら、なんとなく1週間もあれば動画作れるんじゃないかな?という根拠のない自信があった。そこでAIに質問してみることにした。特に深い理由はないが、せっかくなので、あまり使ったことがないGeminiを使ってみることにした(今まではほぼChatGPTとClaude)。動画の形式は、最近たまたま知ったIgnite(20枚の画像を1枚15秒表示して自動でページ送りがされるスタイルの発表形式)でやろうかなと思っていた。
🎥 VTuber Studio + OBS Studio
聞いてみると、VTuber Studio + OBS Studioを使えばすぐにでも作れるかもしれないことが分かった。OBSは知っていたし、なんとなく触ったことがあるレベルだった。VTuber Studioは完全初見。AIへの質問はノートパソコンでしていたが、これは帰ってから家のデスクトップでやった方がよさそうだなと思って、続きは帰宅後にすることにした。なんとなくモデルはデフォルトのものがあるので、最初はそれを使えばいいかなと思っていた。
💬 英語資料+英語字幕
今回はできれば英語圏の人にも伝わるような動画にしたいと思っていた。そうなると、自分が英語で話すのが一番良いのは言うまでもない。しかし、5分とはいえ発表スタイルで英語で話す自信はなかった。となると、日本語で話して英語字幕をつけるのが妥協点かなと思えた。これも、わりとAIで簡単にできるのではないかと思った。
💡 Ignite用の資料
というわけで、まず発表資料を英語で作ることにした。もちろん自動翻訳を使う。元々動画用ではないが、サービス紹介のテキストは作ってあったので、これを元に20枚のスライドを作ることにした。Geminiに「この文章をIgnite用の資料にして」と言ったらうまくできなかったが、Claudeに同じ文を投げたら作ってくれた。1Pにタイトルと3行の説明が書かれた資料を、英語で20枚出してくれた。これでIgnite用の英語発表資料は完成。
🎥 VTuber Studio
次にVTuber Studioを触ってみた。初見のツールなので分からないことが多く、細かく詰まったが、困ったことをAIに聞けば大きく躓くことはなかった。家のPCにはWEBカメラがあるので、顔を認識させた状態で、デフォルトの萌えキャラモデルの目と口を自分の動きとシンクさせることができた。瞬きはちょっと過剰で、口のシンクも「あ・い・う・え・お」と言っても正確に動いている感じは微妙だったが、文章で話してみるとそこまで気にならなかった。
🎥 OBS Studio
次にOBS Studioを使ってみた。まず、VTuber Studioのモデル画面と、PowerPointにしたプレゼン資料の画面を合成してみた。資料がベースで右側にキャラ。ん、それっぽい。この状態でテスト的に話してみた。結果、資料の内容をVTuberのキャラが喋っている感じで、日本語で発表している30秒くらいの動画ができた。最大の違和感は、キャラが僕の声で話していること。めっっっちゃ変。というわけで、声を変える必要があると思った。ボイスチェンジャーが必要になる。
🎤 バ美声
調べてみるとバ美声というツールがあった。商用利用は有料だが、無料で試せそうなので使ってみた。音声入力や出力の設定には慣れておらず、最初は苦労したが、ここでもAIに助けてもらい、女性声ではないが、自分の声とはちょっと違う声が出るようにはなった。ただ、びっくりするほど声を拾ってくれない。それでも、自分の声よりは違和感は減ったように感じた。この辺までが1日目の作業。もうVTuberが資料を読んでいる風にはなった(この時点では過去に作った日本語資料を読んでいる)。
🌅 2日目の朝
次の日の朝、早く目が覚めたので、昨日作った1分ぐらいの動画に字幕をつけられないか調べてみた。すると、CapCutを使えば簡単にできそうだと分かった。動画を読み込ませてみると、自動で音声に字幕が当てられた。精度も悪くない。すごい。さらに自動翻訳機能もあったので、英語字幕にしてみた。わお。英語資料を日本語で読み上げるVTuber+英語字幕の動画が完成してしまった。ただ、まだ実験段階。今日はこれを実際の資料でやってみることにした。
🌞 2日目の昼
昼は、クオリティアップのための調べ物をちょこちょこやった。音が小さいこと、瞬きが多すぎること、女性声にならないこと、自動翻訳の精度など、気になる点が多かった。すべての疑問をGeminiに聞きつつ、解決したこともあるし、試してみないと何とも言えないこともあった。音声変換ツールはいくつかあり、無料でデフォルトではないモデルでも悪くないものも見つけておいた。
🌙 2日目の夜
夜、家に帰って、いろいろな知識を試してみた。ボイスチェンジャーには恋声を使ってみた。男性→女性のプリセットがデフォルトであり、細かく調整してみたが、気に入る感じにならなかったので、デフォルトで試してみた。設定も調整し、声の大きさも普通ぐらいで録れるようになってきた。モデルもデフォではなく、フリーで使えるものを探し、いよいよ自分の資料を読み上げるテストをしてみた。1分ぐらい、何度かトライ&エラーして、クオリティは度外視すればギリギリ形になってきた。
🎥 動画完成
そこで5分収録し、さらにトライ&エラーを続け、なんとか動画が完成した。まさか2日でできるとは思わなかった…。字幕を当て、自動翻訳で英語字幕も完成。クオリティ面では気になる点はめちゃくちゃ多いし、質を上げようと思えばやりたいことは1000個ぐらいあって、1ヶ月でも足りないぐらいだけど、VTuberとして使える動画ができたのは正直驚き。1週間でできたらいいなと思っていたので、進化って本当に恐ろしい。
💭 感想
正直2日でまがりなりにも動画が出来たのは、自分でもびっくり。新しいアプリの場合、今までは、「詰まったらググる」で調べても解決出来ないことも多かった。マニュアルに書いてあっても見落としやケースが違って、原因が分からずに進めないのはよくあると思う。でもAIでも100%ではないにしても、そういう躓きもグッと減ったと思う。今回動画作成だが、コンピュータで新しいことをしたい!に関しての学習ハードルは本当に劇下がりしているなと思う。やってみたいが、すぐに出来る。めっちゃありがたい世の中。
🔓 公開に関して
次の日。公開方法を考え、リサーチなどもした結果、この動画を英語圏で公開するのはやめることにした。理由は「萌えキャラ」。萌えキャラじゃないつもりで選んだが、英語圏に出すには避けたほうがいいというAIのアドバイスが繰り返された。まあ、この動画を2日で作ったことは大きな知見になったので良しとしよう。今後クオリティを上げるならまずはマイクを買うところからかなー。なので次回はYouTubeとして転生します。
🎬 完成した動画(限定公開)
公開設定はしてないけれど、リンク知っていれば見えるようにしたので、折角なので作った動画も貼っておく。
YouTubeで見る → https://www.youtube.com/watch?v=1FIenUtBTII