はじめに
- 音声合成のAIツールは2強といわれる(2025年8月時点)。
- Google AI studioとElevenLabsである。
- 今回はElevenLabsをはじめて使うひと向けに書く。
- 一緒にやっていこう!
Eleven Labsとは?
- 音声合成技術(Text-to-Speech)のWEBサービスです。
- 元Googleの機械学習エンジニアPiotr Dąbkowski氏などにより作られたStartup。
- 音楽もだけど、感情タグを使ったセリフを言わせるのが得意。
使い方
- 1番注目されてる感情タグ使ったセリフ生成の画面。
- 「Text to Speech」を選んで「v3(alpha)」にしましょう。まだアルファ版なので、いじれるパラメータは多くない。
- 声のモデルは「kyoko」「Shohei」「Kuro」あたりがおすすめ。
- セリフの間に[感情タグ]を挿入します。複数人の掛け合い可能。
- 2種類の音声を生成してくれる。無料だと1000クレジットで150くらい消費される。
使ってみた感想(Googleとの比較)
(1)無料版ではStyleプロンプトがないのがGoogleとの違い
- 下の画像は、Google AI StudioのTTSの画面だけど、「Style」と「Text」がわかれていて、それぞれに入力する。感情タグは、Googleでも一応機能する。ただし、Elevenlabsの方が、柔らかい感じで、自由にぐにゅぐにゅセリフが動きがち。
- 「Voice Design V3」を押すと、無料版でも「Style」のフォームが出てくるんだけど、今度は「声モデル」が選択できず、男女が入れ替わっちゃったりが起きた(2025年8月時点の私の場合)
- 課金勢は、もっとパラメータが動かせるのかも。
(2)声モデルの追加に期待かな?
- Google AI Studioでも、女性の声モデルは「Leda」さんが定番。
- 現在のところ、声モデルの数が無料だと少ない。
- V3の本領は課金してみないとわからないかも。自分の声をシミュレーションしてくれる機能もあって、Text to Speechのサービスとしては有力候補の1つなのだろう。
- 個人的にはAIっぽさは残っているので、iZotopeのNecterやRXなどの音声編集ツールで、環境音と馴染ませてあげないと、セリフは浮くかなと思った。
(3)クレジットの課金圧は優しい
- 月あたり2000円〜3000円あたりかかるAIツールも多い中では、1000円未満で駆動できるラインがElevenLabsにはある。
- Googleの声が気に入らないひとにはよいかもしれない。
これからのElevenLabsとの付き合い方
- 全体的にはGoogle AI Studioと大きな差はないかなというオピニオンです。
- Googleの「Leda」さんは、ElevenLabsの「Kyoko」さんより声にハリがあるので、現状はその程度の違いかなとおもう。すごすぎる!って騒ぐほどではないかな。
- 感情タグで、セリフの言い方が、ぐにゃぐにゃ変化するのは面白い。
ElevenLabsの感情タグのリスト
☹️ 感情系タグ
タグ | 意味 / 用途例 |
---|---|
[neutral] |
感情を抑えたニュートラルな話し方 |
[happy] |
穏やかで幸せそうな声 |
[excited] |
明るくテンション高め |
[energetic] |
元気いっぱい、勢いのある声 |
[sad] |
少し沈んだトーン |
[angry] |
怒りや苛立ちを含む |
[fearful] |
恐怖や不安をにじませる |
[surprised] |
驚き・感嘆 |
[romantic] |
柔らかく親密な雰囲気 |
[playful] |
茶目っ気があり楽しそう |
[whisper] / [warm whisper]
|
囁くような声(温かみのある) |
[serious] |
緊張感・真剣味を帯びた声 |
[triumphant] |
勝利感、達成感をこめて |
[laughing] |
笑いながら話す |
[giggles] |
くすくす笑い |
[chuckles] |
軽く笑う |
[crying] |
泣きながら話す |
📢 声質・演技指示系
タグ | 意味 / 用途例 |
---|---|
[low voice] |
声を低く |
[high voice] |
声を高く |
[soft] |
柔らかく控えめ |
[calm] |
落ち着いたトーン |
[gentle smile] |
微笑みを含んだ声 |
[authoritative] |
威厳のある声 |
[narration] |
ナレーション調 |
[storytelling] |
語りかけるように |
[questioning] |
疑問を含んだ口調 |
🌊 間・テンポ制御系
タグ | 意味 / 用途例 |
---|---|
[pause 0.5s] |
0.5秒ポーズ |
[short pause] |
短めの間 |
[long pause] |
長めの間 |
[slow] |
ゆっくり話す |
[fast] |
速めに話す |
参考にした記事
- 【完全ガイド】ElevenLabs v3を使いこなす!100種以上のAudioタグ徹底解説&全リソース集
- ElevenLabs の「Sound Effects」でテキストから効果音を生成してみる:Webサイト上での生成とMP3ファイルのダウンロード
- 「毎週AIツール体験レビュー」– 新時代のツール活用術 | [第5回]: ElevenLabs & Play.htで音声AIを比較
- 感情を表現できるAI音声「ElevenLabs(Eleven v3)」使い方&VoiceDesignタグ一覧
- ElevenLabs で Instant Voice Cloning を試す
- 【ElevenLabs】独自音声の音声会話AI使い方と活用解説【Conversational AI】
- 【ElevenLabsの使い方】AI音声読み上げが、更に自然になりました。
- 【実践レポート】ElevenLabsを使ってみた!ログインから音声生成まで完全ガイド
- 音声読み上げAIのElevenLabsが本気で音楽領域に参入したみたい
- 音声生成AI「Eleven Labs」について——Gensparkが解説
- Elevenlabs完全ガイド:AIでテキストを自然な音声に変換し、収益化する方法
- ElevenLabsで自分の声を学習させて音声スピーチを作成する
- ElevenLabs で Text-to-Speech を試す
- ElevenLabs音声生成で革命を起こせ!2025年最新完全ガイド
- 評価額32億ドル!米国発「ElevenLabs」が起こす音声革命―誰でも“プロの声”を数秒で生み出すAI
- ElevenLabsで自作キャラの声を作る方法|AI音声でアニメ風ボイスを完全再現
- ElevenLabsを試してみた!
- 音声こそが未来を拓くインターフェース──ElevenLabsが示すAI音声革命の全貌
おわりに
この記事が役に立ったら、ぜひLIKEとストックをお願いします!
XやYouTube、Discordもやっていますので、よろしければフォローをお願いします。
#ElevenLabs #GoogleAIStudio #やってみた #TTS #音声合成 #初心者