0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

はじめてのElevenLabs(感情タグを使いこなせ)

Posted at

はじめに

  • 音声合成のAIツールは2強といわれる(2025年8月時点)。
  • Google AI studioとElevenLabsである。
  • 今回はElevenLabsをはじめて使うひと向けに書く。
  • 一緒にやっていこう!

Eleven Labsとは?

  • 音声合成技術(Text-to-Speech)のWEBサービスです。
  • 元Googleの機械学習エンジニアPiotr Dąbkowski氏などにより作られたStartup。
  • 音楽もだけど、感情タグを使ったセリフを言わせるのが得意。

使い方

  • 1番注目されてる感情タグ使ったセリフ生成の画面。
  • 「Text to Speech」を選んで「v3(alpha)」にしましょう。まだアルファ版なので、いじれるパラメータは多くない。
  • 声のモデルは「kyoko」「Shohei」「Kuro」あたりがおすすめ。
  • セリフの間に[感情タグ]を挿入します。複数人の掛け合い可能。
  • 2種類の音声を生成してくれる。無料だと1000クレジットで150くらい消費される。

elevenlabs_qiita01.png

使ってみた感想(Googleとの比較)

(1)無料版ではStyleプロンプトがないのがGoogleとの違い

  • 下の画像は、Google AI StudioのTTSの画面だけど、「Style」と「Text」がわかれていて、それぞれに入力する。感情タグは、Googleでも一応機能する。ただし、Elevenlabsの方が、柔らかい感じで、自由にぐにゅぐにゅセリフが動きがち。
  • 「Voice Design V3」を押すと、無料版でも「Style」のフォームが出てくるんだけど、今度は「声モデル」が選択できず、男女が入れ替わっちゃったりが起きた(2025年8月時点の私の場合)
  • 課金勢は、もっとパラメータが動かせるのかも。

elevenlabs_qitta_02.png

(2)声モデルの追加に期待かな?

  • Google AI Studioでも、女性の声モデルは「Leda」さんが定番。
  • 現在のところ、声モデルの数が無料だと少ない。
  • V3の本領は課金してみないとわからないかも。自分の声をシミュレーションしてくれる機能もあって、Text to Speechのサービスとしては有力候補の1つなのだろう。
  • 個人的にはAIっぽさは残っているので、iZotopeのNecterやRXなどの音声編集ツールで、環境音と馴染ませてあげないと、セリフは浮くかなと思った。

(3)クレジットの課金圧は優しい

  • 月あたり2000円〜3000円あたりかかるAIツールも多い中では、1000円未満で駆動できるラインがElevenLabsにはある。
  • Googleの声が気に入らないひとにはよいかもしれない。

これからのElevenLabsとの付き合い方

  • 全体的にはGoogle AI Studioと大きな差はないかなというオピニオンです。
  • Googleの「Leda」さんは、ElevenLabsの「Kyoko」さんより声にハリがあるので、現状はその程度の違いかなとおもう。すごすぎる!って騒ぐほどではないかな。
  • 感情タグで、セリフの言い方が、ぐにゃぐにゃ変化するのは面白い。

ElevenLabsの感情タグのリスト

☹️ 感情系タグ

タグ 意味 / 用途例
[neutral] 感情を抑えたニュートラルな話し方
[happy] 穏やかで幸せそうな声
[excited] 明るくテンション高め
[energetic] 元気いっぱい、勢いのある声
[sad] 少し沈んだトーン
[angry] 怒りや苛立ちを含む
[fearful] 恐怖や不安をにじませる
[surprised] 驚き・感嘆
[romantic] 柔らかく親密な雰囲気
[playful] 茶目っ気があり楽しそう
[whisper] / [warm whisper] 囁くような声(温かみのある)
[serious] 緊張感・真剣味を帯びた声
[triumphant] 勝利感、達成感をこめて
[laughing] 笑いながら話す
[giggles] くすくす笑い
[chuckles] 軽く笑う
[crying] 泣きながら話す

📢 声質・演技指示系

タグ 意味 / 用途例
[low voice] 声を低く
[high voice] 声を高く
[soft] 柔らかく控えめ
[calm] 落ち着いたトーン
[gentle smile] 微笑みを含んだ声
[authoritative] 威厳のある声
[narration] ナレーション調
[storytelling] 語りかけるように
[questioning] 疑問を含んだ口調

🌊 間・テンポ制御系

タグ 意味 / 用途例
[pause 0.5s] 0.5秒ポーズ
[short pause] 短めの間
[long pause] 長めの間
[slow] ゆっくり話す
[fast] 速めに話す

参考にした記事

おわりに

この記事が役に立ったら、ぜひLIKEとストックをお願いします!

XやYouTube、Discordもやっていますので、よろしければフォローをお願いします。

#ElevenLabs #GoogleAIStudio #やってみた #TTS #音声合成 #初心者

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?