LoginSignup
2
0

More than 1 year has passed since last update.

喋るBotを作ってみる

Posted at

はじめに

最近のLINEは機能がどんどん充実してきており、よく利用しているIFROで作成していた予約ボットなども簡単に作れちゃったりしてきています

なので、今日はまだLINEでは出来ない「音声を喋るBot」を作成してみようと思い、備忘録がてら久しぶりに記事を書いてみます

IFROのホームページもいつの間にかリニューアルされていて音声推しになっていました
ページ右下にある吹き出しをクリックした時に表示されるIFRO公式ボットのイプロン君?も喋るようになっていて可愛いw

スクリーンショット 2022-10-10 16.14.45 1.png

やること

IFROは音声再生にも対応していて、使い方も慣れてるので今回も使っていこうと思います

音声の作り方についてはドキュメントの発話モジュールについての所とスキルの公開についてのところに凄くサラァァァァァァっと書いてあります

なので、実際に作ってみながら詳しく見ていこうと思います

プロジェクトの準備

スクリーンショット 2022-10-11 4.12.59.png

いつも通り、「+新規スキル」を押して今回のプロジェクトを作ります

スクリーンショット 2022-10-11 4.14.51.png

プロジェクト名をつけます
今回は「喋るボットマン

と、ここでプロパティの下の部分に注目です
スクリーンショット 2022-10-11 4.14.51.png

デフォルト音声合成設定という項目を見つけました
なので、これを少し触ってみます

まずは、まさにこの「THE 音声」という感じのマークをクリックします
スクリーンショット 2022-10-11 4.20.45.png

すると、なにやら色々な設定項目が表示されました
スクリーンショット 2022-10-11 4.20.58.png

ふむふむ。。。
一通り試して聞いてみたので、説明を記載しておきます

感情レベルの隣にあるスピーカーマークを押すことでサンプル音声が再生されます

話者

haruka
タイトルから女性っぽいですが、どちらかというとボットって感じの声です
hikari
harukaより女性をイメージ出来て上品な感じの声になっています
takeru
青年って感じの爽やかなイメージの声です
santa
うぉぉぉ!サンタクロースだぁぁぁ!という感じのまさにサンタクロースをイメージ出来るような声でしたw
bear
これは・・・bear・・・?
熊というよりテレビでたまに見るモザイクがかかった人の声に近いような・・・個人的にはちょっと怖いなと思ってしまいましたw

なんか凄く偏ってるなという感じがありましたが、ユースケースを考えているとボット系、女性、男性、語りかける系、別のキャラ系というイメージをすれば均等に扱える声質なのかなとも思えてきました

速さ

数字を大きくするほど、話すスピードが速くなります

ピッチ

数字を大きくするほど、声の高さが高くなります
(bearでやると怖さが増しましたw)

音量

単純に音量を調整できます

感情

none
感情が入ってる感じはありませんが普通に聞けますね
happiness
嬉しそうな話し方に聞こえます
anger
怒ってるような話し方に聞こえます
sadness
悲しんでるような話し方に聞こえます

感情レベル

1から4までの数値で上記、感情の表現力が高まる感じになっています

4にすると少し極端過ぎる印象になったので、2〜3くらいにして感情の部分でコントロールした方が良さそうです

とりあえず、以下のような設定にしてみました
スクリーンショット 2022-10-11 4.45.40.png

実装

準備が出来たので、作ってみようと思います
今回は一旦、「何かご質問はございますか?」という言葉を発話することにします

早速、発話モジュールを配置します
スクリーンショット 2022-10-11 4.57.56.png

配置した発話モジュールをダブルクリックして発話内容編集モーダルを表示します
そして、発話させる言葉を入力
スクリーンショット 2022-10-11 4.58.37.png

ここで、入力した言葉の右端にある「THE 音声」マークと「スピーカー」マークを押してみます
スクリーンショット 2022-10-11 5.00.54.png

  • スピーカーを押すと、プロジェクトの準備のところで設定したデフォルトの設定で音声が流れます
  • THE 音声を押すと、プロジェクトの準備のところで設定したデフォルトの設定のような画面が表示されます
    スクリーンショット 2022-10-11 5.03.49.png

デフォルト設定を使用にチェックが入っているので、一旦外してみます

スクリーンショット 2022-10-11 5.04.31.png

外すと、チェックの下にあるharukaの声で音声が再生されました!
ということで発話モジュール単位でも声質をそれぞれ調整出来ることが分かりました


欲を言えば、デフォルトで設定した値がここに入ってると嬉しいですね〜
(デフォルトで設定した話者のまま、微妙にスピードやピッチを変えたり、感情の起伏を表現したいので)

一応、探したけどデフォルトの値を「ここに持ってくる」みたいなボタンなどもありませんでした

ただ、発話モジュール単位で声質も変えられるってことは、2〜3人登場させてボット漫才なども出来そうです
需要があるかどうかは別ですがw
笑いのセンスがあれば次回記事で作りたいところですが、とりあえずそういったセンスは持ち合わせていませんでした・・・・。。。

IFROのAPIも公開されてるので、ユーザー側の音声入力もアプリなどで制御出来れば完全に対話が実現出来ますね!

とりあえずIFROの音声発話の備忘録として。

最後に

音声入力は当たり前になってきているので、ボットも音声発話出来ると色々便利な世の中がさらに便利な世の中になるんじゃないかなと思っている次第です

ちな、下記にイプロンくんのソースコードが公開されていましたので、これを流用していい感じのチャットボットを作ってみるのも良さそうです

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0