はじめに
最近のLINEは機能がどんどん充実してきており、よく利用しているIFROで作成していた予約ボットなども簡単に作れちゃったりしてきています
なので、今日はまだLINEでは出来ない「音声を喋るBot」を作成してみようと思い、備忘録がてら久しぶりに記事を書いてみます
IFROのホームページもいつの間にかリニューアルされていて音声推しになっていました
ページ右下にある吹き出しをクリックした時に表示されるIFRO公式ボットのイプロン君?も喋るようになっていて可愛いw
やること
IFROは音声再生にも対応していて、使い方も慣れてるので今回も使っていこうと思います
音声の作り方についてはドキュメントの発話モジュールについての所とスキルの公開についてのところに凄くサラァァァァァァっと書いてあります
なので、実際に作ってみながら詳しく見ていこうと思います
プロジェクトの準備
いつも通り、「+新規スキル」を押して今回のプロジェクトを作ります
プロジェクト名をつけます
今回は「喋るボットマン」
デフォルト音声合成設定という項目を見つけました
なので、これを少し触ってみます
まずは、まさにこの「THE 音声」という感じのマークをクリックします
ふむふむ。。。
一通り試して聞いてみたので、説明を記載しておきます
感情レベルの隣にあるスピーカーマークを押すことでサンプル音声が再生されます
話者
- haruka
- タイトルから女性っぽいですが、どちらかというとボットって感じの声です
- hikari
- harukaより女性をイメージ出来て上品な感じの声になっています
- takeru
- 青年って感じの爽やかなイメージの声です
- santa
- うぉぉぉ!サンタクロースだぁぁぁ!という感じのまさにサンタクロースをイメージ出来るような声でしたw
- bear
- これは・・・bear・・・?
熊というよりテレビでたまに見るモザイクがかかった人の声に近いような・・・個人的にはちょっと怖いなと思ってしまいましたw
なんか凄く偏ってるなという感じがありましたが、ユースケースを考えているとボット系、女性、男性、語りかける系、別のキャラ系というイメージをすれば均等に扱える声質なのかなとも思えてきました
速さ
数字を大きくするほど、話すスピードが速くなります
ピッチ
数字を大きくするほど、声の高さが高くなります
(bearでやると怖さが増しましたw)
音量
単純に音量を調整できます
感情
- none
- 感情が入ってる感じはありませんが普通に聞けますね
- happiness
- 嬉しそうな話し方に聞こえます
- anger
- 怒ってるような話し方に聞こえます
- sadness
- 悲しんでるような話し方に聞こえます
感情レベル
1から4までの数値で上記、感情の表現力が高まる感じになっています
4にすると少し極端過ぎる印象になったので、2〜3くらいにして感情の部分でコントロールした方が良さそうです
実装
準備が出来たので、作ってみようと思います
今回は一旦、「何かご質問はございますか?」という言葉を発話することにします
配置した発話モジュールをダブルクリックして発話内容編集モーダルを表示します
そして、発話させる言葉を入力
ここで、入力した言葉の右端にある「THE 音声」マークと「スピーカー」マークを押してみます
デフォルト設定を使用にチェックが入っているので、一旦外してみます
外すと、チェックの下にあるharukaの声で音声が再生されました!
ということで発話モジュール単位でも声質をそれぞれ調整出来ることが分かりました
欲を言えば、デフォルトで設定した値がここに入ってると嬉しいですね〜
(デフォルトで設定した話者のまま、微妙にスピードやピッチを変えたり、感情の起伏を表現したいので)
一応、探したけどデフォルトの値を「ここに持ってくる」みたいなボタンなどもありませんでした
ただ、発話モジュール単位で声質も変えられるってことは、2〜3人登場させてボット漫才なども出来そうです
需要があるかどうかは別ですがw
笑いのセンスがあれば次回記事で作りたいところですが、とりあえずそういったセンスは持ち合わせていませんでした・・・・。。。
IFROのAPIも公開されてるので、ユーザー側の音声入力もアプリなどで制御出来れば完全に対話が実現出来ますね!
とりあえずIFROの音声発話の備忘録として。
最後に
音声入力は当たり前になってきているので、ボットも音声発話出来ると色々便利な世の中がさらに便利な世の中になるんじゃないかなと思っている次第です
ちな、下記にイプロンくんのソースコードが公開されていましたので、これを流用していい感じのチャットボットを作ってみるのも良さそうです