前回の非エンジニア丸出しの投稿をストックして頂いた方がいらして、恥ずかしいやら申し訳ないやら…。
さて、今回も大したことありません。
PepperやNAOにそのまま喋らそうとすると、アクセントが違ったりすることが普通です。なので、ちょっとの修正(人名とか会社名とか部署名とか)だとしても、結構調整に時間がかかってしまうことがあったりします。
もちろん「ロボットだからアクセントはそれほど拘らない」という方もいらっしゃれば、「プロジェクトの命運がかかっているから、全て完璧で」という方もいらっしゃいます。
PepperやNAOに関しては、音声合成エンジンは株式会社エーアイが開発したものを使っています。(ここまでは公開されている情報なのでご存じの方もいらっしゃると思いますが)
Pepperの声は発表後直ぐに、ネット界隈で声優の民安ともえさんじゃないかという話が挙がってきました。
少し調べてみると株式会社エーアイさんのOEM商品を販売している株式会社AHSさんが読み上げソフトとして民安ともえさんを起用した「VOICEROID+ 民安ともえ EX」(http://www.ah-soft.com/voiceroid/maki/)を発売しているではありませんか!!
その上、サイトを開くと「フリーテキスト音声」というサービスがあり、好きな文字を入れると「VOICEROID+ 民安ともえ EX」の音声で読み上げてくれます(変更できるのは速度とピッチのみです)。これは使えるということで、アクセントに難アリのものが出てきたら、先ずこれを使ってアクセントに合う文字の組み合わせを探した後、Choregrapheに改めて反映させたりしています。
例えば、「AKB48」を一般的なアクセントで発音させる場合、そのままだと「エーケービーヨンジュウハチ」と読んでしまいます。アクセントに近く読み上げさせるためには『AKB fortyエイト』と入力するとそれっぽく聞こえます。
こんな風に色々な組み合わせでアクセントを調整していきます。下手をすると漢字を当てた方がアクセントがピッタリということも…。
アクセントに関しては一癖も二癖もあるので、チューニングして落とし所見つけるまで苦労が絶えず、かつ時間がかかるということをクライアント様にもご理解して欲しいと悩む今日この頃です。