はじめに
こんにちは、リコーの @shrhdk_ です。
ゆっくりボイスで有名な音声合成エンジン Aquestalk を使って、RICOH THETA V をおしゃべりにするプラグインを作ったのでご紹介します。
RICOH THETA プラグインパートナープログラムについて
THETA プラグインをご存じない方は こちら をご覧ください。
興味を持たれた方は Twitter のフォローと THETAプラグイン開発コミュニティ (Slack) への参加もよろしくお願いします。
プラグインの機能
写真の明るさ(露出補正値)のプラスマイナス操作と、明るさを音声で確認する機能、その設定で撮影する機能を搭載しました。
つまり、スマホに接続しなくても、写真の明るさを設定して撮影ができるようになります!!
操作 | 機能 |
---|---|
シャッターボタン | 静止画撮影 |
シャッターボタン (長押し) | 現在の露出補正値をしゃべる |
無線ボタン | 露出補正をプラスして、しゃべる |
モードボタン | 露出補正をマイナス して、しゃべる |
モードボタン (長押し) | プラグイン起動・終了 |
プラグインを使っている様子を動画にしました。AquesTalk の評価版を利用しているため、「ナ行、マ行」の音韻がすべて「ヌ」になっています。そのため「0.7」は「レイテンヌヌ」と読まれます。
プラグインの構成と処理
音声合成には株式会社アクエスト様の Aquestalk を利用しています。 Aquestalk は Android 版が用意されていて、とても簡単に使えました。今回は評価版を利用しました。
プラグインのソースコードは GitHub で公開しています。
AquesTalk のエンジンは複数ありますが、 AquesTalk10 を利用しています。また、漢字から音声用テキストに変換する AqKanji2Koe というライブラリも利用しています。AqKanji2Koe にはライブラリに付属している辞書ファイルが必要となります。辞書ファイルをプロジェクトの assets ディレクトリに入れることで APKファイル に同梱します。
明るさ(露出補正値)の設定と撮影は RICOH THETA API v2.1 を使います。
露出補正値をプラスするシーケンスは次のようになります。
THETA の本体スピーカーで音声を再生する方法についてでは以下の記事が詳しいです。
THETAプラグインでマイクを使って録音する - Qiita
プラグインのビルド
プラグインのソースコードは GitHub で公開しています。
AquesTalk のライブラリは株式会社アクエスト様の ダウンロードページ からダウンロードして、プロジェクトにコピーしてください。
まとめ
THETA は表示装置が LED だけで、複雑な状態を表現できませんでしたが、音声合成を導入することで様々な表現ができるようになりました。
AquesTalk は簡単に導入できますので、試してみてはいかがでしょうか。
今回は評価版を利用しましたが、AquesTalk を用いて実際に開発・利用・頒布をする場合は、ライセンス契約が必要になるようです。
詳しくは株式会社アクエスト様の ライセンス のページを御覧ください。