この記事はなにか
UiPathのパッケージUiPath.GoogleSpeech.Activities
を活用して、話しかけた内容のテキスト化、読み上げをやってみました。
フローは以下のとおりです。
- 音声を認識して取り込む
- それをテキストに書き込む
- UiPathに取り込んだ音声+αを読み上げてもらう
UiPathでのフローが伝わりやすいように、先にアクティビティの構成の画像を上げておきます。
バージョン情報
- Windows10 home
- UiPath Studio 2020.2.0-beta.108 Community License
準備
今回使用する「Voice enabled RPA - AI」は、
Google Cloud Platfromの
・Cloud Speech-to-Text API
・Cloud Text-to-Speech API
を利用したもののため、そのアカウントの作成とクレジットカードが必要です。
(今回は無料、詳細後述)
1.パッケージのインストール
UiPathの「パッケージを管理」からUiPath.GoogleSpeech.Activities
をインストールします。
(最初、サイトからダウンロードしたもののよくわからなかったですが、ダウンロードしたファイルの名前を見るとUiPath.GoogleSpeech.Activities.0.1.6850.39757.nupkg
となっていたのでこうしました。)
2.Google Cloud Platfromでサービスアカウントキーを取得
今回使用するVoice enabled RPA - AIのアクティビティリストに
・ Google Speech To Text
・ Google Text To Speech
とありましたので、Google Cloud Platfrom にアクセスして**「API とサービス」**に進み、
**「+ APIとサービスの有効化」**をクリックして、
Cloud Speech-to-Text API
とCloud Text-to-Speech API
をそれぞれ有効化します。
※Google Cloud Platfromのアカウントがない場合はプロジェクトと一緒に作成しましょう。
※認証にはクレジットカードが必要ですが、1年間は300ドル分のサポートがあり、承認しない限りは課金されないようです。
その後、サービスアカウントキーを作成し、jsonファイルを任意のディレクトリに保管します。
(説明端折ってますが、余裕があれば追記します。)
3.UiPathのフローを作成
3-1.アクティビティを並べる
3-2.変数の設定
話した言葉をここに格納します。変数の名前はspeechContent
、型はString
としました。
3-3.「Speech to text」の設定
先程、Google Cloud Platfromで取得したサービスアカウントキーの保存先のパスを「ServiceAccoutFile」で指定します。
3-4.「テキストをファイルに書き込み」の設定
「テキスト」は変数、「書き込む先のファイル名」はテキストファイルまでのパスを設定します。
保存するテキストファイルも作成しておいてください。
3-5.「Text to speech」の設定
Google Cloud Platfromで取得したサービスアカウントキーの保存先のパスを「ServiceAccoutFile」に指定します。
以上で準備完了です。
実行
最後に、準備した内容を実行してみます。
-
「『今日はいい天気ですね』と書き込まれました」と返事があります。
所感
その昔、Via Voiceというソフトで頑張って文章を書こうとしていた頃が懐かしいです。
音声認識でのテキスト化も返事もできるので、
含まれる語句を条件分岐して作業の割当をすれば声での操作もできそうです。