2
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

【UiPath】音声認識でのテキスト化や読み上げをやってみる

Last updated at Posted at 2020-03-08

この記事はなにか

UiPathのパッケージUiPath.GoogleSpeech.Activitiesを活用して、話しかけた内容のテキスト化、読み上げをやってみました。
フローは以下のとおりです。

  1. 音声を認識して取り込む
  2. それをテキストに書き込む
  3. UiPathに取り込んだ音声+αを読み上げてもらう

UiPathでのフローが伝わりやすいように、先にアクティビティの構成の画像を上げておきます。

image.png

バージョン情報

  • Windows10 home
  • UiPath Studio 2020.2.0-beta.108 Community License

準備

今回使用する「Voice enabled RPA - AI」は、
Google Cloud Platfromの
Cloud Speech-to-Text API
Cloud Text-to-Speech API
を利用したもののため、そのアカウントの作成とクレジットカードが必要です。
(今回は無料、詳細後述)

image.png

1.パッケージのインストール

UiPathの「パッケージを管理」からUiPath.GoogleSpeech.Activitiesをインストールします。
(最初、サイトからダウンロードしたもののよくわからなかったですが、ダウンロードしたファイルの名前を見るとUiPath.GoogleSpeech.Activities.0.1.6850.39757.nupkgとなっていたのでこうしました。)

image.png

2.Google Cloud Platfromでサービスアカウントキーを取得

今回使用するVoice enabled RPA - AIのアクティビティリストに
・ Google Speech To Text
・ Google Text To Speech
とありましたので、Google Cloud Platfrom にアクセスして**「API とサービス」**に進み、
**「+ APIとサービスの有効化」**をクリックして、
Cloud Speech-to-Text APICloud Text-to-Speech APIをそれぞれ有効化します。

image.png

※Google Cloud Platfromのアカウントがない場合はプロジェクトと一緒に作成しましょう。
※認証にはクレジットカードが必要ですが、1年間は300ドル分のサポートがあり、承認しない限りは課金されないようです。

その後、サービスアカウントキーを作成し、jsonファイルを任意のディレクトリに保管します。
(説明端折ってますが、余裕があれば追記します。)

3.UiPathのフローを作成

3-1.アクティビティを並べる

先述しましたが、このようなアクティビティの構成にします。
image.png

3-2.変数の設定

話した言葉をここに格納します。変数の名前はspeechContent、型はStringとしました。
image.png

3-3.「Speech to text」の設定

先程、Google Cloud Platfromで取得したサービスアカウントキーの保存先のパスを「ServiceAccoutFile」で指定します。
image.png

3-4.「テキストをファイルに書き込み」の設定

「テキスト」は変数、「書き込む先のファイル名」はテキストファイルまでのパスを設定します。
保存するテキストファイルも作成しておいてください。
image.png

3-5.「Text to speech」の設定

Google Cloud Platfromで取得したサービスアカウントキーの保存先のパスを「ServiceAccoutFile」に指定します。
image.png

以上で準備完了です。

実行

最後に、準備した内容を実行してみます。

  1. デバッグ:arrow_forward:をクリックすると、以下のボタンが出てくると思うので、Startを押します。
    image.png

  2. 「きょうはいいてんきですね」と話しかけます。
    image.png

  3. 話しかけ終わったら、「Stop」を押します。
    image.png

  4. 「『今日はいい天気ですね』と書き込まれました」と返事があります。

  5. 最後に、テキストを確認してみましょう。
    image.png
    書き込まれていますね。成功です!

所感

その昔、Via Voiceというソフトで頑張って文章を書こうとしていた頃が懐かしいです。
音声認識でのテキスト化も返事もできるので、
含まれる語句を条件分岐して作業の割当をすれば声での操作もできそうです。

参考

UiPath Goを利用してRPA×AIを試してみた | BTC RPA

2
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?