More than 5 years have passed since last update.

@igarain

ランサーズ株式会社

Google Apps Scriptで音声認識の議事録アプリを作ろう

Last updated at 2020-08-09Posted at 2020-08-09

この記事は

喋ったことを文字で確認できるようなものなにかないか探していてGoogle Docsの音声入力というものがあることを知ったわけですが

(GIFアニメ)

音声入力中に他のアプリをクリックしてしまうと自動で終了されてしまいます。

なんとかならんものかと考えたところ、ChromeのSpeech Recognition APIとGASのWebアプリケーションを使えば解決できたので解説していこうといった内容です。

どのようなものが仕上がったのか

↓の画像は動画のリンクになっております。

↓のリンクはソースコードです。

使い方

DocsとGASのWebアプリの作成

NodeJS v12.14.0使っていましたがたぶんよほど古くなければ他のバージョンでも大丈夫かと思います。
コマンドを羅列すると

git clone https://github.com/igara/speech-to-docs
cd speech-to-docs
npm install

# Googleの認証を行う
npx clasp login

# exampleという名前のDocsに紐づくGASプロジェクトを同時に作成する
npm run new name=example

# TypeScriptで記載されたコードをGAS用にビルド
npm run build

# ビルド済みのコードをGASプロジェクトに転送する
npx clasp push

ここまでの作業が完了したらDocsから
メニュー -> ツール -> スクリプトエディタ

スクリプトエディタ上で
メニュー -> 公開 -> ウェブアプリケーションとして導入...

を選択し、作成しようとすると認証確認が出ると思うので認証させれば完成です。
ウェブアプリケーションとして導入にあるURLが開ければ完了です。

GASのWebアプリ

(GIFアニメ)

背景色変更や文字の大きさの変更が可能だったりするので配信する人とかはここを変えてOBSのクロマキー処理とかも使ったりしたらいい感じになるんじゃないでしょうか。

マイクの設定は各自使用しているものに適応してください。

コード説明

src/gas

GASのスクリプトエディタに反映するコードを記載しています。

appsscript.json

  "executionApi": {
    "access": "ANYONE"
  },

の箇所はclaspのデバッグの都合でANYONEにしています。
今回の記事にはデバッグの仕方を記載しませんがやってみる場合はこちらの記事を参考にすると良いかもしれません。主にCloud Consoleでの設定がつむポイント
clasp run できないとき。2018-09-25

  "webapp": {
    "access": "MYSELF",
    "executeAs": "USER_DEPLOYING"
  },

"access": "MYSELF"はWebアプリケーションを使用できる人を自分だけにするために設定しています。
"executeAs": "USER_DEPLOYING"はnpx clasp deployでもWebアプリケーションの更新ができるようなので設定しています。
ただし初回の時はスクリプトエディタ上で承認しないと反映されないようです。
Docsのアクセス権限はデフォルト自分のみになっているので後でブラウザからDocsはURLわかる人には閲覧できるように設定するとリアルタイムで議事録の記載がされているのがDocs経由でみれるとかできます。

index.html

GASのWebアプリケーションを構成するHTMLです。

   <?!= HtmlService.createHtmlOutputFromFile("css").getContent(); ?>
   <?!= HtmlService.createHtmlOutputFromFile("js").getContent(); ?>

外部のファイルを呼び出しを上記で行っている点以外は標準なHTMLかと思います。

css.html

HTMLファイルですがGASのWebアプリケーションを構成するCSSです。

VSCodeでもstyleタグの補完が効いてくれていたので特に困ることがなかったです。

js.html

HTMLファイルですがGASのWebアプリケーションを構成するJavaScriptです。

このファイルもTypeScript化しようかと思いましたが既にGASの関数定義でWebpack等使っているのもあり、Webアプリケーション上ではHTMLファイルじゃないと外部読み込みできないというのもあって普通にJavaScriptで書くようにしました。

google.script.run.setText(logText);

というのがありますがWebアプリケーション側のJavaScriptでgoogle.script.run.xxxのような記載をするとGASの関数が起動可能みたいです。

# exampleという名前のDocsに紐づくGASプロジェクトを同時に作成する
npm run new name=example

を実行した時に使用していたスクリプトです。
nameの指定からDocsとGASプロジェクトが作成されるような処理を記載しています。

最後に

配信を文字に起こして振り返りがしやすくなる利点ってありそうだけど、音声認識がまだそこまで精密でもないから実施していないのかわかんないですが、この記事をきっかけになにか発展があれば幸いです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Google Apps Scriptで音声認識の議事録アプリを作ろう

この記事は

どのようなものが仕上がったのか

使い方

DocsとGASのWebアプリの作成

GASのWebアプリ

コード説明

src/gas

appsscript.json

index.html

css.html

js.html

do_get.ts

do_post.ts

set_text.ts

src/tasks

create_clasp_json.ts

最後に