はじめに
こんにちは。
現在 株式会社Nexceed にてインターンを行っている学生です。
今回は議事録の自動生成を目指し、音声認識を行ってくれるSpeech-to-Text APIを利用していきたいと思います。
↓ こちらの記事の続きという形になりますので、よろしければご覧ください。
Speech-to-Text APIを使って文字起こしを試してみる
準備
必要なライブラリをインストール
pip install pyaudio # Python3.7系は非対応なので注意
サービスアカウントのAPIキーのパスを設定
GCPでサービスアカウントのAPIキーを作成しておきます。
# 認証用のJSONファイル(GCPで作成)
CREDENTIAL_JSON = 'secret.json' #ここを変更してください
今回作成したプログラム
ストリーミングではなく同期認識を用いていますが、後述の公式のサンプルプログラムを参考にしてます。
https://gist.github.com/saihara-k/b083455c8ae0ad398e18305de7d63313
実行結果
生成されたテキストファイル
たとえ井戸の中に閉じ込められている束縛状態の波動関数
でも有限の高さの障壁の中には少ししみ出すことを見た日に出した波動関数の神父
衝撃の中を進むにつれて指数関数的に急激に減衰するので正直厚みが十分にあれば
波動関数をしっかりと閉じ込められそうであるでは衝撃の厚みがとても薄いとどうなるかその場合は
の関数は十分減衰しないうちに障壁を継ぐかしてしまう一旦障壁の外に出てしまえば波動関数
人生は山のでどこまでも減衰せずに電波するつまり障壁の厚みが薄いと波動関数を
家に閉じ込めることができずにいるから漏れ出てしまう言い換えると障壁は波動関数を完全に
ことができずに一部を透過させてしまう
元の文章
たとえ井戸の中に閉じ込められている束縛状態の波動関数でも、
有限の高さの障壁の中には少し染み出すことを見た。染み出した波動関数の振幅は、
障壁の中を進むにつれて指数関数的に急激に減衰するので、障壁の厚みが十分にあれば、
波動関数をしっかりと閉じ込められそうである。では、障壁の厚みがとても薄いとどうなるか?
その場合は、波動関数は、十分減衰しないうちに障壁を通過してしまう。いったん障壁の外に出てしまえば、
波動関数の減衰は止むので、どこまでも減衰せずに伝播する。つまり、障壁の厚みが薄いと波動関数を
完全に閉じ込めることができずに、井戸から漏れ出てしまう。言い換えると、障壁は波動関数を完全に
跳ね返すことができずに、一部を透過させてしまう。
感想
メモとして利用できる程度には精度があり、文字起こしのテキストファイルを見返せばどんな会話があったか思い返すことが出来るのではないでしょうか。
議事録として利用していくことを考えると、今後発話者の認識などが出来るようになれば良いなと思います。