LoginSignup
4
0

More than 1 year has passed since last update.

音声認識でオンライン会議の議事録自動化(Google Meet, Teams, Slack コール 対応)

Last updated at Posted at 2022-05-03

何がしたいのか?

コストをかけずにオンライン通話アプリでの会話の記録を取りたい。
あわよくば取れた記録をそのまま議事録として関係者に展開したい。

今回の到達点

  • コストについて
    ドネーションウェアを使って環境を作ります。
    本格的に使っていくなら寄付するべきですので、コスト面でまだ課題が残っています。
  • 精度について
    正直なところ、そのまま議事録として残せる精度ではありません。
    議事録をまとめる時にどんな事話したか思い返すためのメモとしては使えます。

使用するアプリ

Speechnotes
(アクティブウィンドウ、アクティブタブじゃなくても動作し続けてくれるので便利)
VoiceMeeter
(bananaも入れてみたけどこっちで十分だった)

VoiceMeeter.png

目次

  1. VoiceMeeterのセットアップ
  2. 実際に使ってみる

VoiceMeeterのセットアップ

  1. 使用するアプリのリンクからインストーラーをダウンロードしてインストールします。
  2. 出力はVoiceMeeter Inputを指定します。
    image.png
  3. 入力は物理デバイスを指定します。
    image.png
  4. VoiceMeeterのコンソールを開いてHardwareOutを指定します。
    WDMの方が新しい規格のようなので、実際に音を出したいデバイスのWDMの方を選択します。
    image.png
  5. 続けてHardwareInputを指定します。
    いつも使っているマイクデバイスを選択します。
    image.png
  6. そのままだと自分の声がスピーカーから出てしまうので、マイクの音はVirtualOutからだけ流します。
    A(MainOut)のチェックを外す
    VoiceMeeter02.png
  7. Windows起動時にアプリが自動で立ち上がるようにします。
    ※標準出力をVoiceMeeter Inputにしているため、アプリを起動していないと音が出ません。
    Menuから「System Tray」と「Run on Windows Startup」にチェックします。
    image.png

実際に使ってみる

  1. 使用するアプリのリンクからSpeechnotesを開きます。
  2. マイク入力をVoice Meeter Outputに変更します。
    image.png
    ※設定アイコンが表示されず、変更できない場合は一度マイクアイコンをクリックしてディクテーションを開始するとアイコンが表示されると思います。
  3. マイクから喋った自分の声とニュース動画辺りを再生してその内容がテキスト化できていれば成功です。
    (最初に書いた通り、認識精度はお察しなので、今後良い方法を考えていきます)

今後について

ドネーションウェアに頼ってしまっているのがネックです。
まずは音声認識の部分を自作アプリに置き換えたい。
クラウド環境を整えたほうが良いんでしょうが、コスト面からWindowsに頼ってしまうのが良いのかなーと思ってます。
Windows頼りとなるとUWPかなー。

4
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
0