背景
これ、意外とご存じない方が多いので。検索で引っかかるように、そして Microsoft Copilot (Bing Chat) がこれをデータとして活用してくれるコトを期待してBlogにしておきます😊
音声入力の精度が上がってきて、他との連携で十分業務に耐えられることが増えています。そしてそれは、Microsoft Word のディクテーションの機能に搭載されています。 Wordの場合は、かなり、長い文章でもう入力ができてかつ自動保存の機能もありますからデータがなくならない可能性が高いわけですね。
その場でのマイクからの音声入力もいけます。そのまま文字起こしになりますね。これは簡単。
それとは別に、Microsoft Word には トランスクリプト という機能があって。動画や音声ファイルから文字起こしをしてくれるんです。つまり、ミーティングの録画などの MP3, MP4, WAVといった音声ファイルあるいは音声を含んでいるファイルを、そのまま使う事ができるんですね!
ここではボイスレコーダーをサンプルにして音声ファイルを作りそれをそのまま再生することで、Microsoft Word の中で文字起こしをすると、いうことをやっていきます。
因みにこの Blog も Windows の音声入力の機能を使ってドラフトの入力をしています。もう文字をキーボードで最初から打つってことあんましてないですね。音声入力をしてええ、修正をしていく。それだけでもだいぶ早いんですよ😊
注意
ブログ書いた時点で、この機能はプレビューとなっています。
準備
以下のものを使っていきます。
- (おまけ) サウンドレコーダー (Windows 標準搭載): 動作確認用のMP3ファイル作成用
- Microsoft Word: ディクテーション機能がついているもの
0. デモ用の音声ファイルの準備
ここではwindowsに標準で搭載されている、サウンドレコーダーを使っていきます。
「ボイスレコーダー」で検索しても、出てきますね😊
録音をします。何か適当に話してみてください。ウェブサイトなどに行って、それを読み上げてみるでもいいと思います。自分でデータを作ることで知財を気にしなくていいというところがいいとこですね。
録音が終わるとこの図のように自分のドキュメントフォルダの中に作られたWAVファイルが保存されています。
できたら録音が終わった後に、そのWAVファイルを自分で聞いてみたほうがいいですね。なぜかといえば、音質が悪いと Speech to Text のモデルで処理する時に精度が落ちちゃいますからね。
さ。これで準備完了です。
1. Word のトランスクリプトを実行
これは超絶簡単です。
まずは Word を新規に起動します。
次にディクテーションのメニューからトランスクリプトを選択します。
先ほど作成した WAVファイルを選択して、文字起こしを実行します。
ちょっと待ちますね。やってるときに。
この処理を見ると、ファイルは自分の OneDrive for Business にアップロードされてから トランスクリプト されていることが分かります
終わりました😊
作成したトランスクリプトから、文字だけ、あるいはしゃべってる人もいれるとか、選択できるのはとても便利ですね😊
はい。結果はこんな感じです
おまけ
Copilot for Microsoft 365 を殆どの方が購入できる状態になりました。
Word に搭載されている Copilot 君ですと、この文字起こししたファイルの内容に対して、様々な ChatGPT を使った処理が出来ます。
[ALT] + [I] が Copilot のキーボードのショートカットキーですね。覚えていると超絶便利です!!!
合っているかどうかは、ご自身で確認してくださいね。そして、Wordに出力してしまえば、いくらでも修正できますので。それもお忘れなく。
まとめ
今回は結果的には Word のトランスクリプトの機能を紹介してきました。
非常にですね。やっぱ長い文章を起こしてくれるとかいいですしね。音声ファイルからの議事録作成ツールとしてすごい使えるんじゃないかなと思います。ええ。是非皆さんも試してみてください。