Transcribe×Bedrockで最低限のSTT/要約アプリを作った話

Posted at 2026-02-15

はじめに

AIが業務に浸透し始めて、最近こんなことを思うようになりました。
それ即ち、「指示を出すのが面倒くさい」。

「いや、そんなことまでしろって言ってない」とか、「そこはもっとシンプルにしてほしい」とか。
対人なら雰囲気やこれまでの文脈で伝わることも、AI相手だとなかなかうまく伝わりません。
（ある意味、自分の指示出し能力の低さが露呈しているだけな気もしますが……）

さらにその面倒くささに拍車をかけているのが、プロンプトをタイピングしなければならない点です。

そこで、「様々なAIへの指示出しを音声入力でできれば、もっと楽になるのでは？」と考え、本アプリの作成に着手しました。

機能はシンプルです。

最初はSTT機能だけを実装していましたが、単純な文字起こしだと内容がどうしてもごちゃついてしまうため、Bedrockによる要約機能を追加しました。

Transcribeを初めて使ってみましたが、かなりシンプルで扱いやすいですね。

コスト面を考えると、端末にWhisperを入れる構成も検討したいところですが、業務利用を前提にするならAWSのマネージドサービスを使っておいた方が色々と都合がいいので、今回はこの方針にしました。

最終的には、Codex CLIなどに送信するプロンプトをSTTで流し込んだり、レビュー対象物とレビュー内容をBedrockに突っ込んで、いい感じのレビュー記録表を自動生成させたり、といったこともやりたいなと思っています。