Slackにアップロードした音声を自動でWhisperに送って文字起こしし、その結果をSlackに返す仕組みは、Zapierを使う方法と、カスタムSlack Botを作る方法の2通りがあります。両方の手順を整理します。
① Zapier経由での実装
全体の流れ
-
トリガー
・Slackで「特定チャンネルに音声ファイルが投稿されたとき」をトリガーに設定 -
アクション(文字起こし)
・Zapierの「Webhooks by Zapier」で OpenAI Whisper API を呼び出し
・音声ファイルをWhisperに送信し、返ってきたテキストを取得 -
アクション(Slackへ投稿)
・そのテキストをSlackの同じチャンネルまたはスレッドに自動で投稿
メリット
・ノーコードで比較的簡単に設定可能
・数分でPoC(試験運用)が可能
デメリット
・Zapierの有料プランが必要になる場合が多い
・大量の音声処理にはコストがかかる
② Slack Bot(カスタムアプリ)での実装
全体の流れ
-
Slack App作成
・Slack API管理画面で新しいアプリを作成
・ファイルアップロードイベント(file_sharedなど)を購読 -
Whisper API連携
・サーバー側でアップロードされた音声ファイルURLを取得
・OpenAIのWhisper APIに送信して文字起こし結果を得る -
Slackへ返却
・結果テキストを自動でチャンネル/スレッドに投稿
メリット
・Zapierよりも柔軟でコスト効率が良い
・固有名詞対応や翻訳などの追加処理も組み込みやすい
デメリット
・Node.jsやPythonなどでBotを実装・ホスティングする必要あり
・初期セットアップにやや時間がかかる
③ おすすめの進め方
・短期的にすぐ試したい場合 → Zapier
・長期的に自社ワークフローに組み込みたい場合 → Slack Bot