TL;DR
- 音声入力アプリ「Wispr Flow」を使い始めて半年
- キーボードはほぼ触らない。物理ボタン1つで音声入力→Enter
- Slack、PRD、Windsurf、Claude Code、Discord — 全部声でやってる
- 他のアプリ(Aqua Voice、SuperWhisper、OS標準TTS)も試したけど、Wispr Flowが圧倒的に良かった
なぜ音声入力に移行したのか
PMという仕事は、とにかくテキストを書く。Slackの返信、PRD、仕様書、レビューコメント、議事録。1日の大半をキーボードに向かって過ごしていた。
ある時ふと思った。「話す方が速くない?」
人間の発話速度は1分間に約300文字。タイピングは速くても150文字。単純計算で2倍。しかも考えながら話せるので、思考とアウトプットのラグが小さい。
そこから音声入力ツールの探索が始まった。
遍歴:3つのアプリを経てWispr Flowへ
1. OS標準の音声入力(TTS)
最初に試したのはWindowsの標準音声入力。無料だし手軽。
問題点:
- 日本語の認識精度がイマイチ
- 専門用語(API、PRD、スプリント等)がまともに変換されない
- テキストの整形が一切されない(「えーと」「あのー」がそのまま入る)
2. Aqua Voice
次に試したのがAqua Voice。AIベースで精度はOS標準より遥かに良い。
問題点:
- 動作がやや重い
- 日本語と英語の切り替えがスムーズじゃない
3. SuperWhisper
Whisperベースのローカル処理。プライバシー面では最強。
問題点:
- ローカル処理なのでマシンスペックに依存
- コンテキスト理解が弱い(前後の文脈を考慮しない)
4. Wispr Flow(現在)
半年前に乗り換えて、もう戻れない。
何が違うのか:
- コンテキスト認識 — 今開いているアプリやテキストフィールドの内容を理解して、適切なトーンで変換してくれる
- 専門用語の精度 — 「PRD」「スプリントレビュー」「API Gateway」「デプロイ」が一発で出る
- コマンドモード — 「最後の文を消して」「これを英語にして」が声で指示できる
- 日英混在 — 日本語の中に英単語が混ざっても自然に処理される
- 速い — 体感ほぼリアルタイム
実際の作業環境
ハードウェア
キーボードの代わりに、物理ボタン1つを置いている。このボタンにWispr Flowの音声入力ショートカット + Enterを割り当て。
ワークフロー:
- ボタンを押す
- 話す
- ボタンを離す
- テキストが入力される
これだけ。キーボードを触るのは、パスワード入力くらい。
使っている場面
| 場面 | ツール | 音声入力の使い方 |
|---|---|---|
| チャット | Slack / Discord | 返信を声で入力 |
| ドキュメント | Notion / Google Docs | PRD、仕様書を口述 |
| コーディング | Windsurf / Claude Code | AIへの指示を声で |
| AIアシスタント | OpenClaw (Discord経由) | タスク指示、壁打ち |
| メール | Gmail | 返信を声で |
特にVibe Coding(AI駆動開発)との相性が抜群。Windsurfに「この関数をリファクタして、エラーハンドリングを追加して」と話しかけるだけでコードが書ける。キーボードで指示を打つより圧倒的に速い。
半年使ってわかったこと
メリット
- 速度: 体感2-3倍速い。特に長文
- 肩こり軽減: キーボードに向かう時間が激減
- 思考の流れ: タイピングで思考が途切れない。話しながら考えられる
- マルチタスク: 歩きながら、ストレッチしながらテキストが打てる
デメリット・注意点
- 静かな場所限定: カフェや共有オフィスでは使いにくい
- 慣れが必要: 最初は「声で入力する」こと自体に違和感がある
- 機密情報: 音声データがクラウドに送られるので、セキュリティポリシーの確認が必要
まとめ
半年前にキーボードを(ほぼ)捨てた。最初は不安だったけど、今はもう戻れない。
音声入力は「キーボードが打てない人の代替手段」ではない。キーボードより速く、自然にテキストを生成する方法だ。
特にPMのように「考えたことをテキストにする」仕事をしている人には強くおすすめしたい。
📢 Wispr Flowが今、Waitlist登録で無料枠キャンペーン中です。
興味がある方はぜひ → wisprflow.ai/waitlist?TAKEYOSHI1