こんにちは、座禅いぬです。
この記事はマナビDXQuestで得たもの Advent Calendar 2025のシリーズ2、11日目の記事です。今回は「文字起こしツールの出力も、議事録まとめも、どっちも頭に入らなくない?」という話をします。
きっかけ:企業協働で文字起こしが当たり前になっていた
マナビDXクエストの地域企業協働プログラムに参加して驚いたことがあります。オンラインミーティング(以下MTG)の文字起こしが当たり前のように行われていたのです。企業との打ち合わせ、チームMTG、すべてが記録されている。「これは便利だ」と思いました。議事録もわかりやすくまとまっている。
自分の仕事でも取り入れたくなって、Zoomの課金プランに入りました。自動文字起こし機能やクラウド録画機能が付いていて、しかも時間制限から解放されます。やった!これでMTGの内容を忘れることがなくなる。そう期待していました。
結果、落胆しました。
問題点:文字起こしは便利だけど読めない
最近の文字起こしツールは本当に優秀です。Zoomの自動文字起こし、Googleドキュメントの音声入力、iPhoneの音声入力も便利ですね。精度もどんどん上がっている。MTGを録音しておけば、あとから文字で振り返れる。便利な時代になりました。
でも、実際にその文字起こしを読んでみたことがあるとわかると思います。僕は毎週複数のMTGがあって、それぞれ文字起こしが得られるのですが、あとから読み返すのは正直しんどい。「あー」「えーと」「そうですね」が延々と続き、話題があっちこっちに飛び、誰が何を言ったのか追いかけるだけで心がぽっきり折れます。
結局、文字起こしはあるけど読まない。読まないから内容を忘れる。次のMTGで「前回何を決めたんだっけ」となってしまったら、文字起こしツールを導入した意味がなくなってしまいます。
問題は「生の発話」をそのまま残していること
考えてみれば当たり前の話で、文字起こしツールは音声を忠実にテキスト化しているだけです。会話というのは本来、相槌や言い淀みが大量に含まれるもの。「うん」「そうね」「まあ」「なんか」。これらは対面で聞いている分には自然に流れていくけど、テキストになると全部残りますよね。
さらに、会話は時系列で進むので、話題が行ったり来たりする。Aの話をしていたら「そういえば」でBの話になり、またAに戻る。議事録として読むには構造化が必要なのに、生の文字起こしにはそれがない。
つまり、文字起こしと議事録は別物なんです。文字起こしは「何を話したか」の記録で、議事録は「何を決めたか」「何がわかったか」の整理といえそうです。
じゃあ議事録ツールを使えばいいじゃん
「文字起こしがダメなら、AIで議事録にまとめてくれるツールがあるじゃん」
そう思って試しました。きれいに整理された議事録が出てきました。議題と結論がセットになっていて、読みやすい!とおもったのは一瞬で、これも頭に入りませんでした。「議題」と「結論」でまとめる形式は、「〇〇について:△△に決定」の連続になります。これは確かにコンパクトで読みやすく見える。でも、少なくとも僕は読んでも頭に入りにくい...普段見ているのはチームの仲間が上手にまとめてくれているのだと思います。こうならない。
原因を考えてみました。なぜその結論になったのかがわからない。誰がどんな立場で何を主張したのかがわからない。反対意見はあったのか、どう折り合いをつけたのか。そういう「議論の流れ」が消えている。つまり、問題は時系列と発言者の立場が揮発しているということだと考えました。
議事録を読む目的は、単に「何が決まったか」を知ることだけではありません。なぜそう決まったのか、誰がどういう視点で考えていたのかを理解することで、次のアクションが見えてくる。結論だけ書かれても、その背景がわからなければ応用が効かない。
つまり、文字起こしは「情報過多で読めない」、議事録まとめは「情報が落ちすぎて頭に入らない」。僕にとってはどちらもかなり読む負担が大きく感じたのは、こういうことでした。
欲しいのは「整理されているけど流れがわかる」議事録
整理して考えると、僕が欲しかったのはこういう議事録でした。
- 相槌や言い淀みは削除されている(ノイズ除去)
- 論点ごとにグループ化されている(構造化)
- でも誰が何を言ったかは残っている(発言者保持)
- 議論の流れがわかる(時系列の要素を残す)
- 決定事項と今後の方針が明確になっている(アクション抽出)
文字起こしの「全部残す」でもなく、議事録まとめの「結論だけ」でもない。その中間が欲しかったわけです。
Claude Codeに整頓してもらう
そこでClaude Codeのカスタムコマンドを作りました。/mtg というコマンドで、文字起こしファイルを渡すと議事録形式に整頓してくれます。
やっていることはシンプルです。まず、「うん」「えーと」「あの」「まあ」といったものは読むときにノイズでしかないので消す。次に、発言を論点別にグループ化する。時系列ではなく「何について話したか」でまとめ直す。論点がそれぞれメッセージになっていればさらに流れはわかりやすくなりますね。
ここで重要なのは、発言者を残すことです。「Aさんがこう言った」「Bさんがこう返した」という構造を維持する。これがあると、議論の流れが追える。なぜその結論になったのかがわかる。これが人間が会話する際に無意識に使っているコンテキストだと思うのです。
最後に、決定事項と今後の方針を抽出してセクションにまとめる。これで、読めなかった文字起こしが読める議事録に変わります。
実際の出力フォーマット
整頓後の議事録はこんな構造になります。具体例はなかなか難しいので、生成AIに作ってもらいました。
# チームMTG 2025-12-10
## 概要
- 日時: 2025年12月10日 20:00〜21:00
- 参加者: Aさん、Bさん、Cさん
- 目的: 次回発表資料の方針決定
## 議論内容
### 1. 発表資料の構成について
**Aさん**: 前回のフィードバックを踏まえて、導入部分をもっと短くした方がいいと思う。聴衆が飽きる前に本題に入りたい。
**Bさん**: 同意。技術的な説明に時間を割きたい。導入3分、本題15分くらいのバランスがいい。
**Cさん**: であれば、背景説明はスライド1枚にまとめて、口頭で補足する形にしましょうか。
**Aさん**: それがいい。背景を知らない人向けの補足資料は別途用意すればいい。
### 2. 担当分担について
**Bさん**: スライドのデザイン、誰かやってくれる人いますか。
**Cさん**: 自分がやります。前回も担当したので慣れてる。
**Aさん**: ありがとう。じゃあ各自のパートは各自で作って、デザイン統一はCさんにお願いする形で。
## 決定事項
1. **導入部分の短縮**: 3分以内に収める(背景はスライド1枚)
2. **担当分担**: スライドデザイン統一はCさん、各パートは各自作成
## 今後の方針
- 12/15までに各自パート完成
- 12/16にCさんがデザイン統一
- 12/17にリハーサル
ポイントは「議論内容」セクションの構造です。発言者が明記されていて、誰がどういう立場で何を言ったかがわかる。でも相槌や言い淀みは消えているので読みやすい。議論の流れを追えるから、なぜ「導入3分」という結論になったのかが理解できる。
これなら次のMTG前にサッと読み返せます。そして、読んだ内容が頭に残る。
ルールブックで品質を安定させる
最初は毎回試行錯誤しながら整頓していたのですが、出力のバラつきが気になりました。文字起こしを整頓してという指示だけだと、あるときは発言者を残してくれるけど、あるときは結論だけになってしまう。フォーマットが揃わないと、読むときの認知負荷が上がってしまいますよね。
そこでルールブックを作りました。「相槌・言い淀みは削除」「発言者を太字で明記」「議論の流れがわかるように発言順序を保持」「決定事項と今後の方針を区別」といったルールを明文化して、カスタムコマンドから参照させる。これで誰が整頓しても(というかどのセッションで整頓しても)同じフォーマットの議事録が出てくるようになりました。
ルールブックには品質チェックリストも入れています。YAMLフロントマターがあるか、概要セクションがあるか、相槌が残っていないか、発言者が明記されているか。整頓後にこのリストで確認すれば、漏れを防げます。
機密情報の取り扱いには注意
ここで大事な注意点があります。生成AIサービスを使うとき全般での注意事項ですが、機密情報の扱いには注意が必要です。企業の情報は機密性が高いので、企業の内部情報、これらを外部のAIに投げるのはリスクがある。あくまで同意のもとやるのが良いと思います。MTGでどんな情報が出てくるかはやってみないとわからないですもんね。
なので、この仕組みは現段階では自社の取り組みに使っています。でもこれがめちゃくちゃ便利です。議論されても決まってないこともすぐわかる。気持ちが楽です。
気付いたこと:コンテキストとして応用性が高い
この議事録、生成AIにとってはかなり良質なコンテキストなのかもしれません。誰のどういう発言が今の流れなのか探してもらうことが容易になります。話題に出たが中断したこと、課題感なども記録として残るので、これをタスクとして抽出しなおすこともできます。
議論では賢い人はその場でどの論点に対してどういう要素があり、この議論の結論として何を生み出すかが非常に明確だなあと思います。僕はなかなかそこまでできないので、あとでしっかり生成AIに泣きつくことにしています。すると、「会議では決まったが実際には動かない」が減らせるのではないかと思うのです。
リーダーとしてはObsidianを使います。親ファイルを作成し、要約をそちらに書き、wikilinkでつなぎます。これで、会議と会議の間の時系列も把握しやすくなります。
まとめ
文字起こしツールの出力は「実際の発話記録」であり、余計な情報も多く読むのは大変です。議事録まとめツールの出力は「議題と結論」など綺麗に構造化されていますが、磨き上げられすぎていて頭に入らないこともあります。どちらも僕には読むハードルが高かったです。
欲しかったのは、相槌を削除しつつ、発言者と議論の流れを残し、決定事項を抽出した「中間的な」議事録でした。Claude Codeのカスタムコマンドでこの変換を自動化したことで、MTG後に読める議事録が手に入るようになりました。
ポイントは3つ。発言者を残して議論の流れを追えるようにすること、ルールブックでフォーマットを固定し品質を安定させること、そして生成AIに活用しやすい形を保つこと。
正直文字起こしツールや議事録まとめ、めちゃくちゃ素晴らしい物だと思います。「実際問題、単に僕が頭悪いだけでは?」とも思うのですが、もし僕と同じように読みにくいなと悩んでいる方がいらっしゃれば、ぜひこの仕組みを活用してもらえればと思います。