概要
お盆休みに作ったAI議事録ツールの記事が 13万view・300いいね・250ストック を突破しました!
想像以上の反響をいただき、多くの方に読んでいただけたことに感謝しています。
今回はそのツールを 正式リリース したので、
ダウンロードリンク・機能概要・改善点・今後の展望をまとめます。
- 🔗 前回の記事はこちら
- 🔗 GitHubリポジトリはこちら
🎯 想定読者
- 議事録作成の自動化に興味がある方
- AIツールや音声処理アプリの個人開発事例を知りたい方
- WhisperやGemini APIを活用したい方
- OSSとしての小規模ツール公開に関心がある方
1. はじめに
「AIで簡単にツールとかつくれるらしい。」
そんなうわさをきっかけに、お盆休みに試作した議事録ツールをQiitaに投稿しました。
ありがたいことにたくさんの方に読んでいただき、フィードバックもいただきました。
さて、ここまで読まれた理由を考えたのですが、
- 「AIでなんかツール作って。簡単なのでいいから。」と言われる人が多い
- 議事録ツールで困っている人が多い
そんな背景からこの記事が広まったのだと思います。
AIによるコーディングは簡単になっているとはいえ、それなりに知識がいるような、というのは共感いただけたのかと思います。
特にコーディングはできるけど、開発環境を整えたり、ツールを動かすまでって、実は見えない罠がたくさんあってコーディングするまでに挫折してしまう人もいるのではないでしょうか。
議事録ツールで困っている人が記事を読んでいただいても、結局すぐには試せない方も多いかと思います。
ということで今回、
折角なので試作したツールをGitHub上でリリースしてみました。
ついでにそのツールをExe化もしました。
2. ダウンロード・利用方法
今回、試作版を整理して Windows向けの実行ファイルを公開 しました。
Python環境を整えなくても試せるようになっています。
🔗 ダウンロードはこちら
⚠️ 注意
- Windows11で動作確認済み
- PyInstallerを使ってますので、ファイルサイズが大きいです(200MB超)
- 初回起動時は処理に少し時間がかかる場合があります
- Gemini APIを利用するため、APIキーの設定が必要です
3. ツール概要と機能
🎙️ 会議録音・議事録作成ツール
- PCのマイク・スピーカーから音声を録音
- Whisperによる自動文字起こし
- Gemini APIによる自動要約
- GUIで直感的に操作可能
スプラッシュ画面はChatGPTでデザインしたものです。
詳しい使い方は GitHub README をご参照ください。
4. 試作版からのアレンジの内容(改善点)
今回の主な改善点は以下の通りです:
- 🎚️ 波形表示:マイク/スピーカーを左右独立表示、録音中は赤色ハイライト
- 🎛️ 録音処理改善:スレッド化でUI応答性向上、デバイス指定の柔軟化
- 🎵 音声ミックス:pydubで自動無音パディング
- 📂 既存音声対応:録音せず要約実行できるボタンを追加
- 📝 Whisper文字起こし改善:セグメントごとの改行整形、例外ハンドリング強化
- 🧠 Gemini要約の冗長対策:失敗時も結果保持、後追い要約が可能
- 🎨 UI/UX改善:スプラッシュ画面、処理中オーバーレイ、テーマ色統一
- 🛠️ PyInstaller対応:ワンファイル配布対応、リソースパス実装
- 📜 README拡充:使い方、トラブルシュート、ライセンス追記
GitHubCopilotAgentを使って片手間でちまちまやってました。
ある程度作りたい機能がしっかりしていればバイブコーディングで十分なコードができあがります。
例外処理は人手でやると省略したくなるところも実装されますので、その点は人がやるより優秀だと思います。
ただ、徐々に機能を追加すると、既存の機能を消したりしますので、注意が必要です。
5. 開発を通じて得たこと
- Qiita記事を通じた反響が開発モチベーションになった
- OSSとして公開する際、コードの整備・ドキュメント作成が結構手間でしたが、その部分はAIが大部分をやってくれるので公開の敷居がさがったことを実感
- 実際に使ってもらえるツールを作ることの楽しさを再認識
特に2点目について、初めてツールを公開するようなときに必要なことってわからなかったりしますが、GitHubCopilotでツールを公開するときの注意点を聞けば、ライセンスの調査方法、表記、ツール公開までのチェックリストを作成してくれます。
Readmeもコードから作成してくれますので、公開に向けた作業が非常に楽になった気がします。
6. 今後の展望
今後は以下の機能追加・改善を検討中です(時期未定)
- 💻 リアルタイム書き起こし
- 🖥️ GUIの強化(タブ・設定画面追加)
フィードバックや要望があれば、ぜひ GitHub Issues へ!
7. まとめ
- Qiitaでの反響を受けて、議事録ツールを正式リリース
- Whisper × Gemini APIを活用し、音声録音・文字起こし・要約をワンストップで実現
- exeとして公開することで、誰でも試せる形になりました
商用ツールに比べると処理速度は遅い部分もありますが、
**「無料で手軽に使える」「自分でカスタマイズできる」**というOSSならではの価値を感じてもらえたら嬉しいです。
ぜひ試してみて、改善案や要望をお寄せください!
🔗 GitHubリポジトリはこちら
⭐ スターやフォークもお待ちしています!