【OSS】Siri超えを目指す? Mac操作を声だけで完結させるAIアシスタント"Echo"を自作した話
はじめに
「Hey Siri、ちょっと違うんだよな…」
「Apple Intelligenceは、うーん…」
Macを使っている皆さん、音声アシスタントにもっと柔軟な操作を求めたことはありませんか?
こんにちは!今回、そんな思いからMac専用のAIボイスアシスタント "Echo" を開発し、オープンソースとして公開しました。この記事では、Echoが目指す世界、その機能、そして背景にある技術についてご紹介します。
リポジトリはこちら(Starいただけると開発の励みになります!)
https://github.com/belcrod5/echo
Echoとは? - "隣にいるエージェント"
Echoは、デスクトップに常駐し、まるであなた専属のエージェントのようにMacの操作を代行してくれるAIアシスタントです。
Appleの思想とは少し異なり、「利便性のためなら多少のリスクは許容する」という実験的な思想で開発を進めています。
百聞は一見にしかず、まずはこちらのデモをご覧ください!
Echoの主な機能
Echoは、LLMと独自の「MCP(コンテキストプロトコル)」を連携させることで、多彩な機能を実現しています。
| ユースケース | コマンド例 | Echoの動作 |
|---|---|---|
| YouTube操作 | 「好きな曲を流して」 | ブラウザを起動し、動画を再生。広告も自動でスキップします。 |
| 天気予報 | 「今日の降水確率は?」 | 最新の天気情報を取得し、音声で回答します。 |
| Google検索 | 「日本の米騒動と最近の米不足について比較して」 | 検索結果を基に、要点をまとめてディスカッション形式で返答します。 |
| 買い物リスト管理 | 「買い物リストに牛乳と卵を追加して」 | 指定のリストにアイテムを追加。完了した項目は一括削除も可能です。 |
特に便利な利用シーン:手が離せない時こそ真価を発揮!
私自身、料理中や洗い物で手が離せない時にEchoを最も重宝しています。
手が汚れていても、MacBookに触れることなく「次のレシピに進んで」「音量を上げて」と声だけで操作できるのは、まるで "自分専用のシェフアシスタント" がいるような感覚です。
技術スタックとアーキテクチャ
本アプリは、Macネイティブの体験とWeb技術の柔軟性を両立させるために、以下の技術スタックで構成されています。
-
フロントエンド (UI):
Swift+AppKit -
バックエンド (ローカルサーバー):
Node.js -
AIモデル:
Gemini 2.5 Flash推奨(ClaudeやGPTなど、OpenRouter経由で好みのLLMに切り替え可能)
開発でハマったポイント
開発は順風満帆とはいかず、いくつかの技術的な壁にぶつかりました。
- 大部分はバイブコーディングで Cursorを使用して開発しましたが、Swift言語はLLMに指示しても指示通りにコーディングできない事が多くありました。中でも ChatGPT o3が活躍してくれました。
- ChatGPTのCursorでも苦戦する部分はChatGPTのブラウザ版のDeep Researchを使用することで解決することができました。
- MacOSのウインドウの制限など知らない事が多くあったので、私のベースの知識が足りずにLLMに指示を出す事に苦労しました。
インストール方法
インストールは簡単です。
-
GitHubの Releasesページ から最新版の
.dmgファイルをダウンロードします。 -
ダウンロードしたファイルを開き、Echo.appを
Applicationsフォルダにドラッグ&ドロップします。 -
初回起動時にAPIキーなどの必須セットアップを行なってください。
詳しい手順はリポジトリのREADMEに記載しています。
今後のロードマップとコントリビューター募集!
Echoはまだ生まれたばかりのプロジェクトです。将来的には、
-
エージェントの複数化: 特定のタスクに特化したエージェントを切り替えられるようにする。
-
UI操作の自律学習: ユーザーの画面操作を学習し、より複雑なタスクを自動化する。
といった機能を構想しています。
このプロジェクトを一緒に育ててくれるコントリビューターを心から歓迎します! 「こんな機能が欲しい」「ここを改善できる」といったIssueの起票や、Pull Requestをお待ちしています。特に good first issue ラベルがついたものは、最初の一歩としておすすめです。
まとめ
この記事では、Mac操作の未来を変える可能性を秘めたAIアシスタント「Echo」を紹介しました。 キーボードやマウスが不要になる日の第一歩として、ぜひ一度お試しいただき、未来を体験してみてください。
少しでも「面白い!」「応援したい!」と思っていただけたら、GitHubでStar ⭐ を押していただけると、開発の大きなモチベーションになります!
フィードバックや質問は、この記事のコメント欄やGitHubのIssue、X(@DaigoNet)まで、お気軽にお寄せください!
追記
GitHubリポジトリに記述ある 👇️
こちらはMacの画面キャプチャやマウス操作などを補助するMCPでEchoからMCPとして利用しています。
こちらは独立したものになりますが、EchoのMacを操作するコアのMCPになります。


