先日、第2回 札幌すごいAI会でLTしました。
発表資料のアップロードの依頼もあったのですが、発表資料はムービーが多数入っていたり、スライドは読ませてはダメという恩師の教えもありスライドを見ただけは分からないものになってます。そこで、発表内容を元に記事を書いてみます。1
LTでは、AIライフロガーアプリMnemnkを作ってますという紹介をさせていただいた後、
まず、そもそもライフロガーとAIがどうして関係するのという話をしました。
パーソナルなAIが来るよという話
以前から、その動きはあったのですが、5月に入って並み居るビッグテックがAIのパーソナルユースに関して言及するようになってきました。
Meta - Mark Zuckerberg 5/9
5月9日に行われたStripe Session 2025でStripeの共同創業者・プレジデントのJohn Collison氏とMeta CEOのMark Zuckerberg氏の対談が行われました。その中で、今後のAIの進展の展望について質問されたMark Zuckerberg氏はコンシューマーサイドのAIとしてパーソナルAIについて述べています。
「それは、より会話的になり、音声を重視し、よりパーソナライズされたものになるでしょう。人々は自分たちをよく理解し、フィードアルゴリズムがするように彼らを理解するシステムを望むようになると思います。 … 例えば、世界中を歩き回りながらメガネを装着していると2、AIはあなたが目にするものや耳にするものを共有し、一日中あなたと会話できるため、AIにとってメガネは理想的なフォームファクターです。なぜなら、あなたが見ているものをみて、あなたが聞いているものを聞き、1日中あなたと話をすることができるので、AIがあなたについて知ることができるからです。」
ちなみに、この発言の後のコーディングエージェントの進展とソフトウェアエンジニアの将来に関する見解(Metaの中で実際に起きていることかもしれません)も興味深いです。
OpenAI / Sam Altman 5/13
SequoiaのAI Ascentというイベントに出席したOpenAIのSam Altman氏はユーザーデータの活用が事後学習による応急処置的なものなのか、よりよいコアモデルの改善を考えているのかという質問に対して、理想としてはと前置きをしつつ次のように答えています。
「あなたが人生のすべてを注ぎ込んだ何超ものコンテキストトークンを備えた非常に小さな推論モデルであると私は考えています。そのモデルはあなたの全体的なコンテキストを横断して推論し、効率的に処理できます。あなたが人生で経験したすべての会話、読んだすべての本、読んだすべてのメール、見たすべてのもの、そして他のソースからのデータをすべて接続しています。そして、あなたの人生はコンテキストに継続的に追加され…」
超ロングコンテキストをエッジで動かすというストーリーで、この後5/21に発表されたJonathan Iveとのプロジェクトも関係するのでしょうか。
Google I/O 2025 5/21
Googleは先日行われたGoogle I/Oの中で、Personal Context、Gemini Live (Project Astraとして以前に発表されたもの)、Android XRとユーザーを取り巻く環境をAIによってサポートする方法を数多く発表しています。
現在のAIの限界
このように現在のAIは文書を書いたり、コードを書いたり、画像を生成したり、音楽を作ったり、さまざまなことができるようになってきましたが、あなたのことは知りません。
- 過去の行動を知らない - このコードを書いたときに参考にした記事なんだっけ?
- あなたの行動パターンを知らない - そろそろ月報を提出しないと
- データが散逸 - ローカルPCにしかない書類や、社内システムのデータ、あるいは社内チャット
- プライバシーが心配 - MCPは便利だけど、外部に出していいデータかどうかの判断はどうする?
プライバシーに関しては次のような調査レポートも出ていて、各社、ユーザーのデータを手に入れようと「頑張っている」様子が伺えます。
Mnemnk
個人のデータをローカルAIによって活用できるMnemnkというシステムを開発しています。
- 完全ローカル - データは外部に送信されない
- 自動記録 - アプリ使用、画面、ブラウザ履歴 etc.
- マルチエージェント - ノードベースUIで機能を組み合わせ
- オープンソース - 自由に拡張可能。Mac, Windows, Linuxで動作。
テクノロジースタック
- Rust + Tauri v2 = 高速・軽量・セキュア
- Svelte 5 + Svelte Flow
- Rig / LangChain = AIエージェントサポート
- SurrealDB
- カスタムエージェントは別プロセス = 任意の言語で実装可能
応用例
ウェブサマリー
長い英文記事を見たときに、ブラウザエクステンションからMnemnkを呼び出し、
ざっと日本語で要約しSlackへと送るデモ。
Mnemnk上で待機しているmap-reduceタイプのLLMを呼び出しを行うフローがトリガーし、長い英文記事をLocal LLMを用いて要約・翻訳し、Slackへ送ります。
ユーザーのアクティビティに反応してコメントをしてくれるAI
ライフロギングによって保存されているアクティブなアプリケーションの直近10分間のデータからユーザーのアクティビティを分析し、ChatVRMを改造したUIを用いてコメントをくれます。
さいごに
札幌すごいAI会を主催してくださいました@ykishimotoyさんをはじめ運営の皆様ありがとうございました。LTの後にもさまざまなお話を聞けて楽しかったです。第3回の開催も決まっているようですので宣伝しておきますね。
デモした内容を実際に手元で動かすための手順なども書きたかったですが、記事が長くなりすぎてしまいますので、それはまた別の記事にしたいと思います。3
-
12分のLTなのに詰め込みすぎて、かなり端折らざるを得なかったということもあり、当日話さなかった内容も。 ↩
-
ここでのメガネとはAIグラスのことでしょう。日本では未発売 https://www.meta.com/jp/ai-glasses/ ↩
-
必要なものは、上のムービー内のフローを含めて、すべて公開済みではあります。 ↩