去年に引き続き振り返っていこうと思います。
#309~#353から主に機能と開発環境に分けてピックアップしていきます。
機能
-
音量を設定できるようにする
- 地味であるが、TTSやトーン再生時の音量を調整できるようになりました
-
Add MCP Server Support for AI Integration
- まだ大きな活用事例になっていないですが、MCPサーバとして振る舞うことでスタックチャンを通じてAIエージェントとの物理的なインタラクションをできるようになるはず
-
Add M5ATOM S3 series
- 今話題のアトムニャンも対応をできるはず(筆者はケースを持っておらず
-
load preference from mod
- modアプリケーション側からも
config設定値を上書きできるようになったので、ホストから更新する手間が省けるようになりました
- modアプリケーション側からも
-
set device specific seed to robot
- 昨年のアドベントカレンダーのスタックチャンの顔色を変えてみる
から着想を得て、個体ごと固有の乱数値を持つようになったので、自分色のスタックチャンを作りやすくなりました。
- 昨年のアドベントカレンダーのスタックチャンの顔色を変えてみる
-
Add MCP Client
- より正確な応答を返せるようになります
-
ChatGPT dialogue tool support
- ChatGPTでのtool呼び出しに対応しました
-
Fix/refactor driver
- 今年一番嬉しい対応です。ESP-IDFの挙動変更により長らくDynaMixelもといRT版スタックチャンが動作していませんでしたが、この対応により動作するようになりました
開発環境
-
Migrate to ECMA 419 AudioIn
- 機能的なアップデートではないですが、ECMA 419のAPIを使うことでシミュレーター開発時にもマイクが使用できるようになり開発効率が上がりました(執筆時点ではMacOSのみ対応)
-
Migrate to biome v2
- 昨年導入したbiomeも引き続き最新を使っています
-
Update xs-dev to version 1.0.2
- 今までModdableSDKから依存しているESP-IDFがバージョンアップするとxs-devの方にPRを送って対応する手間があったので、xs-dev側から依存しているESP-IDFのバージョンを参照できるようになったので、毎回ビルドが壊れてxs-devにPRを送る儀式が不要となりました。スタックチャン駆動でModdableSDKの開発環境が改善された事例です
-
Migrate to Native API
- ModdableSDKの新しいNative APIに対応することにより、C言語実装部分の繋ぎこみ部分もTypeScriptで書けるようになり、全面的にlint対応ができるようになりました
振り返って
機能的には昨年に続きLLM周りとの連携が強化され、RT版も動作するようになり、土台はだいぶ揃ってきた感じがします。
ModdableSDKの方ではchatAudioIOというSpeech-to-Speechなモジュールも誕生したので、これを組み込むことでさらにスムーズな会話を実現できそうです。
mod開発に向けたドキュメント作成などがまだ手付かずですが、そこ超えて一気にAIを駆使して開発ができるようになれば、と思ってます。