いつも記事を読んでいただきありがとうございます!
モブエンジニア(@mob-engineer)です!
今回は2025.02.16(日)に開催したMITOU2024 Demo Day/第31回 未踏IT人材発掘・育成事業 成果報告会へ参加しましたので、アウトプットとしてイベントレポートを執筆しました。
初学者でもサクッと読めるように平易な表現で執筆しておりますので、お気軽に読んでいただければ幸いです。
イベントページ
誤字脱字、分かりづらい表現に関しては極力なくすように心がけていますが、リアルタイムで執筆しているため、誤字脱字があるかもしれません。
なお、今回は2日目のみ現地参加したため、1日目に関しては割愛しております。
目次
- セッション
- No.11 「ユーザとモノのネットワーク体験を創作するためのARシステム」
- No.12 「家族の腸内環境を改善する排便分析デバイス」
- No.13 「バーチャル空間における飛翔体験の構築」
- No.14 「自分自身と気を交わすためのMRによる剣道稽古システムの開発」
- No.15 「ニューラル言語モデルによる個人最適な日本語入力システムの開発」
- No.16 「認知症当事者の意思決定支援のためのエージェントシステムの開発」
- No.17 「スムーズな多言語交流を実現するためのARによる会話支援システム」
- No.18 「機械学習を用いた語源的英単語分割手法の開発」
- No.19 「人工遺伝子回路設計のための統合開発環境」
- No.20 「型安全でクロスプラットフォームな次世代MLライブラリの開発」
- No.21 「Capability-Based Microkernelによるセキュアなユーザレベルメモリ管理システム」
- まとめ
セッション
No.11 「ユーザとモノのネットワーク体験を創作するためのARシステム」
プロジェクト概要
プロジェクトページ
参考サイト
- 自己紹介
- 九州大学工学部メンバーの方がチームで開発
- 開発動機
- 八百万の神を顕在化させたい
- モノにエージェント(魂)を入れて表現していく
- ポイント
- 一緒に暮らしたくなるモノのエージェントを実現
- モノ自体にはセンサーなどの加工を入れない
- アーキテクチャ概要
- モノをスキャンする
- モノの写真撮影を行う(多角的に行う)
- Image-to-Textの技術を用いてスキャンさせる
- スキャンしたデータにはアイデンティを持たせる
- モノと暮らしていく
- (個人的感想)昨日発表のデジタルペットと似ていますね
- ARを用いて視覚呈示を行っている
- 目や瞳のアニメーションにこだわった
- 会話についてはLLMを用いて実行している(OpenAIなど)
- 聞き飽きるような会話であれば処理停止としている
- 思い出をためよう
- モノが経験したことを記録、会話としてアウトプットする
- モノッコと触れ合おう
- Apple Vision Proを用いてMRAGE体験を実現可能
- 技術スタックとしてObject Trackingを利用している
- ヘッドディスプレイを用いたおさわり機能の実現
- 接触速度に応じて反応が変わっていく
- モノの別れ
- モノとの別れに関してもモノッコスコープを用いて引き継ぎ可能
- モノをスキャンする
- 広報活動
- 現在、展示活動や学内での展示活動を行っている
- まとめ(その先の未来)
- ユートピア:さわり心地の良い心通ずるモノとの共存
- ディストピア:モノを奪い合う世界線
- 今後も、モノッコを広めていく世界を実現していく
- 質問
- モノッコをプレゼントできるのか
- プレゼントは実現可能だと思う
- モノとの思い入れに関してヒトとシステムで差が発生した場合
- ヒトの感情を測定するのは難しい
- 面白い会話の評価基準は
- LLMのプロンプトを元に判断させる(LLM as a Jidge)
- ターゲット層は
- 将来的にはちいかわポジションを目指している
- ターゲットとして子どもたちを考えている
- 今後の展望に関して
- 冷蔵庫などの変化があるモノをキャッチして会話させる(IoT家電的)
- かわいいIoTを作るポイント
- 触っていいもの、どこを触ればいいのかに意味を持たせる
- モノッコをプレゼントできるのか
No.12 「家族の腸内環境を改善する排便分析デバイス」
プロジェクト概要
参考サイト
- 自己紹介
- ハードウェア担当:早稲田大学の方
- ソフトウェア担当:慶応大学の方
- プロダクト名はうんポスト
- 動機
- 開発担当者の便秘経験から
- 便秘に悩んでいる子どもは増加傾向にある
- 解決策として、うんポストを開発
- アーキテクチャ
- 便の分析
- ブリストルスケールを元に判断
- 画像を元に機械学習を実施(分類)
- Pythonを用いた分析を実施
- データセットの最適化を通じて85%の制度を実現
- 専用デバイス
- どのような形状のトイレにも対応可能
- カメラで便を撮影し、Raspberriy Pi 5を用いて分析(エッジ)
- 撮影手法に関しては特許申請中のため公開NG
- 未踏発表会場のトイレでも試している
- 結束バンド形式のため、手軽に調整可能
- アプリケーション
- かわいい腸のキャラクターを用いたモニタリング
- 情報に関しては親御さんにも共有可能
- 知り合いにキャラクターデザインを頼んでみた
- 便の分析
- 類似プロダクトの比較
- ソフト面
- 類似アプリのターゲットは個人、うんポストは家族を対象
- ゲーミフィケーション要素で家族の排便状況を確認可能
- ハード面
- NEC、Panasonicで提供している
- ターゲットが介護事業者なのでカニバらない
- ソフト面
- 信頼獲得活動
- アプリ開発に関しては医師からのアドバイスを実施
- 学会での展示発表を行っている
- 一般ユーザ向けにA/Bテストを行っているが、テスターが少ない
- 画像が外部へ流出することはないが、心理的安全性があるので
- 今後の展望
- ハードウェア・ソフトウェアの改善(小型化、精度向上など)
- 大規模なユーザテストの実施
- 病院や介護施設での実証実験
- 多くの方に利用してもらう
- Federated Learningを用いた学習
- 将来的には医学の発展に貢献する社会システムへ
- 質問
- 便を通じたコミュニケーションが出来るのでは
- フィードバックコミュニケーションは重要なのは分かる
- ゲーミフィケーションの特性は今後強化していきたい
- 今後のビジネス展望に関しては
- 正直、煮詰めらていない状況
- 腸活外来と連携してみるといいのではないか
- センシングに力を入れているが、メディカル面も強化した方がいいのではない
- モノッコとのコラボもあるかもしれない
- 介入方法として、シールマシーン(キャラクターシールの発行)も考えているが
- 便を通じたコミュニケーションが出来るのでは
No.13 「バーチャル空間における飛翔体験の構築」
プロジェクト概要
参考サイト
- 自己紹介
- 九州大学所属の方が開発
- 鳥人間コンテスト出場者の方
- 背景
- 自分の翼で飛翔したい
- ソードアートオンライン、ノーゲーム・ノーライフの世界観
- 自分の翼を持って羽ばたいてみる
- 飛翔とは
- 辞書的には:空高く飛び巡ること
- 開発視点では、翼を持っている+羽ばたいている状態
- 構造的に大胸筋を動かして羽ばたかせる
- 人間の筋肉構造でも実現出来ると思っている
- アーキテクチャ構成
- デバイス周り
- 筋肉デバイス・翼デバイス・制御デバイスで実現
- VR空間に関してはUnityを用いて実現
- センシングデバイス
- 筋電センサとIMUを用いて実装
- 背中の筋肉運動を感知して羽ばたく動作を実現している
- サーバ処理
- 羽ばたき判定:筋電データから得たタイミングを信号化させている
- ブレーキ時には力を感じるようにしている
- 現状だと、翼を用いて飛んでいる感覚はバーチャル空間でしか生かされない
- デバイス周り
- 現実世界への応用
- 翼をつけたデバイスをつけることで実現可能
- デバイス単体で独立して動くようにする
- バーチャル空間で自分の翼を動かす訓練も可能
- 通信制御に関してはMQTTで行っている
- デモ
- 翼を動かすことにコツがいる
- ダイエット効果があるかもしれない
- 使い道
- VRゲームとしての利活用
- 精神統一ツール(ダイエット効果は。。。)
- まとめ
- 翼を生やして空を飛んでみたができたので良かった
- 飛翔の習得が難しいのが良かった
- 筋トレアプリとして活用できそう
- 将来的にはVRゲームへ落とし込んでいきたい
- 質問
- 補助機能やトレーナーとの協力もあっていいと思う
- 飛んでいるときにかかる力に関しても実装しているのか
- アーキテクチャへ実装済み
- トレーニングツールとして飛翔体験を活用するのはいいのでは
- ジムなどに設置すれば、高額デバイス問題も解消できるのでは
-
関節が増えたなどの一歩上の表現がいいのではないか?
- 精神的レイヤであれば関節が増えたは適切だと考えている
- 身体的には筋トレが妥当なのかと思う
- 第三の腕のような身体拡張の考えにつながるかも
No.14 「自分自身と気を交わすためのMRによる剣道稽古システムの開発」
プロジェクト概要
#### 紹介サイト
参考サイト
- 自己紹介
- 筑波大学所属の方
- 剣道三段を保有している方、高専大会での優勝経験
- 背景
- 疲労骨折経験から本プロダクトを開発した
- コンセプトは自分との戦い
- 心から強くなりたいという意思から
- 未踏視点
- 自分と戦っていく
- 剣道の気をMRで感じていく
- 気とは何か
- ざっくり言えば発声情報
- 音声情報に着目してMRを実現
- 気特有の発声情報は複数のオーディオから取得していく
- 単一だとキャッチできない
- 実は、音声だけでなく目でのチェックも重要
- モーションキャプチャを通じて身体・動作情報を可視化
- 当初はビデオからキャプチャを取得する方式を実装していたが上手くいかなった
- VR空間上でもヌルヌル動かせている
- Meta Questを着用して稽古を行うイメージ
- オートエスノグラフィーの公開
- 成長視点:
- 自分の技を受ける側の気持ちが分かった
- 自分を律する力が向上した
- 成長視点:
- 広報活動
- SecHackイベントでデモ提供
- 約120名の方に試してもらった
- 最も多かった意見は古田モデルが怖かった
- ある種、気を表現できた
- 03/09の未踏会議で出展予定
- SecHackイベントでデモ提供
- 今後の展望
- 剣道の気の存在を感じた音源分析
- 機のデザイン
- 質疑応答
- 今後の社会実装イメージは
- 今回のプロダクト目的は自分と向き合うことなので、あくまで個人向き
- そのうえで、誰もが向き合えるような場を提供することが重要
- 社会実装のアイデアとして剣道連盟がアリなのではないか?
- 日本剣道連盟の方も協力したいと思っている
- 古田モデルを実装して変化したこと
- 自分と向き合う目的以外に気づくことが出来た
- モーションキャプチャ生成の時間について
- 3週間ほどあればモーションキャプチャデータを生成できる
- 今後の社会実装イメージは
No.15 「ニューラル言語モデルによる個人最適な日本語入力システムの開発」
プロジェクト概要
プロダクトページ
参考サイト
- 自己紹介
- 東京大学(三輪さん)と早稲田大学(高橋さん)所属の方
- プロダクト名はazookey
- 背景
- 日本語の変換精度を向上させたい
- azookeyを用いて変換精度を向上させた
- ニューラルかな漢字変換システムで実現
- ニューラルかな漢字変換システム
- 通称:zenzai
- ざっくり言えば、推論を通じてかな⇒感じに変換させる
- 高速に動作させることが課題としてある
- 投機的デコーディグ
- LLM推論高速化で用いられている技術
- 推論回数を減らすことが出来る
- 御社を志望といった文字列であれば6回⇒2回に推論回数を削減
- 個人最適化
- 従来の変換モデル、辞書の利用もある
- 変換プロンプトといったLLMを活用している
- IMEがユーザ情報を持っていないことが誤変換の原因
- 幅広い変換データを持たせることが重要
- 投機的デコーディグ
- (閑話休題)ユーザをよく知るために
- 読んだ文章まで見ることが出来ればユーザ理解出来る
- 実際、IMEが理解出来るのは書いた文章まで
- 解決策としてTunerを利用している
- Tunerを元にスコープを特定後、ファインチューニングを行ってみたが
- 動作不安定、破壊的忘却に悩まされた
- 代理チューニングを活用することで活用
- ユースケース
- 外部アプリと連携してみる(GitHubなど)
- いい感じ変換の実装
- 絵文字・顔文字などもいい感じで変換してくれる
- 各国言語への変換も可能
- オープンソース
- 開発成果に関してはオープンソースで開発済み
- α版のリリースを実施中
- ユーザコミュニティを構築済み
- コミュニティ参加者は150名以上
- データウェイトに関しても公開している
- 国内での言語研究促進を目的にしている
- 言語学会での発表も行っている
- 開発成果に関してはオープンソースで開発済み
- 今後の展望
- いい感じ変換の拡張
- 利用ユーザを広められる
- モデル大規模化
- 処理速度を向上させることが出来る
- 連合学習への活用
- 継続的なプロダクト成長
- いい感じ変換の拡張
- 質疑応答
- 著作権問題については考えているのか
- 現在はAPIをたたいて実行している
- RAGを用いて制御は出来ると思っている
- 普通変換がいい感じ変換されるリスクは
- いい感じ変換と普通変換は分かれている
- いい感じ変換の精度については
- 今後検討していく
- azookeyのTunerといい感じ変換は別機能なのか
- 別機能、そのうえで、いい感じ変換にはパーソナライズ機能は無い
- 今後の展望は
- Tunerのパーソナライズ機能を統合させたい
- 著作権問題については考えているのか
No.16 「認知症当事者の意思決定支援のためのエージェントシステムの開発」
プロジェクト概要
宮下さんサイト
参考サイト
- 自己紹介
- 北海道大学所属の方
- ヘルパー資格を持っている
- 概要
- 対話エージェントによる自立支援
- 認知症当事者がちょっと複雑だと感じる作業を支援する
- 着替えなどの支援
- デモ
- 認知症当事者が分かる表現で支援していく
- 50回以上現場に出向き、15名以上の専門職の方、10名以上の当事者とコミュニケーションを行った
- 特徴
- 軽度・中度レベルの認知症当事者向けのアプリケーション
- ヘルパーによる支援も大切だが、継続的に行うのは厳しい
- Re-MENTIAがある世界
- ヘルパーが行う支援をエージェントが行う
- 家族からの感想
- 機械に上手く受け答えしてたまにきちんと行えている
- 出来ることがあると言った発見
- 機械に上手く受け答えしてたまにきちんと行えている
- 開発
- 支援者との連絡⇒自立支援用の対話の流れ
- 支援者との連絡
- LINEを通じたヒアリングを実施
- ヒアリング内容として目的、流れ、詳細、注意点など
- LINEを通じたヒアリングを実施
- 自立支援用の対話
- 支援者から得た情報を元に自立支援マニュアルと組み合わせてデータ生成
- データを元にステートマシンを構築して、エージェントを作成
- (個人的考察)Graph形式で処理している
- 対話エージェントの利用
- 対話を通じて認知症当事者が記憶してくれる
- ちょっと複雑な作業を行いやすくなる
- 連絡エージェントの価値
- 家庭ごとに言葉が最適化される
- デイサービスをトレリハと言っているなど
- (個人的考察)方言にも対応出来そうですね
- 家庭ごとに言葉が最適化される
- 面白いユースケース
- 軽度認知症当事者がAIエージェントを通じて地図を読めるようにあった
- その経験が自信となり、同窓会への参加意欲へつながった
- 軽度認知症当事者がAIエージェントを通じて地図を読めるようにあった
- 今後の展望
- 対話エージェントによる自立支援
- 認知症が個性として認められる世界の実現
- 質疑応答
- 本システムは不登校支援にも活用できると思うが、そのあたりへの展開は考えているか
- 現時点では認知症支援を中心に考えている
- 中等度以上だと本アプリが活用できないのではない
- 現場を知りながら開発を行っているので開発者を求めている
- AIエージェントの音声について、女性・家族の声に変換できるのか
- 未踏プロジェクト当初は検討していたが、実装出来ていない状況
- 今後チャレンジしていきたいと考えている
- 本システムは不登校支援にも活用できると思うが、そのあたりへの展開は考えているか
No.17 「スムーズな多言語交流を実現するためのARによる会話支援システム」
プロジェクト概要
アプリサイト
参考サイト
- 自己紹介
- 名古屋工業大学所属の方
- 中学時代から英語、異文化交流に深く関わってきた
- 1ヶ月の短期留学がきっかけで交流しチームとして未踏チャレンジした
- 背景
- 海外旅行したら満喫したいと思うのではないか
- 観光・グルメやアクティビティ
- 本当に大切なのは現地の方との会話
- 異国の地で気づいた会話の楽しさと言語の壁
- 翻訳アプリで会話自体は出来るが、機械的になる
- 翻訳アプリベースの会話になってしまう
- 海外旅行したら満喫したいと思うのではないか
- 翻訳アプリの課題
- ユーザからの発話機会が減少してしまう
- 画面越しのコミュニケーションになってしまう
- ARグラスを用いた解決策の提示
- AR環境上でヒントを提示する
- Predic Talkの特徴
- 相手の顔を見ながら使用できる
- ユーザが知っている単語を選ぶことが出来る
- アーキテクチャ
- Bluetooth
- データの送受信の実現
- Iphone↔ARグラス間の通信を実現
- Luaスクリプト・音声・テキストを相互通信
- グラスに関しては発送が遅れたため、Mockを用いて開発
- 開発遅延無く、アプリ側を開発していった
- Bluetooth
- 特徴
- 使いやすい画面設計(UX最適化)
- 複数の予測候補からユーザが選択
- ヒントとなりうる単語を予測変換
- 複数の選択肢を示す
- ユーザが分かる範囲の単語レベルで文章生成
- ユーザに合わせて予測候補をカスタマイズする
- ユーザの話す速度に応じて予測待機時間をチューニング
- ユーザ情報を学習させることで、固有データを入れることが可能
- 複数の予測候補からユーザが選択
- 使いやすい画面設計(UX最適化)
- ユーザからのフィードバック
- 適切な単語選びが実現出来る
- 文章から一部の単語を抜き出して利用出来る
- 旅行時に使用してみたいと思った
- 将来の展望
- 海外旅行のお守りに利用
- 機内食、入国検査、移動時などのコミュニケーション
- ビジネスシーンでの利用
- 対面でのやりとりやオンライン会議でのやりとり
- アカデミックの場での利用
- 口頭発表、質疑、発表時のコミュニケーション
- 対面利用(ARグラス)とオンライン(PCアプリ)の展開を考えている
- 誰もが外国語を話せる世界の実現へ
- 海外旅行のお守りに利用
- 質疑応答
- 文章の残像時間はどのくらいか
- 詰まっている時間で消えることはない状況(数十秒程度)
- 単語表示の機能に関しても、実装可能と考えている
- 外国人に利用してもらったか
- 外国人と触れ合うことが少ないため試せていない
- ChatGPTで利用している
- 相手の話している内容理解は出来ないのか
- 開発当初は相手の話している内容も表示させることを検討した
- 視野を考えたら厳しい
- 想定利用者のレベルは
- 上級者レベル(ネイティブ)は利用不要
- 中級レベルであれば上手く活用できると思う
- 初級レベルであれば最初はとっつきづらいため、英会話教室での利用から始めるのがいい
- 多言語対応の難易度について
- 英語に類似した言語(ドイツ語など)は容易に対応可能
- 日本語、韓国語などの文字コードが違うのはチューニングが必要
- azookeyとのコラボレーションは
- 実際にazookeyの記事を参照にした
- 中級者向けであれば刺さるイメージがあると思う
- 文章の残像時間はどのくらいか
No.18 「機械学習を用いた語源的英単語分割手法の開発」
プロジェクト概要
サイトページ
参考サイト
- 概要
- 語源ネットワークを横断検索できるアプリ
- 自己紹介
- 東京大学所属の方
- 本業は冷却重元素を用いた量子センシングの研究
- 本プロダクトのもとをたどると足かけ5年
- 背景
- 語源情報を生かした単語学習
- 中級以上の単語学習であれば上手く整理できていない
- 外国語単語学習に向けていい感じで整理できるようにする
- 同言語単語をまとめていく
- 今までのやり方
- 検索単語のスペリングに語源を紐付ける
- 共通語源をグルーピングすることで意味をキャッチしやすくなる
- ざっくり言えば、グルーピングして学ぶ
- プロダクト概要
- 調べたい単語を調べると語源がグラフで表示される
- 代表的な単語(≒相関が高い)を見つけることが出来る
- 複数単語を並行して調べることが出来る
- 共通語源を特定することが出来る
- 調べたい単語を調べると語源がグラフで表示される
- 新規性技術
- 検索単語のスペリングに語源を紐付ける
- Attentionを用いた語源的単語分割
- 複数単語の共通語源を検索
- 冗長性のある語源ネットワーク構築
- 随時更新可能な階層的グラフ描画
- 検索単語のスペリングに語源を紐付ける
- Attentionを用いた語源的単語分割
- ベクトルを用いて関連度を調べる
- Closs-Attention層での学習
- 結論として高品質なデータセットが必要
- 冗長性のある語源ネットワーク構築
- データセットの品質が重要
- 表記揺れなどの名寄せ処理に重きをおいた
- 同型意義語に関してはベクトリ処理で解決
- エッジの重複率に関しても改善させることが出来た
- 随時更新可能な階層的グラフ描画
- 実装に関しては意外と難儀した
- 語源的新語生成
- ざっくり言えば、語源を組み合わせて新語生成が可能
- 評価
- ユーザ視点
- 英単語学習に役立った
- 学術視点
- 語源データベースの整理視点で学術に活用可能出来た
- ユーザ視点
- 今後の展望
- 英語以外のデータ利活用
- 語源の情報資源を用いた応用先の探索を行った
- 質疑応答
- 出現する語源のレベルが高いのではないか
- あくまでデータソースとしての利用なので一般的ではない
- ビジネス視点での利活用に関しては
- 現状考えているところ、アイデアがあればほしいところ
- 語源に興味を持ってもらえるようなプロダクトがいいのではないか
- 出現する語源のレベルが高いのではないか
No.19 「人工遺伝子回路設計のための統合開発環境」
プロジェクト概要
プロダクトページ
参考サイト
- 自己紹介
- 早稲田大学大学院の方
- 学部から6年間一緒に学び合ってきた仲間
- 人工遺伝子回路設計
- 従来モデル:
- DNAに組み込まれた調節機構
- イベントドリブンのアプリケーション
- 人工遺伝子回路モデル:
- 組み合わせることで新しい遺伝子を生成する
- ざっくり言えば、アプリをインストールするような世界
- 不妊治療のための生殖細胞カプセルなどの応用事例がある
- 将来を感じてプロダクト開発
- 従来モデル:
- 人工遺伝子回路の問題
- シミュレーションを行っているが複数アプリを行ったり来たりしている
- オペミスの可能性
- 課題解決としてアプリ開発
- 新規性は学術ではなくソフトウェア主導で推進したこと
- 特徴
- 遺伝子回路設計に必要な全ての機能を網羅
- モダンで直感的なUI
- 専門知識が無くても利用可能
- 回路エディタ
- 回路パーツをドラック and ドロップで設定可能
- 相互作用を自動で可視化できる
- 非専門家でもわかりやすいカード型にしている
- YAML形式でも設定可能
- 開発当初は実装予定はなかった。コメントを踏まえて実装
- エラー箇所の特定が容易になる
- シミュレータ
- 設計回路に基づいて微分方程式を元にシミュレーターを生成
- ジェネレータ
- 初期データを元にシミューレーションが出来るようになる
- 本プロダクトを通じて1~2日掛かっていた回路設計が2分で出来るようになった
- 専門家によるコメント
- 生命工学の視点
- 生命設計のとっかかりをつかむことが出来る
- 触りやすいデザイン
- プログラマの視点
- とてもなめらかに動くのが気持ちいい
- そこまでスペックがないPCで使えるのが嬉しい
- チュートリアルの説明力が高いため初学者の伸びしろが高い
- 生命工学の視点
- 今後の開発方向性
- 研究面
- 実験結果に基づいてシミュレーションを再実行する機能が欲しい
- 社会実装面
- 生物改変に当たるため、倫理観を持つことが重要
- ロードマップ
- MITライセンスで公開済み
- 追加機能・不具合機能含め、継続的にメンテナンス実施
- 将来像として高級言語⇒バイナリの役割をSynergeticaが担うようにしたい
- 研究面
- 質疑応答
- コスト面での利点はどうなのか
- 並列計算が行えることがバイオコンピューティングの強み
- 人工遺伝子回路設計の入り口として活用していく予定
- グラフ変換について
- 制約の弱い変換(単純なバリテーション)が通ったらグラフ生成
- その後、制約の強い変換(生命工学的なバリテーション)をチェックする
- リアルタイムでシミュレーションが出来るのは嬉しい
- 横軸(時間)はどのように捉えればいいのか
- 任意の値を取っている
- 一応、1時間単位としているが、論文でも単位がまちまち
- 10年単位で社会実装していきたいと考えている
- コスト面での利点はどうなのか
No.20 「型安全でクロスプラットフォームな次世代MLライブラリの開発」
プロジェクト概要
プロジェクトURL
参考サイト
- 自己紹介
- 埼玉大学工学部所属の方
- 背景
- 盛り上がるニューラルネットワーク
- Pythonのコード資産の上に拡張して言っている
- 動的型付け言語のPythonでは対応が難しくなっている
- 環境依存問題、実用アプリとしての保守が難しい
- 解決策として次世代管理ライブラリを開発
- Rusty Lantern
- Rustをベース推したアプリ
- 同OSに関してはWindows、Mac、Linuxなどをフォローしている
- 新しいライブラリの必要性
- 過去のライブラリ
- 単純なモデル、限られたハードウェア、少数の専門家による利用
- (個人的意見)言ってしまえば研究用
- 現在
- エンジニアリングの視点が求められる
- 研究レベルだと使い物にならない可能性がある
- 増築エラーへの対応
- 特定GPUに課金
- バージョン合わせ地獄(どのバージョンがいいのか分からない)
- 環境構築地獄(他の人の環境で動いているのに)
- ランタイムエラー地獄(タイポ問題)
- 去年のコードが動かないなど
- AI開発の本質に集中・より高みへ行くことが重要
- Rusty Lanternが面倒ごとを整理する
- 過去のライブラリ
- Rusty Lanternが目指す世界
- 自由になるための可搬性
- どのような環境であっても同じ実装で出来るようにする
- エンドユーザの触れやすさを確保
- ランタイムエラーからの脱却
- 機械学習に集中したい。そのために、静的型付けを活用する
- ライブラリが私たちを加速させるのがベター
- 開発理念
- 知能の謎を解く。未知の探索を効率化
- あくまで研究・プロトタイピングを目的としている
- 大規模訓練・大規模サーバーには向いていない
- 脳筋的開発からの脱却がAI開発のあるべき姿
- 知能の謎を解く。未知の探索を効率化
- 自由になるための可搬性
- 実装
- GPUバックエンドの抽象化
- WebGPUを利用
- Webブラウザが利用出来るのであれば利用可能
- 行列のサイズチェックが出来る方設計
- 計算互換性を型で示している
- 型推論をもとコードの見通しを良くする
- 視覚的デバッグ機能(LanternBoard)
- 行列の中身を可視化出来る
- エラー動作を可視化し見えやすくする
- モデル可視化をすることで、挙動を正しく理解出来る
- GPUバックエンドの抽象化
- まとめ
- Rusty Lanternは人間の探求能力を引き出すツール
- 3月中にOSSとして公開予定
- 今後、普及活動(アプリ開発など)を行っていく
- 質疑応答
- テスト的な利用は行っているのか
- 現在実証段階のため、テストは行えていない
- GPU的なオーバーヘッドはどうなのか
- オーバーヘッドがあるのは事実
- 初学者が入るための入り口として適切
- テスト的な利用は行っているのか
No.21 「Capability-Based Microkernelによるセキュアなユーザレベルメモリ管理システム」
プロジェクト概要
プロジェクトページ
参考サイト
- 自己紹介
- 今年の4月から慶応義塾大学へ入学
- 未踏ジュニアからのチャレンジ
- 典型的なカーネル
- Windows:NK Kernel
- Linux:Linux Kernel
- モノリシックカーネル
- カーネススペースが限定的となっている
- 拡張性に関して問題がある
- システムが拡大して行くにつれて、メンテナンスが厳しくなる
- マイクロカーネル
- マイクロサービス的に機能が分かれている
- 運用メンテナンスがめんどくさい
- マイクロカーネルの歴史
- 第1世代:CPUパフォーマンスの問題があった
- 第2世代:CPUパフォーマンスは解消されたがマイクロカーネルポリシーは残っている
- 第3世代:マイクロカーネルポリシー問題は解消された
- 今回のプロダクト
- システムコールはユーザレベルで実行
- 第3世代のマイクロカーネルを利用しているためHALとの親和性が保証されている
- カーネルスペースはケイパビリティで保護されている
- (個人的考察)鍵認証的なイメージですかね
- ざっくり言えば、個人用OSを作り込むことが出来るアプリ
- 将来展望
- アマテラスと呼ばれるユビキタスシステムの展開
- 質疑応答
- アマテラスの展開スケジュールについて
- 実装に関しては概ね完了済み
- 残りはBIND・ケイパビリティの実装だけ
- 2月頃にはLinuxでの利用が可能になる
- 実装イメージについて
- マイクロカーネルなのでドライバーに依存せず利用出来る
- (個人的考察)究極のエコシステムにつながるのではないか
- なぜ、他のカーネルと比べて高速化できるのか
- 究極的に条件分岐を削除している
- アマテラスの展開スケジュールについて
まとめ
昨年も本イベントへ参加しましたが、エンジニアとして技術視点・ビジネス視点でも多くの発見を得ることが出来ました。そのうえで、今回出たアイデアを社会実装するためのアイデア創出が私にとって出来る恩返しだと考えている、言語化して行きたいと思いました。
2025年度の未踏事業もチェックしていきたいと思いました!!
2025.03.09 未踏会議ページ