はじめに ✨
生成AIツールを活用した、自動運転AIチャレンジへの取り組みを不定期に連載しています。 本記事は、GoogleのNotebookLMを使った音声解説でポッドキャスト配信を行っています。
前回は、AIツールを参謀、書記、執事という「役割」に分担し、筆者が勝手ながら呼んでいる「AIツール三種の神器」を活用しながら、シミュレータをセットアップしました。🚀
Dockerコンテナを操作するコマンド、ROSコマンドなど、参謀(AIチャット)に質問をしながら、やりたいことを伝えてターミナルのコマンドに変換したり、エラーなどが発生した場合、実行を執事(AIエージェント)に任せて、トラブルシューティングを行ったりしています。
今回は、さらにAIとのコラボレーションを円滑にするため、一見すると地味ぃ~な書記(AIエディター)の活用について触れてみたいと思います。
VLM Plannerが公開 🆕
さて、最近、AIチャレンジの公式サイトのAI教材で、VLM(Vision Language Model)を使ったPlannerが公開されました。
ChatGPT5によると、VLM Plannerとは、カメラ画像(Vision)と自然言語(Language)を組み合わせて走行計画を立てる仕組みで、従来は、センサーから得た数値情報(座標、速度など)を基に経路を決めていますが、VLM Plannerは「言葉での指示」や「画像の理解」を同時に利用できるのが特徴とのことです。
「言葉での指示」ができるか気になるところです。
Markdownテキストによるメモ 📝💡
自動運転AIチャレンジでは、ターミナルでのコマンド操作を多用しますが、なかなか覚えられなかったりします。
毎回、チャットで同じ質問を繰り返すのは非効率です。ChatGPTなどAIとのやりとりは一時的なものになりがちですが、このやりとりで得たノウハウをチートシートしてまとめています。
分からない用語が出てきたとき、以前はハイパーリンクをさまようググり方が多かったのですが、最近ではChatGPTなどで、特定の用語について質問し、さらに深く聞くような使い方をしています。
こういったやりとりのメモを、AIのコンテキストに取り込みやすいよう、Markdownフォーマットのテキストで記述しています
チートシートからVS Codeへのタスク登録 ✅
このチートシートをGithub Copilotのチャット(書記)へ依頼して、VS Codeのtasks.jsonに変換し、TASK EXPLOERに登録しています。ちょっとした工夫ですが、これで作業効率が上がります。
TASK EXPLOLERは、VS CodeのExtensionで追加登録すると利用できます。
バイブコーディングと指南書作成 🌀
2年半前くらいからLLMによるコード生成を試していましたが、当時はコンテキストウインドウのサイズが小さいため、何度か分割してコードを出力させたり、不完全なコードが生成された場合、修正依頼をチャットで何度も繰り返していました。
今では、LLMの進化で、1000行程度のコードも一発生成でき、数回の簡単なチャットのやりとりでそれなりに意図を汲み取ってくれるようになりました。
AIにコーディングを委ねられるレベルに達したことが、バイブコーディングという言葉を生み出しています。
とはいえ、規模が大きな複雑なシステムを対象にした場合、AIと背景や目的、制約などシステム固有のコンテキストを共有することが重要と考えられます。
まだ試行錯誤の段階ですが、AIチャレンジでの学習を通じて、AIと人がコラボするための指南書としてノウハウを蓄積し、AIとのバイブの波長が合うようなシンクロ状態を目論んでいます。
最近出てきた、“コンテキストエンジニアリング”という概念と重なるところがあります。
YOGA for AI 🧘♂️
LLMのコンテキストウインドウを効率的に使うような指南書作成のアイデアをChatGPT5と壁打ちする中、"Y O G A for AI"というキャッチーな造語でヒントを示してくれました。AIにコンテキストの重要なところを集中させることがカギもしれません。
YOGA for AIとは…
- Y – Yield(必要な情報を選び、不要な情報は手放す ) 🧹
過去のやり取りや資料から、今のタスクに不要な要素を削除し、情報を取捨選択する。 - O – Optimize(情報配置を最適化する)🗂️
重要情報を文脈の中、効果的に並べる。 - G – Ground(重要情報を軸に据える ) 🪨
タスクの目的やゴールに直結する情報を「核」として据える。 - A – Align(文脈と目的を一致させる ) 🎯
LLMにコンテキストの「ここに注目せよ」を明示し、全ての情報をゴールに向けて揃える。
という4つのステップを踏むことで、AIを「今この瞬間に必要な情報」に集中をさせるLLM運用法である。
直観的なMarkdownエディター Obsidian 🖊️
日頃ソースコードを書いている人にとって、VS Codeは万能なエディターで、Markdownの編集にもそれほど違和感はないかもしれません。
PowerPointやのようなツールを日頃使っていると、テキストとプレビュー画面を見ながら編集するスタイルには、少し慣れが必要です。
Obsidianは編集画面が直感的で使いやすいです。
VS Codeのようにプラグインによる拡張も可能で、mermaid, GraphVizなどのプラグインを入れると、AI向きのローコンテキストなテキスト表現で、人が理解しやすいハイコンテキストなビジュアル表現が可能になります。
拡張機能でAIチャットと連携すれば、三種の神器の書記役として、強力なAIエディターとなりそうです。

さいごに 🏁
今回は、AIとコンテキストを共有しながら、共同作業するための指南書の作成について触れました
AIチャレンジからだいぶ脱線しましたが、予選の期限まで、あと2週間となってしまいました。😅
次回は、パラメータをチューニングしてコースを完走できるようにしていきます。


