025 AI屋さんの LLMの物体認識と自動測定 GEMINI2.0
LLMが賢すぎて
従来のアプリを全部まとめて、プロンプトのみで
実現可能となっています。
例えば、測定器の読み取り程度ならば
圧倒的です。
物体認識+OCR+文章生成で
多くの測定器を 読み取ります。
このwebアプリをスマホで読み込んで
現場の写真を貼っていけば、測定完了です。
遠隔地の設備ならば、無数のカメラと端末を仕掛けて
事務所で遠隔監視、無人運転、自動測定可能です。
誰でも容易に利用でき、
アプリの雛形を作れば、プロンプトレベルで実現可能です。
繰り返しですが、全部プロンプトで実現しています。
プログラムはしていません。
イメージするなら
人間相手に言葉でお願いしておくくらいで
完成します。
助手を何十人でも使いまくって お仕事する感じです。
大規模言語モデルの物体認識っぽい 使い方として
プロンプトで 指示した物だけ検出してくれます。
例えば、下図ののように
ドクターイエロー
と指示をすると ドクターイエローだけを認識してくれます。
赤い車や、緑のたぬきも 区別してくれそうです。
もっと、日常的なシーンだと
コーヒーを飲んで
ポテトを食べて
のような、やり取りもできそうです。
まずは、日常会話のお話し相手からですね。
精度が改善すると、工業製品の画像欠陥検査装置もいけそうですかね。
目次
今回も無事に LLMのプロンプトで自動測定できそうですね。
025 AI屋さんの LLMの物体認識と自動測定 GEMINI2.0
完成です。おめでとうございます。
ー続くー