3Dカメラを利用するシステムの設計に関してメモを書き始めた。
目的:
- 3Dカメラを用いた3D計測と画像認識の融合を推進していくこと。
- 広範な技術分野について概観して、必要な情報にたどりつくヒントを与えること。
- 3Dカメラを利用する人たちがコミュニティを作っていくのを支援すること。
想定する読者
- 3Dカメラと画像認識技術を利用するシステムの設計者
- 3Dカメラをどう選択したらよいのか選択指針を求めている人
- 3Dカメラと画像認識技術を利用するライブラリの実装者
メモを公開する理由
- 一人でできることには限界がありすぎる。
- 画像認識・機械学習・大規模言語モデル・エッジデバイスなどの広すぎる領域
- 一つの製品にも寿命がある。
製品自体と販売とサポート
SDKの寿命
対象OS:Ubuntu20はいつまで、Ubuntu24はいつから
対象言語のバージョン:python3.8はいつまで、python3.13はいつから
対象の依存ライブラリ: Pytouch, numpy, opencv などなど
そのため、ある時点でのささいなノウハウは、すぐに意味を持たなくなってしまう。 - 一つの実装には、寿命がありすぎる。
- 一つのアルゴリズムの寿命も短くなってきている。
- アルゴリズムの寿命が短い状況では、そのアルゴリズムについて日本語で書籍にまとめられることが少なくなってきている。
- そのアルゴリズムが価値を持っているうちに、それを利用し尽くすことが大事。
- ノウハウを秘匿しても得るものは少ない。
- まだ誰も攻略していない巨大なダンジョンをどこまで攻略できるのかという戦い。
- どこまでたどりつけるのかという時間との戦い。
- 秘匿する価値のあるものは少ない。
- 情報を共有し合って、もっと先に進むことこそが大事
新規のアルゴリズムが山ほどでてくるときに、優位性をどこに作るか
提案: アルゴリズムをつなぐインタフェースに優位性を作れないか
- さまざまなタスクを組合せて、実際の課題を解決する。
- そのためには、アルゴリズムのインタフェースが重要になってくる。
- こういうインタフェースでアルゴリズムを実装し、それらを組みわさせることで、価値を創り出すという部分に注力するという戦略はないでしょうか。
自分で実装する予定のないアイディアは、秘匿しておく価値がない
- 自分を含むチームで実現する予定がないアイディアは、秘匿しておいても価値がない。
- そのようなアイディアは、自分にとって有利な方法で実現してもらった方がいい。
- 日本からの進展が少ないと思っている場合には、国内のだれかに実装してもらった方がいい。
メモの公開先
注意: 検証されていない見解がほとんどです。
- 見解・仮説が検証されていません。
- 過去に正解であったアプローチが今も推奨されるアプローチであるとは限りません。
- もっといいアプローチや、もっといい実装について、メモの作者は知っていないことだらけです。