CVPR 2024で採択された論文の数が
論文数:2716件
著者数:15,288名
という状況だ。
CVPR2024の採択率は23.6%(11532件の応募から2719件採択)と、難関国際会議として知られています。
採択されたほぼ4倍の著者がいるとすると、6万人の研究者・エンジニアが応募したことになります。(実際には、複数の論文で共通の著者がいるので、減るはずです。しかし、ここでは、だいたいの数を議論したい。)
CVPRに論文を投稿しなかった画像エンジニアは、10倍どころじゃなく、圧倒的に多いはず。
仮に10倍だったとしても60万人になる。
実際には、それ以上の多くの人が画像認識・機械学習・AIの分野に関わっていることになる。
この状況では、自分たちが意味のあることを成し遂げるためには、戦い方を変えなくちゃならない。
状況の認識を協力して作ろう
まず、勝利条件の設定だ。
企業の場合
製品・サービス開発の一部としての画像認識エンジニアの場合
- 自分たちのサービスが意味があるものにすること
- 自力で開発しない内容の選定
- 自分たちがadvantageを持とうとする領域の設定
- 第三者にとって、自分たちの取り組みは何がうれしいのかを考える。
- 誰にとってもうれしくないようなものは、計画として間違っている。
- 自分たちの責任を負う範囲と手離れする条件
- いったん市場に出してしまうと、それをサポートする義務を生じる。
- そうすると、その後の事業展開を大きく束縛する。
- 作るのはいいが、試作品だけで止めておいた方がよかったということも生じうる。
企業の事業の立案者の場合
- 自分たちの事業がどういう状況にあるのか
- いま進んでいる変化が自分たちを事業をどう変えてしまうのか
- それらを本気で考え抜くこと
- その変化を自分たちが有利になるように変えていくにはどうしたらいいのか
- エンジニアに収益構造も教えて一緒に考え抜くことだ。
- 「専門バカ」とエンジニアを軽視している人は、エンジニアに「大切なことを伝えられていない人」
- 優れたエンジニアの場合には、必要な技術をそのつど習得していく。
- 優れたエンジニアの場合には、変化し続けることができる。
- 画像認識の機械学習のエンジニアは、大規模言語モデルを新しい分野で用途を切り開いていくこともできる。
- そういったことを考慮して、事業の進め方を考え抜いてほしい。
大学の研究者(特に大学院生を想定)の場合
ベンチマークを気にしすぎるな。
ほんとうに、そのベンチマークが適切とは限らないよ。
もっと広い範囲で、問題設定から考えてみよう。
大きく技術が変わるときは、問題設定からして見直さなくちゃならないことが多い。
問題の定式化とそれに関連したデータセットを作る構想力とを大事にしよう。
一人で問題を解く時代じゃなくなった。
どうチームを組織して、有益な結果を引き出すのかという時代になった。
大規模言語モデルの影響は、既存の枠組みを大きく変えてしまった。
自然言語処理・コンピュータビジョン・ロボット
これらの垣根が壊された。
その状況の中で、解くべき問題を設定し直さなくちゃならないだろう。
絶対避けたい状況
- 機械学習・AI・ロボティクスの分野で、特定の会社が圧倒的な力をもって産業を支配する。
- 代替可能な技術が提供されない。
- 有益なサービスが日本では利用できない。
- 他社と交渉する際の交渉材料となる技術が日本に存在しない。
解くべき問題はなくなっていない
- ある種の問題は、解決の見通しがついた。
- そのため、今まではずっと先送りするしかなかった問題に手を付けられる状況がやってきた。
- 僕たちは、こうあってほしいという未来を妄想する。
- こうあってほしい状況を実現するには、どういう技術が必要なのかを考える。
- 大規模言語モデルがさらによい結果を返すようになっても、**解くべき問題はなくなっていない