1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Are Deep Neural Networks SMARTer Than Second Graders?

Last updated at Posted at 2023-06-26

1. 概要

image.png
image.png

小学2年生でも解ける問題が、ChatGPTに代表されるような大規模モデルで解けるかを試したところ全く性能が出なかったことから、汎用性があると言われている大規模学習モデルが学習していないデータ(Out-Of-Distribution: OOD)について如何に脆弱かを課題視している論文。
ICCV2023でこのチャレンジに対してWorkshopを開催することが決定している。


2. 新規性

米国の数学オリンピック協会と協力してSMART-101(a Simple Multimodal Algorthmic Reasoning Task)データセットを作成し公開した。データセットには、6-8歳児向けの101個のパズルの課題があり、言語問題・図形問題・言語と図形の融合問題から構成されている。オリジナルの数学オリンピックの問題をベースに自動で類似問題を生成している。
また、数学的な問題の解き方を学ぶアルゴリズムを開発している。


3. 実現方法

image.png
テキストと画像の入力に対して数学的解法を学べるようメタラーニングのアーキテクチャが提案されている。ここで、ネットワーク構造はSiamese Networkではなく、それぞれ独立したフローとなっている。画像系のバックボーンには、Vision Transformers(ViTs)、ResNets、Masked Autoencoder(MAE)などを使用し、言語系のバックボーンにはBERT/GPT/GloVeなどのモデルを使用している。


4. 結果

image.png
各種バックボーンとの比較に加え、CLIPやFLAVAなどのテキストと画像をペアで学習させた大規模モデルとの比較も実施している。CLIPやMAE+BERTなどよく使われるモデルでも、実際の小学2年生(3000人)の平均スコアと比べて圧倒的に低い正答率しかないことに驚かされる。


Paper URL: https://openaccess.thecvf.com/content/CVPR2023/papers/Cherian_Are_Deep_Neural_Networks_SMARTer_Than_Second_Graders_CVPR_2023_paper.pdf

last updates: June 21 2023

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?