目次
はじめに
"基盤モデル×Robotics"のAdvent Calendarの24日目です!
今日の記事では,cvpaper.challengeのECCV2022網羅的サーベイで読んだ論文の紹介をします.
cvpaper.challengeとは?
コンピュータビジョン(CV)分野の今を映し、新しいトレンドを創り出す
研究コミュニティです.
ECCV2022網羅的サーベイとは?
CV分野のトップ国際会議ECCVを読破するチャレンジ
の2022年度版です.参加者は,読みたい論文を選び,読み終えたら論文サマリを書きます.
論文サマリ&"基盤モデル×Robotics"
タイトル | Sim-2-Sim Transfer for Vision-and-Language Navigation in Continuous Environments |
---|---|
著者 | Jacob Krantz; Stefan Lee |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/62 |
基盤モデル×Robotics | Vision-and-Language Navigation |
タイトル | Generative Meta-Adversarial Network for Unseen Object Navigation |
---|---|
著者 | Sixian Zhang; Weijie Li; Xinhang Song; Yubing Bai; Shuqiang Jiang |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/78 |
基盤モデル×Robotics | Visual Object Navigation |
タイトル | Learning from Unlabeled 3D Environments for Vision-and-Language Navigation |
---|---|
著者 | Shizhe Chen; Pierre-Louis Guhur; Makarand Tapaswi; Cordelia Schmid; Ivan Laptev |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/149 |
基盤モデル×Robotics | Vision-and-Language NavigationのためのデータセットをGPT-2を利用して自動生成 |
タイトル | Language-Grounded Indoor 3D Semantic Segmentation in the Wild |
---|---|
著者 | Dávid Rozenberszki; Or Litany; Angela Dai |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/168 |
基盤モデル×Robotics | CLIPを利用して3次元特徴を学習 |
タイトル | Extract Free Dense Labels from CLIP |
---|---|
著者 | Chong Zhou; Chen Change Loy; Bo Dai |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/187 |
基盤モデル×Robotics | CLIPを利用してSemantic Segmentation |
タイトル | Tip-Adapter: Training-Free Adaption of CLIP for Few-Shot Classification |
---|---|
著者 | Renrui Zhang; Wei Zhang; Rongyao Fang; Peng Gao; Kunchang Li; Jifeng Dai; Yu Qiao; Hongsheng Li |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/192 |
基盤モデル×Robotics | CLIPのFew-Shot分類性能を向上 |
タイトル | Learning to Detect Every Thing in an Open World |
---|---|
著者 | Kuniaki Saito; Ping Hu; Trevor Darrell; Kate Saenko |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/337 |
基盤モデル×Robotics | Open-World Instance Segmentation |
タイトル | MoDA: Map Style Transfer for Self-Supervised Domain Adaptation of Embodied Agents |
---|---|
著者 | Eun Sun Lee; Junho Kim; SangWon Park; Young Min Kim |
サマリ | http://xpaperchallenge.org/cv/survey/eccv2022_summaries/376 |
基盤モデル×Robotics | 地図ベースのVisual Navigationにおける自己教師ありドメイン適応 |
おわりに
"基盤モデル×Robotics"に興味があります.特に,「周囲の環境を理解するAIモデルへの言語モデルの組み込み」に興味があります.
ECCV2022網羅的サーベイでは,「Vision-and-Language Navigationに関する論文」や「CLIPを利用した論文」を中心に読みました.他の参加者が書いたECCV2022論文サマリは,http://xpaperchallenge.org/cv/survey/eccv2022_summaries/ から閲覧できます.