LoginSignup
0
1

More than 5 years have passed since last update.

機械学習論文読みメモ_147

Posted at

Mix-and-Match Tuning for Self-Supervised Semantic Segmentation
Semantic segmentationタスクにおいては事前学習としてCOCOやImageNetなどの大規模データセットが用いられる。
しかしこうしたデータセットのラベリングは高コストである。
そのためラベルを必要としないself-supervisedなsemantic segmentation手法が最近提案されてきている。
こうした手法はimage colorizationなどの代理タスクを用いたself-supervised学習を通して画像の特徴を
学習させる。
しかしこうしたタスクは結局、semantic segmentationタスクにとって重要な特徴を学習させる
事が未だ難しくなっている。
本論ではこの問題を解決する手法としてmix-and-match (M&M) tuningを提案する。
この手法は通常のself-supervisionタスクに簡単に組み込む事が可能である。
この手法は、targetタスクの限られたラベルとself-supervisedタスクを繋げる事で実現する。
まずmixステップでは、targetタスクのラベル付きデータからサンプリングを行い、
self-supervised学習用のデータに混ぜる事で、targetドメインの情報を入れ込む。
Matchステップでは、class内と外のdiscriminative lossを導入する事で特徴分布をtargetの
分類に即した形に正則化する。

A Closed-form Solution to Photorealistic Image Stylization
Photorealistic style transferでは、画像内のコンテンツに対して参照画像のスタイルを現実性を損なう事なく
適用するタスクを行う。
従来多くの手法が提案されてきたが、未だ空間的に一貫性のある画像の生成は難しくなっている。
本論ではこうした問題を解決できる手法を提案する。
提案手法はstylization stepとsmoothing stepに分かれる。
Stylization stepはコンテンツ画像に、スタイル画像のスタイルを適用する。
Smoothing stepでは空間的に一貫性が出るように画像を変換する。
従来手法と違い、本手法はどちらのステップも閉形式で解くことができる。

Joint 3D Proposal Generation and Object Detection from View Aggregation
新たにAggregate View Object Detection network (AVOD)を提案する。
この手法はLiDARとRGB画像を両方入力として用いるネットワーク
により特徴抽出を行う、その特徴の上にregion proposal network(RPN)及び
Second stage detectorの2つを適用する。
提案するRPNはマルチモーダルなsensor fusionをhigh resolutionな特徴空間に対して
適用できる。
これによって3D object proposalを複数の物体クラスに対して予測可能になる。
これらproposalに基づき、second stage detectorは抽出してある特徴マップと共に
より正確な3D object bounding boxを予測し、そのクラスも予測する。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1