Semi-parametric Image Synthesis
semi-parametricなphotographic image synthesisをその画像のセマンティックな
レイアウト情報より出力させる手法を提案する。
提案手法はparametricとnon-parametricの強みを統合する。
そのnon-parametricな部分は学習データから得られる画像セグメントの
記憶を示す。
この記憶はテスト時にDNNが用いる素材として使われる。
DNNはそうした素材の重ね合わせの関係などを含めた自然なアラインメントを行う。
Blazingly Fast Video Object Segmentation with Pixel-Wise Metric Learning
ユーザーからobject of interest情報が与えられた場合のvideo object segmentation手法を提案する。
本論では問題をpixel wiseのsegmentationタスクで考え、
同じインスタンスに属するpixelが近傍に集まるような空間へDNNを用いて入力を写像する。
このDNNは類似度関数を学習する際に用いられるtriplet lossを修正したものを用いて学習を行う。
画像の中でアノテーションされたピクセルはreferenceとして用いられ、その近傍点を分類するために
用いられる。
このアノテーションはセグメントマスクから単純なクリックアノテーションまでをサポートできる。
Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics
多くのDNNはマルチタスクの目的関数を用いる事で性能向上を図っている。
本論では、そうしたマルチタスク学習は、タスク間の重み付けに強く依存
している事を示す。
そうした重み付けのチューニングは人手で行うには困難な作業である。
本論で提案するアプローチでは、各タスク毎に固有な不確かさが
ある事を考慮した重み付けを学習する。
この事で、各分類、回帰タスクが持つ異なったスケールの組み合わせを
同時に学習させる事を可能にする。