Deformable Convolutional Networks
CNNはその構造のためにgeometric transformationを行う能力が低い.
本論ではその問題に対処するためにdeformable convolutionとdeformable ROI poolingを提案する.
これらの構造は,spatial samplingを行う際の適用位置に対してoffsetが学習可能な形で適応可能にする.
これによりvision taskなどにおいて効率の良い特徴抽出が可能になる.
Deep Neural Networks Do Not Recognize Negative Images
画像分類問題を始めとして,deepnetは様々な分野で成功を収めてきた.
本論ではそうしたSOTAのモデルに対してnegative images、色を反転させたような画像,に対して
性能が有意に下がる事を示した.
こうした事実は,deepnetが対象のsemanticsを学習しているというよりも,訓練データを記憶していると
考える事が妥当であると言える根拠になりえる.
またこの事より,negative sampleはsemanticsに関連したadversarial exampleになりえる.
Examining the Effects of Supervision for Transfer from Synthetic to Real
Driving Domains
従来のsemantic segmentationモデルは学習にあたって膨大なデータを必要とする.
そのためシミュレーション環境で生成されたデータを用いて大量に集めたデータによる学習
が行われるようになって来ている。
しかしそうして学習されたデータは実世界で適用した場合に低い性能になってしまう場合が一般的である.
この問題へ対処するにあたって実世界におけるデータの援用が必要になってくる.
本論では,具体的にどれくらいの実世界データがあれば,人工データでpretrainされたデータからknowledge transferが十分可能かどうかについて研究した.
結果,50枚程度の実世界画像を用いるだけど十分な性能を得る事が可能な事が判明した.