概要
Semantic Segmentationの重要な論文である
https://arxiv.org/pdf/1505.04597.pdf
U-Net: Convolutional Networks for Biomedical Image Segmentation
を読む。
Abstractを読む
Abstract原文
Abstract. There is large consent that successful training of deep networks requires many thousand annotated training samples. In this paper, we present a network and training strategy that relies on the strong use of data augmentation to use the available annotated samples more efficiently. The architecture consists of a contracting path to capture context and a symmetric expanding path that enables precise localization. We show that such a network can be trained end-to-end from very few images and outperforms the prior best method (a sliding-window convolutional network) on the ISBI challenge for segmentation of neuronal structures in electron microscopic stacks. Using the same network trained on transmitted light microscopy images (phase contrast and DIC) we won the ISBI cell tracking challenge 2015 in these categories by a large margin. Moreover, the network is fast. Segmentation of a 512x512 image takes less than a second on a recent GPU. The full implementation (based on Caffe) and the trained networks are available at http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net .
Abstract Google翻訳(未加工)
概要。ディープネットワークのトレーニングを成功させるには、数千の注釈付きトレーニングサンプルが必要であるという大きな同意があります。このペーパーでは、利用可能な注釈付きサンプルをより効率的に使用するために、データ拡張の強力な使用に依存するネットワークとトレーニング戦略を示します。アーキテクチャは、コンテキストをキャプチャする収縮パスと、正確なローカリゼーションを可能にする対称的な拡張パスで構成されています。そのようなネットワークは、非常に少数の画像からエンドツーエンドでトレーニングでき、電子顕微鏡スタックのニューロン構造のセグメンテーションに関するISBIチャレンジで、以前の最良の方法(スライディングウィンドウ畳み込みネットワーク)よりも優れていることを示します。透過光顕微鏡画像(位相差とDIC)でトレーニングされた同じネットワークを使用して、これらのカテゴリーでISBIセルトラッキングチャレンジ2015に大きなマージンで勝利しました。さらに、ネットワークは高速です。最近のGPUでは、512x512画像のセグメンテーションに1秒もかかりません。完全な実装(Caffeに基づく)およびトレーニング済みネットワークは、http://lmb.informatik.uni-freiburg.de/people/ronneber/u-netで入手できます。
今後
この論文の特徴などを追って検討します。
まとめ
コメントなどあればお願いします。