概要
以下の論文で示されている
https://arxiv.org/pdf/1805.09501.pdf
AutoAugment:
Learning Augmentation Strategies from Data
AutoAugmentという技術があるが、
この技術は本当に意味があるのか?
単に沢山のケースを計算して、良い結果を選択しているだけではないのか?
という、個人の、やや素人(ただし、完全な初心者ではない)の疑問があります。
この記事は、単に、直感的な指摘のみです。
アブストラクト
https://arxiv.org/pdf/1805.09501.pdf
の概要は、以下。
Google翻訳ママ
データ拡張は、最新の画像分類器の精度を向上させる効果的な手法です。ただし、現在のデータ拡張の実装は手動で設計されています。このペーパーでは、次のような簡単な手順について説明します。
改善されたデータを自動的に検索するAutoAugment
増補方針。私たちの実装では、ポリシーが多くのサブポリシーで構成される検索スペースを設計しました。そのうちの1つは各画像に対してランダムに選択されます
各ミニバッチで。サブポリシーは2つの操作で構成され、各操作は画像処理機能です
平行移動、回転、シアリングなどの関数、および関数が適用される確率と大きさ。
検索アルゴリズムを使用して、次のような最適なポリシーを見つけます。
ニューラルネットワークは最高の検証精度をもたらします
ターゲットデータセット。私たちの方法は最先端の技術を実現します
CIFAR-10、CIFAR-100、SVHN、およびImageNetの精度
(追加データなし)。 ImageNetでトップ1を達成
精度は83.5%で、以前よりも0.4%優れています
83.1%の記録。 CIFAR-10では、次のエラー率を達成します
1.5%、これは以前の最先端技術より0.6%優れています。私たちが見つけた増強方針は、
データセット。 ImageNetで学習したポリシーは、
次のような他のデータセットで大幅な改善を実現する
Oxford Flowers、Caltech-101、Oxford-IIT Pets、FGVC Aircraft、Stanford Cars。
まとめ
単なる直感的な記事です。
AutoAugmentは、あまり、意味がないのでは?と思いました。
沢山計算して、良い結果を選んでいるだけでは?と、いま、感じました。
(何を言おうとしているか、理解頂けるか自信がありませんが。)
コメントなどあれば、お願いします。
別途、意図が示せるような検討ができれば、示します。
例えば、この技術で、実運用を伴う案件で、意味のある成果がでるのか?という疑問があります。