LoginSignup
29
21

More than 5 years have passed since last update.

【スパースコーディング】スパースなデータ表現の利点

Last updated at Posted at 2016-09-14

スパースなデータ表現とは、データを表現するための辞書を用意し、その要素のできるだけ少ない組み合わせでデータを表現することをいいます。
文章で説明されてもいまいちピンとこないと思うので図で表すとこんな感じです。

visionaudio-20.png
引用元: Andrew Ng, Unsupervised Feature Learning and Deep Learning, 2015

右側のLearned basesと書いてある部分が辞書を表しています。
スパースコーディングは入力画像の一部または全体を、辞書に含まれる要素の組み合わせで表現しようというものです。
例えば下の例では表現したい画像$x$を$\phi_{36}$、$\phi_{42}$、$\phi_{63}$という3つの要素を

0.8\phi_{36} + 0.3\phi_{42} + 0.5\phi_{63}

というふうに組み合わせて$x$を近似しています。

もっとたくさんの要素を使って

0.8\phi_{36} + 0.002\phi_{40} + 0.3\phi_{42} + 0.02\phi_{58} + 0.5\phi_{63}

などとすれば近似精度は上がるかもしれませんが、スパースコーディングにおいてはあえてこれを行いません。
少数の要素を用いることで、意味のある表現を取り出すことができるからです。
スパースな表現を用いると、データを表現するにはどの要素がどの程度有用なのかをはっきりさせることができます。
例えば上の例では、$x$を表現するには$\phi_{36}$が最も有用で、次に$\phi_{63}$、$\phi_{42}$と並ぶ、といった具合です。

29
21
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
29
21