#第1章 はじめに
####学習内容
・パターン認識の流れについて
・パターン認識に用いられる特徴の種類とその性質
##1.1 パターン認識とは
広辞苑的な意味でパターン認識とは**「物事の類型を知るはたらき、およびその内容」ということになる。
これは具体的な例に落としこむとわかりやすくなる。例えば、自動販売機や券売機などにおいては、投入された紙幣や硬貨の識別がパターン認識の処理を行っている。硬貨の識別に注目すると、まず投入された硬貨の重さやサイズ、穴の有無など識別の手がかりとなる特徴を測定する。これをパターン認識の分野では特徴抽出とよぶ。これらの抽出された特徴をベクトル形にまとめたものを特徴ベクトルとよび、特徴ベクトルを用いて投入された硬貨が、10円、50円、100円500円、その他、偽物(識別不能)など、クラスとして分類される。この分類するための規則は識別規則**と呼ばれる。これらをまとめたのが以下の図である。
本書の主題となっている、特徴ベクトルを入力データとみなし、クラス分けを行うための識別規則とその学習に関してと、未知の入力データに対して識別を行うための汎化能力がパターン認識の鍵となる。
#####cf. 身近にあるパターン認識装置
自動販売機(硬貨,紙幣)、音声認識(単語,文法など)、カメラの顔画像認識など…
##1.2 特徴の型
識別に有効な特徴は大きく分けて4つに分類される。以下にそれをまとめる。
######定性的特徴
- 名義尺度:クラス名など分類のための名前。
- 順序尺度:順序関係を表し、比較はできるが、相対的、絶対的な数値としての意味はもたない。
######定量的特徴
- 間隔尺度:一定の単位で図られた尺度で相対的な数値の意味をもつ。
- 比例尺度:原点が定まっている量で、絶対的な数値の意味をもつ。
##1.3 特徴ベクトルと次元の呪い
パターン認識では特徴ベクトルを入力として識別を行う。特徴数を$d$とすると、特徴量は$d$次元空間を張る。さらにその$d$個の特徴がいくつかの階調をもって入力される場合、特徴ベクトルのもつ階調を次元に対して指数関数的に増加させた数だけの入力値が存在することになる。
例えば、$16×16=256$画素の画像データに対し、各画素に16段階のグレイスケールをもつ場合、$16^{256}$の膨大な数の数値データが存在することになる。このように空間の次元が増えるのに対応して問題の算法が指数関数的に大きくなることを次元の呪いという。
#####cf. d次元単位超立方体
$d$次元超立方体は、後章に登場する近似最近傍探索と决定木において重要な役割を果たす。
単位超立方体とは各次元に一般化した正多胞体であり、0次元で点、1次元で直線、2次元で正方形、3次元で立方体、4次元で正八胞体となる。
我々の生活している世界の物理法則では3次元単位超立方体までしか正確に図示できないが、$d$次元の単位超立方体では各頂点から$d$方向に伸びる辺の長さはすべて等しく、角も直角であると定義され、単位超立方体における面は各軸の直交する$d-1$次元超平面で構成されており、全部で$2d$個の面をもつ。つまり、3次元超立方体では6つの2次限長平面(これは立方体と面の関係と同様)、4次元超立方体では8つの3次元超平面(≒立方体)を面とした正八胞体として定義されている。また、超平面においては0次元における点や1次元における線も超平面として定義される。