投稿した経緯
実験計画法や品質工学の勉強をしていて、パターン認識の手法としてMT法を学んだので自分の復習した内容を投稿しようと思います。
#MT法
MT法はマハラノビス・タグチシステムのことで、マハラノビス距離と呼ばれるデータの変数間の相関を用いて導出されるマハラノビス距離によりパターン認識を行う手法となります。
上の図のように、サンプルにしたデータから単位空間を作り、マハラノビス距離を求めると点Aと点Bのような一見単位空間の距離の変わらないようなデータの識別が可能になります。
MT法への疑問
データ分析の経験が少ないため、データの各変数に相関があるという認識がなく本当にパターン認識やデータ分類ができるのか疑問に思いました。
そのためデータ分類のテストとして用いられるIrisデータの分析を行い、確認しようと考えました。
#データ分析の結果
setos種のデータ50個を単位空間にして分析したところ、残り二種を以下の閾値
$$ \sqrt{p + \frac{3 \sqrt{2 p}}{p} } $$
$p$:変数の数 4個
$$ \sqrt{4 + \frac{3 \sqrt{8}}{4} } \simeq 2.47 $$
で判別しました。
結果その他の2種のデータ100個のデータを全て判別することができました。
今後のやりたい内容
よくわかるMTシステムで読んだ内容では、MTシステムは多重共線性など数学的な条件が多いため、MT法を利用する場合は初めにT法を適用すべきと書かれている。そのため、T法や計算処理の少ないRT法でのデータ分析を行いと考えています。
参考
MT法計算方法
MTシステム (マハラノビス・タグチシステム) ~品質工学におけるパターン認識~
https://note.com/macrok/n/n93a12d88882d
田村希志臣著:「よくわかるMTシステム 品質工学によるパターン認識の新技術」,日本規格協会
閾値の決定
MT システムの研究 永田 靖
https://core.ac.uk/download/pdf/143641129.pdf