Background
- 前回、ググッて見つけたサイトを参考にSVMをやってみた
- そのサイトは眼鏡をかけた人(眼鏡っ娘)分類システムだった
- 前回やったときは精度74%くらいだった
- もっと精度を上げてみようと思った
Summary
精度に影響しそうな条件を変えて、精度を比較してみた。
- 使った画像 (Webで集めた写りがバラバラの画像 or 手に入れた履歴書みたいに写り方が揃っている画像)
- 素性データの作り方 (元々の方法 or ちょっと変えてみた)
- カーネルの選び方 (Radius, Linear or Sigmoid)
結論
影響度の順番は、 「 画像の選び方 >> カーネルの選び方 > 素性データの作り方 」
- 元々の画像がある程度そろってないと、うまくいかないよね。
- カーネルは、よくいわれているようにはじめはRadius一択でOK。
- 今回素性データの作り方はあまり影響がなかった。でも、もっと影響があるはず。今回変えてみた方法がしょぼかったと思いたい。
つまり、「履歴書写真で眼鏡っ娘分類システム」は、精度90%
普通の画像でやるいい方法ないかなぁ、、、
Details
方法
これ
- Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
- [ググったサイトを見ながら、RでSVMをやってみた。眼鏡の人とそれ以外の分類] (http://qiita.com/nrhk/items/264b31e27d7c4ea0fa96)
結果
No. | 画像 | 素性 | カーネル | 精度(%) |
---|---|---|---|---|
1 | Webで集めた画像 約350枚 | オリジナル素性 | Radius Basis | 76.2 |
2 | Webで集めた画像 約350枚 | オリジナル素性 | Linear | 71.8 |
3 | Webで集めた画像 約350枚 | オリジナル素性 | Sigmoid | 73.6 |
4 | Webで集めた画像 約350枚 | ちょっと変えてみた素性 | Radius Basis | 75.7 |
5 | Webで集めた画像 約350枚 | ちょっと変えてみた素性 | Linear | 72.3 |
6 | Webで集めた画像 約350枚 | ちょっと変えてみた素性 | Sigmoid | 74.2 |
7 | 履歴書みたいな画像 約600枚 | オリジナル素性 | Radius Basis | 89.8 |
8 | 履歴書みたいな画像 約600枚 | オリジナル素性 | Linear | 88.2 |
9 | 履歴書みたいな画像 約600枚 | オリジナル素性 | Sigmoid | 88.2 |
10 | 履歴書みたいな画像 約600枚 | ちょっと変えてみた素性 | Radius Basis | 87.9 |
11 | 履歴書みたいな画像 約600枚 | ちょっと変えてみた素性 | Linear | 86.4 |
12 | 履歴書みたいな画像 約600枚 | ちょっと変えてみた素性 | Sigmoid | 87.3 |
分散分析
条件 | 1 | 2 | 3 |
---|---|---|---|
A (使った画像) | Webで拾ってきた画像 約350枚 | 手に入れた履歴書みたいな画像 約600枚 | - |
B(素性ベクトルの作り方) | 元々の方法 | ちょっと変えてみた方法 | - |
C(カーネルの種類) | Radius basis | Linear | Sigmoid |
- 条件A 画像の選び方は大きく精度を左右する
- 条件B 素性の作り方はあまり変わらない
- 条件C カーネルの選び方はあまり変わらない