はじめに
AzureのMachineLearningで使用している機械学習アルゴリズムを調査するついでに、他の主要クラウドサービスで提供している機械学習についても調べてみたので、機能比較としてまとめてみました。
対象クラウドサービス
以下ベンダーのクラウドサービスを対象としました。
- Microsoft
- Azure Machine Learning
- Amazon
- Machine Learning
- Prediction API
- IBM
- Bluemix(Watson)
比較内容
1.機能有無
機械学習アルゴリズムを「学習分類」と「アルゴリズム分類」のカテゴリに分類し、その観点での機能有無の比較を行いました。
| 学習分類 | アルゴリズム分類 |
|---|---|
| 教師あり学習 | 回帰 |
| 分類 | |
| 教師なし学習 | クラスタリング |
| 異常検出 | |
| 強化学習 | |
2.使用アルゴリズム種類
機械学習として使用しているアルゴリズムの種類について比較を行いました。
結果
1.機能有無
| 学習分類 | アルゴリズム分類 | Microsoft Azure Machine Learning | Amazon Machine Learning | Google Prediction API | IBM Bluemix (Watson) |
|---|---|---|---|---|---|
| 教師あり学習 | 回帰 | ○ | ○ | 非公開 | 非公開 |
| 分類 | ○ | ○ | 非公開 | 非公開 | |
| 教師なし学習 | クラスタリング | ○ | × | 非公開 | 非公開 |
| 異常検出 | ○ | × | 非公開 | 非公開 | |
| 強化学習 | × | × | 非公開 | 非公開 | |
2.使用アルゴリズム種類
- Microsoft Azure Machine Learning
- ものすごーくたくさんあります。
- どのアルゴリズムを推奨するかはどんなデータで何をしたいかに依存するので、以下のようなチートシートが用意されています。
| アルゴリズム分類 | アルゴリズム名 | |
|---|---|---|
| 回帰 | Bayesian linear Regression | |
| Boosted decision tree Regression | ||
| Decision forest Regression | ||
| Fast forest quantile Regression | ||
| Linear Regression | ||
| Neural network Regression | ||
| Ordinal Regression | ||
| Poisson Regression | ||
| 分類 | 2クラス分類 | Averaged perceptron |
| Bayes point machine | ||
| Boosted decision | ||
| Decision forest | ||
| Decision jungle | ||
| Locally deep SVM | ||
| Logistic Regression | ||
| Neural network | ||
| SVM | ||
| 多クラス分類 | Decision forest | |
| Decision jungle | ||
| Logistic regression | ||
| Neural network | ||
| One-vs-all | ||
| クラスタリング | k-means | |
| 異常検出 | One-class SVM | |
| PCA-based anomaly detection | ||
- Amazon Machine Learning
- 以下の3つと謳われています。
| アルゴリズム分類 | アルゴリズム名 | |
|---|---|---|
| 回帰 | Linear Regression | |
| 分類 | 2クラス分類 | Logistic Regression |
| 多クラス分類 | Multinomial logistic Regression | |
- Google Prediction API
- 非公開ですが、Boosting (複数のアルゴリズムで精度比較し、一番良い精度となったアルゴリズムを採用する) 方式をとっているようです。
- よって学習時は、内部では複数のアルゴリズムが走っていると推測されます。
- IBM Bluemix(Watson)
- 非公開ですが、「複数の利用可能なアルゴリズムを検討し、ニーズに合致するアルゴリズムを選択する」と謳っていることからGoogleに近い形式と思われます。
まとめ
・GoogleとIBMに関しては非公開の為、詳細な調査は出来ませんでした。
・Microsoftはものすごく沢山のアルゴリズムが用意されており、Azure Machine Learning Studioを使用すれば、色々なアルゴリズムを使用した機械学習の分析モデルの作成が可能です。
但しパラメータの内容が分かり辛いものも多いので、単に機械学習のサービスを使ってみたいだけという人にはオーバースペックかも知れません。