主要クラウドサービス別 機械学習アルゴリズム機能比較

  • 32
    Like
  • 0
    Comment

はじめに

AzureのMachineLearningで使用している機械学習アルゴリズムを調査するついでに、他の主要クラウドサービスで提供している機械学習についても調べてみたので、機能比較としてまとめてみました。

対象クラウドサービス

以下ベンダーのクラウドサービスを対象としました。

Microsoft
Azure Machine Learning
Amazon
Machine Learning
Google
Prediction API
IBM
Bluemix(Watson)

比較内容

1.機能有無
機械学習アルゴリズムを「学習分類」と「アルゴリズム分類」のカテゴリに分類し、その観点での機能有無の比較を行いました。

学習分類 アルゴリズム分類
教師あり学習 回帰
分類
教師なし学習 クラスタリング
異常検出
強化学習

2.使用アルゴリズム種類
機械学習として使用しているアルゴリズムの種類について比較を行いました。

結果

1.機能有無

学習分類 アルゴリズム分類 Microsoft Azure Machine Learning Amazon Machine Learning Google Prediction API IBM Bluemix (Watson)
教師あり学習 回帰 非公開 非公開
分類 非公開 非公開
教師なし学習 クラスタリング × 非公開 非公開
異常検出 × 非公開 非公開
強化学習 × × 非公開 非公開

2.使用アルゴリズム種類

Microsoft Azure Machine Learning
ものすごーくたくさんあります。
アルゴリズム分類 アルゴリズム名
回帰 Bayesian linear Regression
Boosted decision tree Regression
Decision forest Regression
Fast forest quantile Regression
Linear Regression
Neural network Regression
Ordinal Regression
Poisson Regression
分類 2クラス分類 Averaged perceptron
Bayes point machine
Boosted decision
Decision forest
Decision jungle
Locally deep SVM
Logistic Regression
Neural network
SVM
多クラス分類 Decision forest
Decision jungle
Logistic regression
Neural network
One-vs-all
クラスタリング k-means
異常検出 One-class SVM
PCA-based anomaly detection
どのアルゴリズムを推奨するかはどんなデータで何をしたいかに依存するので、以下のようなチートシートが用意されています。

日本語版チートシート


Amazon Machine Learning
以下の3つと謳われています。
アルゴリズム分類 アルゴリズム名
回帰 Linear Regression
分類 2クラス分類 Logistic Regression
多クラス分類 Multinomial logistic Regression

参考: Learning Algorithm


Google Prediction API

非公開ですが、Boosting (複数のアルゴリズムで精度比較し、一番良い精度となったアルゴリズムを採用する) 方式をとっているようです。

よって学習時は、内部では複数のアルゴリズムが走っていると推測されます。

IBM Bluemix(Watson)

非公開ですが、「複数の利用可能なアルゴリズムを検討し、ニーズに合致するアルゴリズムを選択する」と謳っていることからGoogleに近い形式と思われます。

まとめ

・GoogleとIBMに関しては非公開の為、詳細な調査は出来ませんでした。
・Microsoftはものすごく沢山のアルゴリズムが用意されており、Azure Machine Learning Studioを使用すれば、色々なアルゴリズムを使用した機械学習の分析モデルの作成が可能です。
但しパラメータの内容が分かり辛いものも多いので、単に機械学習のサービスを使ってみたいだけという人にはオーバースペックかも知れません。