Posted at

主要クラウドサービス別 機械学習アルゴリズム機能比較

More than 1 year has passed since last update.


はじめに

AzureのMachineLearningで使用している機械学習アルゴリズムを調査するついでに、他の主要クラウドサービスで提供している機械学習についても調べてみたので、機能比較としてまとめてみました。


対象クラウドサービス

以下ベンダーのクラウドサービスを対象としました。


Microsoft

Azure Machine Learning

Amazon

Machine Learning

Google

Prediction API

IBM

Bluemix(Watson)


比較内容

1.機能有無

機械学習アルゴリズムを「学習分類」と「アルゴリズム分類」のカテゴリに分類し、その観点での機能有無の比較を行いました。

学習分類
アルゴリズム分類

教師あり学習
回帰

分類

教師なし学習
クラスタリング

異常検出

強化学習

2.使用アルゴリズム種類

機械学習として使用しているアルゴリズムの種類について比較を行いました。


結果

1.機能有無

学習分類
アルゴリズム分類
Microsoft Azure Machine Learning
Amazon Machine Learning
Google Prediction API
IBM Bluemix (Watson)

教師あり学習
回帰


非公開
非公開

分類


非公開
非公開

教師なし学習
クラスタリング

×
非公開
非公開

異常検出

×
非公開
非公開

強化学習
×
×
非公開
非公開

2.使用アルゴリズム種類


Microsoft Azure Machine Learning

ものすごーくたくさんあります。

アルゴリズム分類
アルゴリズム名

回帰
Bayesian linear Regression

Boosted decision tree Regression

Decision forest Regression

Fast forest quantile Regression

Linear Regression

Neural network Regression

Ordinal Regression

Poisson Regression

分類
2クラス分類
Averaged perceptron

Bayes point machine

Boosted decision

Decision forest

Decision jungle

Locally deep SVM

Logistic Regression

Neural network

SVM

多クラス分類
Decision forest

Decision jungle

Logistic regression

Neural network

One-vs-all

クラスタリング
k-means

異常検出
One-class SVM

PCA-based anomaly detection

どのアルゴリズムを推奨するかはどんなデータで何をしたいかに依存するので、以下のようなチートシートが用意されています。

日本語版チートシート





Amazon Machine Learning

以下の3つと謳われています。

アルゴリズム分類
アルゴリズム名

回帰
Linear Regression

分類
2クラス分類
Logistic Regression

多クラス分類
Multinomial logistic Regression

参考: Learning Algorithm




Google Prediction API



非公開ですが、Boosting (複数のアルゴリズムで精度比較し、一番良い精度となったアルゴリズムを採用する) 方式をとっているようです。



よって学習時は、内部では複数のアルゴリズムが走っていると推測されます。


IBM Bluemix(Watson)



非公開ですが、「複数の利用可能なアルゴリズムを検討し、ニーズに合致するアルゴリズムを選択する」と謳っていることからGoogleに近い形式と思われます。



まとめ

・GoogleとIBMに関しては非公開の為、詳細な調査は出来ませんでした。

・Microsoftはものすごく沢山のアルゴリズムが用意されており、Azure Machine Learning Studioを使用すれば、色々なアルゴリズムを使用した機械学習の分析モデルの作成が可能です。

但しパラメータの内容が分かり辛いものも多いので、単に機械学習のサービスを使ってみたいだけという人にはオーバースペックかも知れません。