Microsoft Azure Machine Learning を使うにあたり大変有用な「Cortana Intelligence Gallery」。
選択するだけでそのまま使える、サンプルデータを含めた、とても便利なテンプレートが提供されています。
大変有用なのですが、日本語訳が見つからなかったので作成します。まずは一覧ベースで。
注:更新の著しいサイトです。(2016/11/7 現在)オリジナルはこちら
流通小売・製造・銀行・ヘルスケア。各業種業態向け、揃ってます。
https://gallery.cortanaintelligence.com
##使い方
リンクです。
「まず始めよう!Cortana Intelligence ギャラリーを使って統計分析・機械学習を10分で始める方法」
http://bit.ly/2fud4LS
「Cortana Intelligence ギャラリーでソリューションを共有および発見する」
http://bit.ly/2fw4k6b
リンク先は英語です。
- 自動車のテレメトリー(遠隔情報)分析
- 飛行機の予兆保全
- エネルギーの需要予測
- IT異常洞察
- Windowsのデータ・サイエンスの仮想マシン
- SQLデータウェアハウスとスパークとデータ・ウェアハウスとデータ・サイエンス
- Linuxのデータ・サイエンスの仮想マシン
- AzureのMLでストリーム解析
##EXPERIMENT
サイト上の実験シート(EXPERIMENT)が自分のサブスクリプションに1ボタンで展開できます。数が多いので整理・抜粋して紹介します。
※業種欄は、検索条件の「INDUSTRY」指定項目です。他業種でも流用可能と考えます。
業種 | 英語タイトル | アルゴリズム | タイトル | 内容の要約 |
---|---|---|---|---|
流通 | Regression: Demand estimation | 回帰(Boosted Decision Tree Regression) | 需要予測 | 回帰を使用した、UCI自転車レンタルデータ需要予測。 |
流通 | Retail Forecasting | 回帰(Boosted Decision Tree Regression) | 小売予測 | 小売業を成功に導く正確でタイムリーな予測。供給・在庫計画・製品の価格設定・プロモーション・配置 |
流通 | Binary Classification: Customer relationship prediction | 分類(Two-Class Boosted Decision Tree) | カスタマー・リレーションシップ・予測 | CRMに関連した分類での予測 |
流通 | Retail Churn Template | 分類(Two-Class Boosted Decision Tree) | 小売顧客離れテンプレート | 小売顧客離れの予測モデルを構築するための手順 |
流通 | Binary Classification: Direct marketing | 分類(Two-Class Boosted Decision Trees) | ダイレクトマーケティング | 顧客訪問予測 |
流通 | Quantile Regression: Car price prediction | 分位回帰※1(Fast Forest Quantile Regression) | 車の価格予測 | ツリーベースの変位推定器を使用した車の価格予測 |
流通 | Frequently bought together - market basket analyses using ARULES | なし | Arules Rの使用例 | Rスクリプト実行のためのシンプルなサンプル |
流通 | Demand estimation - Order Quantities | 回帰(Boosted Decision Tree Regression) | 需要予測 - 注文数量 | 販売需要予測を使用して回帰モデルを構築するためのプロセス |
製造 | Predictive Maintenance: Data preparation and feature engineering | 分類を複数( Two-Class Logistic Regression, Two-Class Boosted Decision Tree, Two-Class Decision Forest, Two-Class Neural Network) | 予知保全データの準備と機能工学 | 予知保全ソリューションを構築する手順。 |
製造 | Oil Price Forecasting with STL+ETS model | R forecastライブラリ | STL+ETSモデルでの原油価格予測 | AzureML時系列データに対しSTL分解およびETSモデルを適用する方法の実証。 |
金融 | Online Fraud Detection | 分類(Two-Class Boosted Decision Tree) | オンライン不正検知 | オンライン・トランザクション不正検出ソリューションの構築の手順 |
金融 | Anomaly Detection: Credit Risk | 組み合わせ | 異常検出:信用リスク。 | データの異常から信用リスクを予測。 |
金融 | Binary Classfication: Credit risk prediction | 分類(Two-Class Support Vector Machine,Two-Class Boosted Decision Tree) | 分類:信用リスク予測 | クレジット信用リスクを分類で予測 |
金融 | Recession Prediction | 分類(two-class decision forest) | 不況予測 | 景気先行指標を用いて、景気後退を予測 |
金融 | Online Fraud Detection: working with unbalanced class data | 分類(Two-Class Boosted Decision Tree) | オンライン詐欺検出 | 不正検出におけるアンバランスなクラスの問題に対処するための例 |
ヘルスケア | Binary Classification: Breast cancer detection | 分類(Two-Class Boosted Decision Tree) | 乳癌の発見 | 乳癌を検出するために、分類を実行する方法 |
ヘルスケア | Heart Disease Prediction | 分類(Two-Class Boosted Decision Tree) | 心臓病の予測 | UCI Machine LearningリポジトリのHeart Diseaseデータセットを使用して、心臓疾患予測のモデルをトレーニングします。 |
ヘルスケア | Heart Disease Prediction | 複数(Two-Class Support Vector Machine,Two-Class Decision Jungle,Multiclass Decision Jungle) | 心臓病の予測 | UCI Machine LearningリポジトリのHeart Diseaseデータセットを使用して、心臓疾患予測のモデルをトレーニングします。 |
ヘルスケア | Human Activity recognition –Posture Activity Prediction | 教育済みモデル | ヒューマンアクティビティ認識 | 姿勢関連疾患に罹患する可能性のある患者の数を予測。WebApi。 |
ヘルスケア | Human Activity Classifier | 複数(Multiclass Decision Forest,Multiclass Neural Network,Multiclass Decision Jungle | 人間活動分類器 | ウェアラブルセンサデータに基づいてアクティビティクラスを予測。 出典:http://groupware.les.inf.puc-rio.br/har。 |
ヘルスケア | TechReady21: hospital readmission | 複数(Two-Class Logistic Regression,Two-Class Boosted Decision Tree | 病院の再入院 | 患者の特性と検査データに基づいて、糖尿病患者の病院再入院を予測。 |
※1 分位回帰
心理学変数のほとんどは正規分布するという便利な建前があるが,実態的データ,例えばネットワークサイズとか年収のようなもの,は当然偏った分布をするのであって,平均点目指して回帰する時点ですでに歪んでしまっているわけである。それを補正する可能性があるのがこの手法。
引用:分位点回帰Quantile Regressionは確かに面白い http://bit.ly/2fStGzr
一通り、実験サンプルを見てみましたが、改めて使えるサンプル集ですね。
その2では、APIの日本語訳を計画しています。編集リクエストもお気軽に!!
リンクフリーです。