Python
R
Azure
AzureMachineLearning
CortanaIntelligenceGallery

Microsoft Azure Machine Learning をやるなら必須(?) 究極のソース付きサンプル集。Cortana Intelligence Gallery 日本語訳 その1

More than 1 year has passed since last update.

Microsoft Azure Machine Learning を使うにあたり大変有用な「Cortana Intelligence Gallery」。

選択するだけでそのまま使える、サンプルデータを含めた、とても便利なテンプレートが提供されています。
大変有用なのですが、日本語訳が見つからなかったので作成します。まずは一覧ベースで。
注:更新の著しいサイトです。(2016/11/7 現在)オリジナルはこちら

image

image

流通小売・製造・銀行・ヘルスケア。各業種業態向け、揃ってます。

https://gallery.cortanaintelligence.com


使い方

リンクです。

「まず始めよう!Cortana Intelligence ギャラリーを使って統計分析・機械学習を10分で始める方法」

http://bit.ly/2fud4LS

「Cortana Intelligence ギャラリーでソリューションを共有および発見する」

http://bit.ly/2fw4k6b



ソリューションの一覧

image

リンク先は英語です。



EXPERIMENT

サイト上の実験シート(EXPERIMENT)が自分のサブスクリプションに1ボタンで展開できます。数が多いので整理・抜粋して紹介します。

※業種欄は、検索条件の「INDUSTRY」指定項目です。他業種でも流用可能と考えます。

業種
英語タイトル
アルゴリズム
タイトル
内容の要約

流通
Regression: Demand estimation
回帰(Boosted Decision Tree Regression)
需要予測
回帰を使用した、UCI自転車レンタルデータ需要予測。

流通
Retail Forecasting
回帰(Boosted Decision Tree Regression)
小売予測
小売業を成功に導く正確でタイムリーな予測。供給・在庫計画・製品の価格設定・プロモーション・配置

流通
Binary Classification: Customer relationship prediction
分類(Two-Class Boosted Decision Tree)
カスタマー・リレーションシップ・予測
CRMに関連した分類での予測

流通
Retail Churn Template
分類(Two-Class Boosted Decision Tree)
小売顧客離れテンプレート
小売顧客離れの予測モデルを構築するための手順

流通
Binary Classification: Direct marketing
分類(Two-Class Boosted Decision Trees)
ダイレクトマーケティング
顧客訪問予測

流通
Quantile Regression: Car price prediction
分位回帰※1(Fast Forest Quantile Regression)
車の価格予測
ツリーベースの変位推定器を使用した車の価格予測

流通
Frequently bought together - market basket analyses using ARULES
なし
Arules Rの使用例
Rスクリプト実行のためのシンプルなサンプル

流通
Demand estimation - Order Quantities
回帰(Boosted Decision Tree Regression)
需要予測 - 注文数量
販売需要予測を使用して回帰モデルを構築するためのプロセス

製造
Predictive Maintenance: Data preparation and feature engineering
分類を複数( Two-Class Logistic Regression, Two-Class Boosted Decision Tree, Two-Class Decision Forest, Two-Class Neural Network)
予知保全データの準備と機能工学
予知保全ソリューションを構築する手順。

製造
Oil Price Forecasting with STL+ETS model
R forecastライブラリ
STL+ETSモデルでの原油価格予測
AzureML時系列データに対しSTL分解およびETSモデルを適用する方法の実証。

金融
Online Fraud Detection
分類(Two-Class Boosted Decision Tree)
オンライン不正検知
オンライン・トランザクション不正検出ソリューションの構築の手順

金融
Anomaly Detection: Credit Risk
組み合わせ
異常検出:信用リスク。
データの異常から信用リスクを予測。

金融
Binary Classfication: Credit risk prediction
分類(Two-Class Support Vector Machine,Two-Class Boosted Decision Tree)
分類:信用リスク予測
クレジット信用リスクを分類で予測

金融
Recession Prediction
分類(two-class decision forest)
不況予測
景気先行指標を用いて、景気後退を予測

金融
Online Fraud Detection: working with unbalanced class data
分類(Two-Class Boosted Decision Tree)
オンライン詐欺検出
不正検出におけるアンバランスなクラスの問題に対処するための例

ヘルスケア
Binary Classification: Breast cancer detection
分類(Two-Class Boosted Decision Tree)
乳癌の発見
乳癌を検出するために、分類を実行する方法

ヘルスケア
Heart Disease Prediction
分類(Two-Class Boosted Decision Tree)
心臓病の予測
UCI Machine LearningリポジトリのHeart Diseaseデータセットを使用して、心臓疾患予測のモデルをトレーニングします。

ヘルスケア
Heart Disease Prediction
複数(Two-Class Support Vector Machine,Two-Class Decision Jungle,Multiclass Decision Jungle)
心臓病の予測
UCI Machine LearningリポジトリのHeart Diseaseデータセットを使用して、心臓疾患予測のモデルをトレーニングします。

ヘルスケア
Human Activity recognition –Posture Activity Prediction
教育済みモデル
ヒューマンアクティビティ認識
姿勢関連疾患に罹患する可能性のある患者の数を予測。WebApi。

ヘルスケア
Human Activity Classifier
複数(Multiclass Decision Forest,Multiclass Neural Network,Multiclass Decision Jungle
人間活動分類器
ウェアラブルセンサデータに基づいてアクティビティクラスを予測。 出典:http://groupware.les.inf.puc-rio.br/har。

ヘルスケア
TechReady21: hospital readmission
複数(Two-Class Logistic Regression,Two-Class Boosted Decision Tree
病院の再入院
患者の特性と検査データに基づいて、糖尿病患者の病院再入院を予測。

※1 分位回帰

心理学変数のほとんどは正規分布するという便利な建前があるが,実態的データ,例えばネットワークサイズとか年収のようなもの,は当然偏った分布をするのであって,平均点目指して回帰する時点ですでに歪んでしまっているわけである。それを補正する可能性があるのがこの手法。

引用:分位点回帰Quantile Regressionは確かに面白い http://bit.ly/2fStGzr


一通り、実験サンプルを見てみましたが、改めて使えるサンプル集ですね。

その2では、APIの日本語訳を計画しています。編集リクエストもお気軽に!!

リンクフリーです。