LoginSignup
27
30

More than 5 years have passed since last update.

Microsoft Azure Machine Learning をやるなら必須(?) 究極のソース付きサンプル集。Cortana Intelligence Gallery 日本語訳 その1

Last updated at Posted at 2016-11-07
Microsoft Azure Machine Learning を使うにあたり大変有用な「Cortana Intelligence Gallery」。
選択するだけでそのまま使える、サンプルデータを含めた、とても便利なテンプレートが提供されています。
大変有用なのですが、日本語訳が見つからなかったので作成します。まずは一覧ベースで。
注:更新の著しいサイトです。(2016/11/7 現在)オリジナルはこちら

image
image

流通小売・製造・銀行・ヘルスケア。各業種業態向け、揃ってます。
https://gallery.cortanaintelligence.com

使い方

リンクです。
「まず始めよう!Cortana Intelligence ギャラリーを使って統計分析・機械学習を10分で始める方法」
http://bit.ly/2fud4LS
「Cortana Intelligence ギャラリーでソリューションを共有および発見する」
http://bit.ly/2fw4k6b


ソリューションの一覧

image

リンク先は英語です。


EXPERIMENT

サイト上の実験シート(EXPERIMENT)が自分のサブスクリプションに1ボタンで展開できます。数が多いので整理・抜粋して紹介します。
※業種欄は、検索条件の「INDUSTRY」指定項目です。他業種でも流用可能と考えます。

業種 英語タイトル アルゴリズム タイトル 内容の要約
流通 Regression: Demand estimation 回帰(Boosted Decision Tree Regression) 需要予測 回帰を使用した、UCI自転車レンタルデータ需要予測。
流通 Retail Forecasting 回帰(Boosted Decision Tree Regression) 小売予測 小売業を成功に導く正確でタイムリーな予測。供給・在庫計画・製品の価格設定・プロモーション・配置
流通 Binary Classification: Customer relationship prediction 分類(Two-Class Boosted Decision Tree) カスタマー・リレーションシップ・予測 CRMに関連した分類での予測
流通 Retail Churn Template 分類(Two-Class Boosted Decision Tree) 小売顧客離れテンプレート 小売顧客離れの予測モデルを構築するための手順
流通 Binary Classification: Direct marketing 分類(Two-Class Boosted Decision Trees) ダイレクトマーケティング 顧客訪問予測
流通 Quantile Regression: Car price prediction 分位回帰※1(Fast Forest Quantile Regression) 車の価格予測 ツリーベースの変位推定器を使用した車の価格予測
流通 Frequently bought together - market basket analyses using ARULES なし Arules Rの使用例 Rスクリプト実行のためのシンプルなサンプル
流通 Demand estimation - Order Quantities 回帰(Boosted Decision Tree Regression) 需要予測 - 注文数量 販売需要予測を使用して回帰モデルを構築するためのプロセス
製造 Predictive Maintenance: Data preparation and feature engineering 分類を複数( Two-Class Logistic Regression, Two-Class Boosted Decision Tree, Two-Class Decision Forest, Two-Class Neural Network) 予知保全データの準備と機能工学 予知保全ソリューションを構築する手順。
製造 Oil Price Forecasting with STL+ETS model R forecastライブラリ STL+ETSモデルでの原油価格予測 AzureML時系列データに対しSTL分解およびETSモデルを適用する方法の実証。
金融 Online Fraud Detection 分類(Two-Class Boosted Decision Tree) オンライン不正検知 オンライン・トランザクション不正検出ソリューションの構築の手順
金融 Anomaly Detection: Credit Risk 組み合わせ 異常検出:信用リスク。 データの異常から信用リスクを予測。
金融 Binary Classfication: Credit risk prediction 分類(Two-Class Support Vector Machine,Two-Class Boosted Decision Tree) 分類:信用リスク予測 クレジット信用リスクを分類で予測
金融 Recession Prediction 分類(two-class decision forest) 不況予測 景気先行指標を用いて、景気後退を予測
金融 Online Fraud Detection: working with unbalanced class data 分類(Two-Class Boosted Decision Tree) オンライン詐欺検出 不正検出におけるアンバランスなクラスの問題に対処するための例
ヘルスケア Binary Classification: Breast cancer detection 分類(Two-Class Boosted Decision Tree) 乳癌の発見 乳癌を検出するために、分類を実行する方法
ヘルスケア Heart Disease Prediction 分類(Two-Class Boosted Decision Tree) 心臓病の予測 UCI Machine LearningリポジトリのHeart Diseaseデータセットを使用して、心臓疾患予測のモデルをトレーニングします。
ヘルスケア Heart Disease Prediction 複数(Two-Class Support Vector Machine,Two-Class Decision Jungle,Multiclass Decision Jungle) 心臓病の予測 UCI Machine LearningリポジトリのHeart Diseaseデータセットを使用して、心臓疾患予測のモデルをトレーニングします。
ヘルスケア Human Activity recognition –Posture Activity Prediction 教育済みモデル ヒューマンアクティビティ認識 姿勢関連疾患に罹患する可能性のある患者の数を予測。WebApi。
ヘルスケア Human Activity Classifier 複数(Multiclass Decision Forest,Multiclass Neural Network,Multiclass Decision Jungle 人間活動分類器 ウェアラブルセンサデータに基づいてアクティビティクラスを予測。 出典:http://groupware.les.inf.puc-rio.br/har。
ヘルスケア TechReady21: hospital readmission 複数(Two-Class Logistic Regression,Two-Class Boosted Decision Tree 病院の再入院 患者の特性と検査データに基づいて、糖尿病患者の病院再入院を予測。

※1 分位回帰
心理学変数のほとんどは正規分布するという便利な建前があるが,実態的データ,例えばネットワークサイズとか年収のようなもの,は当然偏った分布をするのであって,平均点目指して回帰する時点ですでに歪んでしまっているわけである。それを補正する可能性があるのがこの手法。
引用:分位点回帰Quantile Regressionは確かに面白い http://bit.ly/2fStGzr


一通り、実験サンプルを見てみましたが、改めて使えるサンプル集ですね。
その2では、APIの日本語訳を計画しています。編集リクエストもお気軽に!!
リンクフリーです。

27
30
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
27
30