何回かに分けて Watson Analytics を無料で学んでみる記事を投稿したいと思いますの第5回です。
##今回の内容
第一回(http://qiita.com/shinyama/items/3477a419fef6fc085187 )では、Watson Analyticsでの無料アカウントの作成、ログイン、少しだけ分析ツールを動かしてみる、をやってみました。
第二回(http://qiita.com/shinyama/items/6d2dc941f50cbc34b6ea )では、Discoverの機能の学習を通してデータ分析を行う方法を学びました。
第三回(http://qiita.com/shinyama/items/a08a0b555149b86d52a6 )では、Displayの機能の学習を行い、見栄えの良いダッシュボードを簡単な操作で作成する方法を学びました。
第四回(http://qiita.com/shinyama/items/3196e0176d87217fe3f6 )では、Refineの機能の学習を行い、分析前のデータを色々と調整(精製)する方法を学びました。
今回は、Discoverの機能の中で、Watson Analyticsユニークな統計解析の機能を利用したSpiralチャートの使用方法を学びます。
##<手順>
第一回の手順で、以下からWatson Analyticsにログインしてください。
https://watson.analytics.ibmcloud.com/product
今回はサンプルデータである「Protect Your Customer」を使用します。
サンプルデータは、「+ New data」から取得してください。
Sample Dataを選び「Protect Your Customer.csv」をImportしてください。
データの内容としては、インターネットのサービスプロバイダーが顧客の解約を分析するためのデータとなります。
「Protect Your Customer」のデータを眺めてみます。「Refine」を起動します。
「Churn」がYesになっているのが解約してしまった顧客、Noが継続中と思われます。
解約の原因を考える時に、他の数十個のデータアイテムと順番に比較して、関連性を見ていくのは非常に大変ですよね。
それを一発でやるのが、これからご説明するSpiralチャートです。左上の赤枠で、ホームに戻ります。
「Protect Your Customer」のタイルをクリックし、Discoverを起動します。
早速それっぽい「What drives Churn?」が推奨として表示されていますが、とりあえず手順を学びたいので、下の方にスクロールします。
これが開いた画面です。
操作は非常に簡単です、「Churn」を渦巻きの中心にドラッグ&ドロップします。
しばらく、Watson Analyticsがぐるぐると考え、このような結果を表示します。
渦巻きの緑色のスポットで、中心に近いものほど、「Churn」解約と関連性の高いアイテムです。
スポットをクリックするか、「Drivers」を見て頂くとわかりますが、上から順に解約と関連の高いアイテムが並びます。
ここでは2番目の、「TotalCharges」と「InternetService」に注目して、「+」ボタンをクリックしてみます。
タブが一つ新規に開き、複数の横棒グラフが表示されました。
解約と関連性の高いとされた、「TotalCharges」は縦軸にWatson Analytics推奨の範囲に区切られて表示されています。
横軸には「InternetService」が表示されています。
一番上の棒グラフ3つは、「TotalCharges」がallの条件での、「InternetService」の違いがわかりますが、緑色の解約の多いものは、Fiber opticで、DSLやNo(それ以外ですかね)に比べて、解約が多いことがわかります。
下の方にスクロールしてみると、「TotalCharges」の区切り範囲の値が大きくなっていきます。
要するにチャージをたくさんしている人たちです。
これも一目瞭然ですが、チャージをしている人たちは解約が少ないのがわかります。
右の方にも解約に絡む他の推奨チャートが表示されているので、決定木を選択してみます。
このように分析のターゲットとなる「Churn」を置くだけで、全てのデータアイテムとの組み合わせとの相関を計算して、関連性の高いものを見出すという面倒くさい作業がWatson Analyticsでは一発でできてしまいます。
今回は以上となります。
分析を始める際のスタートポイントとして、とりあえず使ってみてあたりを付けるというのにご活用頂くと良いかと思います。
第7回目も投稿しましたら、こちらにリンクを貼りますのでご期待下さい。
第1回目(アカウント作成~基本のグラフ作成)のリンク
http://qiita.com/shinyama/items/3477a419fef6fc085187
第2回目(データの確認~色々分析してみる)のリンク
http://qiita.com/shinyama/items/6d2dc941f50cbc34b6ea
第3回目(Displayの機能を学ぶ)のリンク
http://qiita.com/shinyama/items/a08a0b555149b86d52a6
第4回目(データの精製)のリンク
http://qiita.com/shinyama/items/3196e0176d87217fe3f6
第5回目(統計解析の機能)のリンク
http://qiita.com/shinyama/items/e6f9d63e1d3405826402
第6回目(FAQ)のリンク
http://qiita.com/shinyama/items/a281ac355d1e216f894e