Edited at

Watson Analyticsを無料で学んでみよう② - データの確認~色々分析してみる

More than 1 year has passed since last update.

何回かに分けて Watson Analytics を無料で学んでみる記事を投稿したいと思いますの第2回です。


今回の内容

第一回(http://qiita.com/shinyama/items/3477a419fef6fc085187 ) では、Watson Analyticsでの無料アカウントの作成、ログイン、少しだけ分析ツールを動かしてみる、をやってみました。

今回は、新しいデータの取り込み、確認、色々な分析を行ってみたいと思います。


<手順>

第一回の手順で、以下からWatson Analyticsにログインしてください。

https://watson.analytics.ibmcloud.com/product

「New data」をクリックします。

001.PNG

この画面で、Local fileを選択すると、自分のPC上のExcelやCSVファイルをアップロードする事もできます。

適当にお持ちのデータで試して頂いても良いですが、今回はWatson Analyticsのサンプルデータを取り込む事にします。

「Sample Data」を選択します。

002.PNG

サンプルのデータのリストから、下の方にスクロールして「Employee Performance.csv」を選択し、「Import」をクリックします。

ある仮想の会社ですが、そこの社員の労働状況を分析してみようかと思います。

003.PNG

このような、地球のようなものが回っている間はしばらく待ちます。

004.PNG

こうなればインポートは成功です。

Watson Analyticsではこの様に、分析対象のデータは全てSaaSのクラウド上にアップロードしてから分析を行います。データベースに重いSQLを投げて頑張らせるのではなく、クラウド上でメモリー上でデータを取り扱い、高速に処理するという思想です。

小さい赤枠の「...」をクリックします。

005.PNG

「Refine」を選択します。Refineは、分析の前にデータを確認し、データの事前準備を行う機能です。

006.PNG

このように、どういうデータがインポートされたかが見えるので、分析にどのようなデータが使えるか、この画面で何となくイメージしておきます。

赤枠の「>」をクリックします。

007.PNG

列が多い場合、横の列も確認できます。

008.PNG

確認は終わりで、「Refine」は閉じます。

赤枠の「^」をクリックし「Employee Performance」の「x」をクリックし閉じます。

009.PNG

先ほどの画面に戻りますので、今度は「Employee Performance」のタイルそのものをクリックします。

010.PNG

「Discover」の機能の初期画面です。データの内容をWatson Analyticsが読み取り、分析を行うスタートポイントの推奨のものが表示されていますが、ここでは一旦、下の方にスクロールします。

011.PNG

「Line」を選択します。折れ線グラフになります。

012.PNG

折れ線グラフのテンプレートが表示された画面です。

013.PNG

「JobSatisfaction」というデータがありますので、「この会社での仕事の満足度は、何の要因によって決まるのだろうか」という興味のもとに分析を進めてみたいと思います。

第1回目でやったように、下のバーから「JobRole」をx-axisに、「JobSatisfaction」をy-axisに配置します。

014.PNG

早速ですが、折れ線グラフだと分析の意図に合わないので、棒グラフに変えてみたいと思います。

赤枠の「Visualization」から「Bar」を選択します。

015.PNG

するとこの様に、使用しているデータアイテムは変わらないまま、棒グラフでの表示になります。

JobRoleの名称が全て見えているので、明らかに棒グラフの方が見やすいです。

とりあえず、左のウィンドウは閉じます。「Visualization」のアイコンを再度クリックします。

016.PNG

この様に見えます。棒グラフで何が1番満足度高いのか良くわからないので、「JobSatisfaction」順にソートしたいと思います。

017.PNG

X軸の「JobRole」の文字を右クリックし「Sortの>」を選択します。

018.PNG

「Ascending by value」を選択します。

019.PNG

以下のように「JobSatisfaction」でソートされた順になるので、「Human Resources」が最も仕事の満足度が低く、「Healthcare Representative」が最も高いことがわかります。

020.PNG

さらに別の要因も加えてみるとどうなるかと、「YearsWithCurrManager」、つまり今の上司と何年一緒か、というデータアイテムを「Color」においてみます。

結果はこの様な表示ですが、何となく年数が多い方が満足度が低いような、という印象を受けます。

021.PNG

もう少し見せ方を変えてみようと、「Visualization」から「Heatmap」を選択してみます。

022.PNG

表示がこのようになりました。

右に行くほど上司との付き合いが長く、色の濃いもの程満足度が高いのですが、右に行くほど色の薄い傾向にあるような気がします。

別の分析をするため、赤枠の「+」を選択して、別タブを開きます。

023.PNG

再度、Discoverの初期画面が表示されます。

024.PNG

赤枠のウィンドウに、「What is a predictive model for JobSatisfaction?」と自然言語で打ち込んでみます。※2016年12月現在では、日本語のサポートはまだありません。

025.PNG

するとこの様に、入力された自然言語の意図を理解して、推奨のスタートポイントが「JobSatisfaction」関連のものになります。

質問の仕方が難しい人のために、赤枠の「How to ask a question?」を選択します。

026.PNG

文書を全て打ち込むのではなく、このように質問のカテゴリや「and」「over」「by」などで区切った文節に、プルダウンでアイテムを選択する事で、質問を組み立てる事もできます。※ここでは説明だけで「Ask」は押しません。

とりあえず推奨された一覧の中から、左端の決定木分析のスタートポイントを選択します。

027.PNG

分析結果が表示されますが、良くわからないので「Decision tree」の文字を選択します。

028.PNG

このように「決定木」が表示されます。

029.PNG

マウスの真ん中のボタンを押したまま上下で、拡大・縮小ができます。

見ていくと「Attrition」=「消耗」が大きな因子になっている事がわかります。

それはもう「消耗」している部署で満足度の高いわけが無いですよね。

また「YearsSinceLastPromotion」から、前回の昇進から、1-4年の人が最も満足度高い事がわかります。

031.PNG

右に行くと「TrainingTimesLastYear」つまり去年受けたトレーニングの数が3以上の人が満足度高いです。

ちゃんと教育をしてくれると、仕事に対する満足度も上がるのですね。

032.PNG

これは残念な結果です。「YearsWithCurrentManager」が、1年以内の人は、それ以上の人と比較して、圧倒的に満足度が高い結果です。

上司と長年付き合っていると、そのうち嫌になってくる、という、会社にとってはあまりうれしくない結果ですね。

033.PNG

という様に、色々とこの会社の雰囲気がわかってきたわけですが、この画面上でもWatson Analyticsが、別の分析を推奨していますので、赤枠のグラフをクリックしてみる事にします。

034.PNG

これは、「未婚」「既婚」「離婚経験あり」で、満足度を見た結果ですが、○の大きさが変わらないので、この要素は満足度には影響は無いようです。

035.PNG

という感じに、色々な分析の推奨をしてくれるのが、思いがけない発見につながるかも知れない、Watson Analyticsの魅力の一つであると言えます。

さて、今日の分析結果を保存「Save as」します。

036.PNG

適当な名称を付けて、保存先に「Personal」を選らんで「Save」します。

037.PNG

TOP画面に戻り、「Discover」をクリックすると、赤枠のように先ほど保存した分析結果のタイルが表示されます。ここでは「Personal」つまり個人のフォルダにおいていますが、無料版のライセンスではなく、有料版であれば「Shared」つまり他の人と分析結果を共有する事ができるわけです。

038.PNG

さて、今回は以上となります。

セルフサービスBIのツールですが、自然言語解析や推奨の機能など、「Watson」という名前が付くツールの意味がある程度ご理解頂けたかと思います。

「Discover」の機能も、他にも表現を色々と変えれる機能がありますので、気の向くままに触ってみてください。

第7回目も投稿しましたら、こちらにリンクを貼りますのでご期待下さい。

第1回目(アカウント作成~基本のグラフ作成)のリンク

http://qiita.com/shinyama/items/3477a419fef6fc085187

第2回目(データの確認~色々分析してみる)のリンク

http://qiita.com/shinyama/items/6d2dc941f50cbc34b6ea

第3回目(Displayの機能を学ぶ)のリンク

http://qiita.com/shinyama/items/a08a0b555149b86d52a6

第4回目(データの精製)のリンク

http://qiita.com/shinyama/items/3196e0176d87217fe3f6

第5回目(統計解析の機能)のリンク

http://qiita.com/shinyama/items/e6f9d63e1d3405826402

第6回目(FAQ)のリンク

http://qiita.com/shinyama/items/a281ac355d1e216f894e