LoginSignup
1

More than 5 years have passed since last update.

Watson Analyticsを無料で学んでみよう② - データの確認~色々分析してみる

Last updated at Posted at 2016-12-27

何回かに分けて Watson Analytics を無料で学んでみる記事を投稿したいと思いますの第2回です。

今回の内容

第一回(http://qiita.com/shinyama/items/3477a419fef6fc085187 ) では、Watson Analyticsでの無料アカウントの作成、ログイン、少しだけ分析ツールを動かしてみる、をやってみました。

今回は、新しいデータの取り込み、確認、色々な分析を行ってみたいと思います。

<手順>

第一回の手順で、以下からWatson Analyticsにログインしてください。
https://watson.analytics.ibmcloud.com/product

「New data」をクリックします。
001.PNG

この画面で、Local fileを選択すると、自分のPC上のExcelやCSVファイルをアップロードする事もできます。
適当にお持ちのデータで試して頂いても良いですが、今回はWatson Analyticsのサンプルデータを取り込む事にします。
「Sample Data」を選択します。
002.PNG

サンプルのデータのリストから、下の方にスクロールして「Employee Performance.csv」を選択し、「Import」をクリックします。
ある仮想の会社ですが、そこの社員の労働状況を分析してみようかと思います。
003.PNG

このような、地球のようなものが回っている間はしばらく待ちます。
004.PNG

こうなればインポートは成功です。
Watson Analyticsではこの様に、分析対象のデータは全てSaaSのクラウド上にアップロードしてから分析を行います。データベースに重いSQLを投げて頑張らせるのではなく、クラウド上でメモリー上でデータを取り扱い、高速に処理するという思想です。

小さい赤枠の「...」をクリックします。
005.PNG

「Refine」を選択します。Refineは、分析の前にデータを確認し、データの事前準備を行う機能です。
006.PNG

このように、どういうデータがインポートされたかが見えるので、分析にどのようなデータが使えるか、この画面で何となくイメージしておきます。
赤枠の「>」をクリックします。
007.PNG

列が多い場合、横の列も確認できます。
008.PNG

確認は終わりで、「Refine」は閉じます。
赤枠の「^」をクリックし「Employee Performance」の「x」をクリックし閉じます。
009.PNG

先ほどの画面に戻りますので、今度は「Employee Performance」のタイルそのものをクリックします。
010.PNG

「Discover」の機能の初期画面です。データの内容をWatson Analyticsが読み取り、分析を行うスタートポイントの推奨のものが表示されていますが、ここでは一旦、下の方にスクロールします。
011.PNG

「Line」を選択します。折れ線グラフになります。
012.PNG

折れ線グラフのテンプレートが表示された画面です。
013.PNG

「JobSatisfaction」というデータがありますので、「この会社での仕事の満足度は、何の要因によって決まるのだろうか」という興味のもとに分析を進めてみたいと思います。

第1回目でやったように、下のバーから「JobRole」をx-axisに、「JobSatisfaction」をy-axisに配置します。
014.PNG

早速ですが、折れ線グラフだと分析の意図に合わないので、棒グラフに変えてみたいと思います。

赤枠の「Visualization」から「Bar」を選択します。
015.PNG

するとこの様に、使用しているデータアイテムは変わらないまま、棒グラフでの表示になります。
JobRoleの名称が全て見えているので、明らかに棒グラフの方が見やすいです。
とりあえず、左のウィンドウは閉じます。「Visualization」のアイコンを再度クリックします。
016.PNG

この様に見えます。棒グラフで何が1番満足度高いのか良くわからないので、「JobSatisfaction」順にソートしたいと思います。
017.PNG

X軸の「JobRole」の文字を右クリックし「Sortの>」を選択します。
018.PNG

「Ascending by value」を選択します。
019.PNG

以下のように「JobSatisfaction」でソートされた順になるので、「Human Resources」が最も仕事の満足度が低く、「Healthcare Representative」が最も高いことがわかります。
020.PNG

さらに別の要因も加えてみるとどうなるかと、「YearsWithCurrManager」、つまり今の上司と何年一緒か、というデータアイテムを「Color」においてみます。
結果はこの様な表示ですが、何となく年数が多い方が満足度が低いような、という印象を受けます。
021.PNG

もう少し見せ方を変えてみようと、「Visualization」から「Heatmap」を選択してみます。
022.PNG

表示がこのようになりました。
右に行くほど上司との付き合いが長く、色の濃いもの程満足度が高いのですが、右に行くほど色の薄い傾向にあるような気がします。
別の分析をするため、赤枠の「+」を選択して、別タブを開きます。
023.PNG

再度、Discoverの初期画面が表示されます。
024.PNG

赤枠のウィンドウに、「What is a predictive model for JobSatisfaction?」と自然言語で打ち込んでみます。※2016年12月現在では、日本語のサポートはまだありません。
025.PNG

するとこの様に、入力された自然言語の意図を理解して、推奨のスタートポイントが「JobSatisfaction」関連のものになります。
質問の仕方が難しい人のために、赤枠の「How to ask a question?」を選択します。
026.PNG

文書を全て打ち込むのではなく、このように質問のカテゴリや「and」「over」「by」などで区切った文節に、プルダウンでアイテムを選択する事で、質問を組み立てる事もできます。※ここでは説明だけで「Ask」は押しません。
とりあえず推奨された一覧の中から、左端の決定木分析のスタートポイントを選択します。
027.PNG

分析結果が表示されますが、良くわからないので「Decision tree」の文字を選択します。
028.PNG

このように「決定木」が表示されます。
029.PNG

マウスの真ん中のボタンを押したまま上下で、拡大・縮小ができます。
見ていくと「Attrition」=「消耗」が大きな因子になっている事がわかります。
それはもう「消耗」している部署で満足度の高いわけが無いですよね。
また「YearsSinceLastPromotion」から、前回の昇進から、1-4年の人が最も満足度高い事がわかります。
031.PNG

右に行くと「TrainingTimesLastYear」つまり去年受けたトレーニングの数が3以上の人が満足度高いです。
ちゃんと教育をしてくれると、仕事に対する満足度も上がるのですね。
032.PNG

これは残念な結果です。「YearsWithCurrentManager」が、1年以内の人は、それ以上の人と比較して、圧倒的に満足度が高い結果です。
上司と長年付き合っていると、そのうち嫌になってくる、という、会社にとってはあまりうれしくない結果ですね。
033.PNG

という様に、色々とこの会社の雰囲気がわかってきたわけですが、この画面上でもWatson Analyticsが、別の分析を推奨していますので、赤枠のグラフをクリックしてみる事にします。
034.PNG

これは、「未婚」「既婚」「離婚経験あり」で、満足度を見た結果ですが、○の大きさが変わらないので、この要素は満足度には影響は無いようです。
035.PNG

という感じに、色々な分析の推奨をしてくれるのが、思いがけない発見につながるかも知れない、Watson Analyticsの魅力の一つであると言えます。

さて、今日の分析結果を保存「Save as」します。
036.PNG

適当な名称を付けて、保存先に「Personal」を選らんで「Save」します。
037.PNG

TOP画面に戻り、「Discover」をクリックすると、赤枠のように先ほど保存した分析結果のタイルが表示されます。ここでは「Personal」つまり個人のフォルダにおいていますが、無料版のライセンスではなく、有料版であれば「Shared」つまり他の人と分析結果を共有する事ができるわけです。
038.PNG

さて、今回は以上となります。
セルフサービスBIのツールですが、自然言語解析や推奨の機能など、「Watson」という名前が付くツールの意味がある程度ご理解頂けたかと思います。
「Discover」の機能も、他にも表現を色々と変えれる機能がありますので、気の向くままに触ってみてください。

第7回目も投稿しましたら、こちらにリンクを貼りますのでご期待下さい。

第1回目(アカウント作成~基本のグラフ作成)のリンク
http://qiita.com/shinyama/items/3477a419fef6fc085187

第2回目(データの確認~色々分析してみる)のリンク
http://qiita.com/shinyama/items/6d2dc941f50cbc34b6ea

第3回目(Displayの機能を学ぶ)のリンク
http://qiita.com/shinyama/items/a08a0b555149b86d52a6

第4回目(データの精製)のリンク
http://qiita.com/shinyama/items/3196e0176d87217fe3f6

第5回目(統計解析の機能)のリンク
http://qiita.com/shinyama/items/e6f9d63e1d3405826402

第6回目(FAQ)のリンク
http://qiita.com/shinyama/items/a281ac355d1e216f894e

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1