2
Help us understand the problem. What are the problem?

posted at

updated at

IBM Cloud Pak for Data as a Service ハンズオン資料 3.分析編-A:ダッシュボードで新型コロナの新規陽性者変遷を見る

Cloud Pak for Data as a Serviceハンズオンメニュー一覧

新型コロナウイルスの新規陽性者数のデータソース

このページにてグラフ化したいデータソースは、厚生労働省のオープンデータに掲載されているこちらのデータソースです。
スクリーンショット 2021-10-04 17.26.24.png

前提事項

  • 同じIDですべての操作を行いますが、
    • 前半はデータ整備人の立場での操作です。
    • 後半はデータ利用者としての操作です。
  • 今回は2021年10月4日時点のデータを使用しています。

データカタログ上での操作

データソースをデータカタログに追加(データ整備人として)

  • まず最初にデータ整備人の立場として、外部データへの接続情報をカタログに登録しておきます。(データ利用者に幅広く利用してもらえるように)

  • 「カタログに追加」から「接続」を選択
    スクリーンショット 2021-10-04 17.30.43.png


  • 「接続の追加」から「HTTP」を選んで「選択」ボタンをクリック。 image.png

  • 名前や説明を入力して、URL欄に先程のCSVのURLを入力。
  • 念の為、接続されているかを確認するために、「接続のテスト」をクリック。 スクリーンショット 2021-10-04 17.37.51.png

  • テスト正常終了を確認し、「作成」をクリック。 スクリーンショット 2021-10-04 17.38.45.png

データ接続情報をプロジェクトに追加する。(データ利用者として)

  • 次に、データ利用者の立場として、カタログ上で見つけたデータ接続情報を個別のプロジェクトにコピーします。
  • カタログ上でデータ接続情報をクリック。 スクリーンショット 2021-10-04 17.45.48.png

  • プロジェクトに追加、をクリック。 スクリーンショット 2021-10-04 17.51.46.png

  • 移動先のプロジェクトを選択し、「追加」をクリック。 スクリーンショット 2021-10-04 17.52.24.png

  • 移動された旨のメッセージが出るので、「プロジェクトに移動」をクリック。(当該メッセージが消えてしまったら、手動で当該プロジェクトまで移動してみてください。) スクリーンショット 2021-10-04 17.53.07.png

プロジェクト上での操作(データ利用者として)

  • プロジェクト上に追加された接続情報を利用して、その先にあるデータ資産をプロジェクトに追加します。

  • プロジェクトで接続情報がある事を確認し、「プロジェクトに追加」をクリック。
    スクリーンショット 2021-10-04 17.55.28.png


  • 「接続データ」を選択。 スクリーンショット 2021-10-04 17.55.59.png

  • 画面遷移後、「ソースの選択」をクリック。 スクリーンショット 2021-10-04 18.45.03.png

  •  「接続」をクリックした後、先程の「接続」の項目をクリックし、その先のcsvファイルを選んで「選択」をクリックする。 スクリーンショット 2021-10-04 18.48.17.png

  • データソースが追加されたことを確認して、名前と(あれば)説明を入力して「作成」ボタンをクリックする。 スクリーンショット 2021-10-04 18.51.33.png

  • プロジェクトにデータ資産が登録されました。データ資産をクリックします。 スクリーンショット 2021-10-04 18.59.16.png

データ整形ジョブで、データの型を変更する。

  • 過去の先人の経験から、このデータのDate列が実は文字列型なので正しく時系列にならないことがわかっているので、データの変換処理を行います。「整形」ボタンをクリックします。 スクリーンショット 2021-10-04 19.01.08.png

  • データ整形(Data Refinery)処理が起動するまで数十秒お待ち下さい。起動し終わったら、「操作」ボタンをクリックします。 スクリーンショット 2021-10-04 19.03.00.png

  • 画面左側の「列タイプの変換」をクリックします。 スクリーンショット 2021-10-04 19.03.54.png

  • 画面左側の「列の選択」ボタンをクリックします。 スクリーンショット 2021-10-04 19.05.28.png

  • 「列」の箇所で「Date」列が選択されており、そのタイプとして右側に「String」型であることがわかります。「String」と表示されているドロップダウンリストをクリックします。 スクリーンショット 2021-10-04 19.18.42.png

  • リストの中から「Date」型を選択してクリックします。 スクリーンショット 2021-10-04 19.19.04.png

  • 続いて表示される「フォーマットの選択」のドロップダウンリストをクリックします。 スクリーンショット 2021-10-04 19.20.37.png

  • 今回は「ymd」を選択します。 スクリーンショット 2021-10-04 19.21.08.png

  • 適用」をクリックします。 スクリーンショット 2021-10-04 19.21.29.png

  • 画面右側の「ステップ」の箇所に元々表示されていた「列タイプの変換」は、ゴミ箱アイコンをクリックして、無効にしておきます。
  • そして出来あがりのデータのフォーマット等を確認するため、画面右側の「編集」のボタンをクリックします。 スクリーンショット 2021-10-04 19.23.14.png

  • 「出力の編集」をクリックします。 スクリーンショット 2021-10-04 19.26.33.png

  • ロケーション、データセット名、説明を必要であれば修正します。終わったらチェックボタンをクリックします。
  • (ファイルフォーマットはcsv、エンコードはUTF-8のままにしてください。) スクリーンショット 2021-10-04 19.27.44.png

  • 完了ボタンをクリックします。 スクリーンショット 2021-10-04 19.28.46.png

  • データ修正内容が固まったので、画面右上の「ジョブを保存して作成」をクリックします。 スクリーンショット 2021-10-04 19.29.36.png

  • データ修正を実行するジョブを作成して行きます。ジョブ名および説明を入力して「次へ」をクリックします。 スクリーンショット 2021-10-04 19.30.28.png

  • 「構成」については表示されたままで「次へ」をクリックします。 スクリーンショット 2021-10-04 19.31.35.png

  • スケジュールについては今回は設定せずに「次へ」をクリックします。 スクリーンショット 2021-10-04 19.32.06.png

  • 「通知」については、当初はOFF状態なのですが、ジョブが終わる情報がすぐわかるので、今回はONにして「次へ」をクリックします。 スクリーンショット 2021-10-04 19.32.30.png

  • ジョブの内容を確認して「作成して実行」をクリックします。 スクリーンショット 2021-10-04 19.33.47.png

  • ジョブが作成されたのでポップアップが表示されます。「ジョブの詳細」をクリックします。
    スクリーンショット 2021-10-04 19.34.14.png

  • ジョブの一覧で、実行中のジョブが確認出来ます。
    スクリーンショット 2021-10-04 19.34.57.png


  • そうこうしているうちにジョブが完了したようです。 image.png

  • ジョブをクリックすると、状態として「完了」していることがわかります。プロジェクトの「データ資産」タブへ戻ります。 スクリーンショット 2021-10-04 19.35.58.png

  • プロジェクト上で名前がすべて「?」になっているデータ資産があります。現状ファイル名として日本語は文字化けしてしまうようです。 スクリーンショット 2021-10-04 19.36.50.png

  • ファイルをクリックして中身を確認します。日付の表示の仕方が変更されていることがわかります。 スクリーンショット 2021-10-04 19.38.37.png

  • 画面右側のファイル名の箇所をクリックして、ファイル名を修正します。 スクリーンショット 2021-10-04 19.40.52.png

スクリーンショット 2021-10-04 19.41.07.png


スクリーンショット 2021-10-04 19.41.29.png

ダッシュボード作成

全体データのみ表示

  • プロジェクトに戻ります。ファイル名が修正されていることがわかります。
  • ここで、画面右上の「プロジェクトに追加」ボタンからダッシュボードを追加していきます。

スクリーンショット 2021-10-04 19.42.59.png


  • ダッシュボードを選択します。 スクリーンショット 2021-10-04 19.43.38.png

  • 名前と説明を入力して、「作成」をクリックします。 スクリーンショット 2021-10-04 19.43.57.png

  • テンプレートを選択します。ここでは最もシンプルなものを選択して、「OK」をクリックします。 スクリーンショット 2021-10-04 19.53.31.png

  • データソースを選択するために画面左上の「+」ボタンをクリックします。 スクリーンショット 2021-10-04 19.53.46.png

  • データ資産をクリックし、先程修正したデータ資産を選択して「選択」ボタンをクリックします。 スクリーンショット 2021-10-04 19.54.39.png

  • 選択されたデータソース名をクリックします。 スクリーンショット 2021-10-04 19.55.43.png

  • データの列名が表示されます。画面左上のグラフのアイコンをクリックします。 スクリーンショット 2021-10-04 19.55.58.png

  • 複数表示されるグラフのうちから、「折れ線グラフ」を選択します。 スクリーンショット 2021-10-04 19.56.47.png

  • グラフのベースとなるものが表示されます。 スクリーンショット 2021-10-04 19.57.31.png

  • 「Date」を「X軸」の箇所にドラッグ&ドロップします。
  • 「Newly confirmed cases」を「y軸」の箇所にドラッグ&ドロップします。 スクリーンショット 2021-10-04 19.59.10.png

  • グラフを拡大表示します。右上の保存ボタンをクリックして、内容を保存します。 スクリーンショット 2021-10-04 20.00.32.png

都道府県別データの表示

都道府県別データ(フィルタリング無し)

  • 「Prefectures」をグラフ上へドラッグアンドドロップします。 スクリーンショット 2021-10-04 20.01.54.png

スクリーンショット 2021-10-04 20.02.39.png


  • 都道府県別データが表示されます。
  • ただし表示可能件数が3000件であるため、表示されている日数がかなり限定的になっています。 スクリーンショット 2021-10-04 20.04.09.png

都道府県別データ(フィルタリング有り)

  • 「Preferences」の右側をクリックして、「フィルター」をクリックします。 スクリーンショット 2021-10-04 20.08.30.png

  • 例えば今回は「Hokkaido」「Osaka」「Tokyo」を選択して「OK」をクリックします。 スクリーンショット 2021-10-04 20.09.27.png

  • 選択された3都道府のグラフが表示されました。 スクリーンショット 2021-10-04 20.10.14.png

  • 強調したい対象をクリックすると、ハイライトされます。
  • 例えば画面上部の「Hokkaido」をクリックすると、北海道のデータのみが強調されます。 スクリーンショット 2021-10-04 20.11.50.png
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
2
Help us understand the problem. What are the problem?