新型コロナウイルス感染症に関し、感染予防や診療などに従事し地域医療を支えている医療関係者の皆さまに心より敬意を表します。
新型コロナウイルスが発生してから、行政や企業などの尽力により感染データの公開環境が整備され、データの可視化・分析に関する多くのツールやノウハウが公開されています。本記事ではそれらの活動の一つとして、セルフBIツールであるPower BIを使って最短で感染者数のグラフを作成する方法を紹介します。
データソース
新型コロナウィルスの感染者数データとしてCOVID-19 Japanが公開しているオープンデータを使います。本データは厚生労働省に帰属します。
Microsoft Power BI
Microsoft社のBIツールであるPower BIでグラフを作成します。Power BIをインストールしていない方はMicrosoft Storeから、またはダウンロードページからインストーラをダウンロードしてインストールして下さい。Power BIの操作方法についてはMicrosoftのヘルプ等をご覧ください。
データの読み込み
はじめにグラフ化するデータの読み込みを行います。
メニューの「データを取得」をクリックし、「データの取得」ダイアログを開きます。
「JSON」を選択し「接続」をクリックします。
JSONファイルを指定するダイアログが表示されますので、「ファイル名」にデータのURLを入力し「開く」をクリックします。
Power Queryエディターの設定
データが読み込まれるとPower Queryエディターが起動します。今回は都道府県ごとのデータを表示するため「area」の「List」をクリックします。
「テーブルへの変換」をクリックします。
この画面では何も変更せず「OK」をクリックします。
カラムの右上にあるアイコンをクリックします。
全てのフィールドが選択されていることを確認し「OK」をクリックします。
都道府県ごとのデータが一覧表示されます。
このまま読み込むと感染者数などの数値データもテキストとして読み込まれてしまうため、データタイプの変換を行います。
「Column1.npatients」カラムより右のカラムをすべて選択します。
この状態でメニューの「データ型」から「整数」を選択します。
最後に「閉じて適用」をクリックし、Power Queryエディターを閉じます。
グラフの表示
それでは読み込んだデータを使ってグラフを作成します。
まず画面右の「フィールド」に読み込んだフィールドが表示されていることを確認してください。
「視覚化」から「集合縦棒グラフ」をクリックし棒グラフを配置します。
配置したグラフを選択すると「視覚化」にデータフィールドを設定する項目が表示されます。「軸」に都道府県名を示す「Column1.name_jp」フィールドを、「値」に感染者数を示す「Column1.npatients」フィールドをそれぞれドラッグしてください。
フィールドを配置すると、下図のように都道府県ごとの感染者数が表示されます。
今回の例では感染者数のみを表示しましたが、現患者数(ncurrentpatients)や現重症者数(nheavycurrentpatients)などのフィールドもグラフに表示することができます。
おわりに
今回はPower BIでオープンデータにアクセスし感染者数のグラフを作成しました。この取り組みが新型コロナウイルス感染の早期収束に向けて少しでも役に立てることを願っています。