2つのテーブルを使って「率」を出す
「政府CIOポータル」(内閣官房)で新型コロナウイルスのワクチン接種状況のオープンデータが公開されています。
オープンデータを取得しても、上記で公開されている「都道府県別接種率」の数字は入ってませんでした。
「都道府県別人口」のテーブルを別途用意し、「接種人数」と割る(÷)ことで算出することを試しました。
人口データの取得は「住民基本台帳に基づく人口、人口動態及び世帯数調査」(総務省統計局)を使いました。
Power BI Desktopを使う
まず接種人数のデータを取り込みます。
次にと総府県別人口のデータを取り込みます。
「クエリのマージ」を選び、と都道府県名を結合のキーとなる列として選択し、「左外部」の結合を選びます。
この場合、「左外部」を選ぶことで、接種数のテーブル(左側)の右側に人口の数字列を追加することができます。
結合後、追加する列を選択します。
「ホーム」→「適用」し、可視化画面に移ります。
「クイックメジャー」を作成することで、「接種数÷都道府県別人口」という計算を加えます。
以下のようなスクリプトの計算列が追加されます。
count_first_or_mid_general / 人口、世帯数、人口動態(都道府県別)【総計】.6人口_計 =
DIVIDE(
SUM('summary_by_prefecture'[count_first_or_mid_general]),
SUM('summary_by_prefecture'[人口、世帯数、人口動態(都道府県別)【総計】.6人口_計])
)
このままでは「割合(%)」のデータが型になっていないので、画面左端のパネルから「データ」を選び、「パーセンテージ」型に変更します。
「接種率」が算出できました。
Google Data Portalを利用
次に、「Google Data Portal」でも同様のことを実施します。
まず接種数のデータを取得します。
Power BI Desktopでは直接URLを指定できました。
Google Data Portalの場合、Googleスプレッドシートに「IMPORTDATA関数」を使って取り込み、そのシートを指定することで取得しました。
右側のパネルから「データの結合」を選択します。
結合するデータ(都道府県別人口)を選択します。
ここでも、都道府県名を結合キーとします。
表示する列(人口)も選択します。
表に「人口」を追加できるようになりました。
「接種率」を計算する列を追加します。
右パネルから「ディメンジョンを追加」を選びます。
計算式を設定します。
表に接種率が追加できるようになりました。
Tableau Publicで計算
「Tableau Public」でも、Googleスプレッドシートからデータを取得できるので、Google Data Portalと同じデータソースを使います。
左パネルから「接続 追加」をクリックします。
結合の設定をします。
「計算フィールド」を追加します。
「接種率」をの計算式を記述します。
設定した計算フィールドが追加され、「接種率」を表に追加できるようになりました。
割合(パーセンテージ)の型に変更します。
Tableauの場合、数値データが「メジャーバリュー」というフィールドに格納されます。
そのフィールドから「書式設定」を選ぶことで「パーセンテージ」を指定できます。
「接種率」が追加できました。
了