はじめに
分析・集計する対象のデータがアンケートデータのように、ひとつの設問に対して複数の選択肢を回答できるデータの場合、データの持ち方に工夫が必要となります。
アンケートサンプル
今回は、アンケートのフォームが下記のような場合を考えます。
取得されるアンケートデータ
上記のようなアンケートの場合、収集されたデータは以下のようなデータレイアウトになります。(アンケートサンプルデータ_1.csv)
氏名,問1,問2
田中太郎,0~10 歳,春
鈴木次郎,11~20 歳,春/夏
小林三郎,21~30 歳,夏/秋/冬
山田花子,31~40 歳,春
佐藤健太,41~50 歳,夏/秋
高橋美咲,21~30 歳,冬
中村直人,61 歳以上,春/夏/秋/冬
伊藤直子,51~60 歳,春/夏
木村大介,31~40 歳,冬
渡辺真理子,51~60 歳,秋/冬
MotionBoard で可視化してみる
このデータを使用して、アンケート回答者の年代別割合と、どの季節が好きだと答えたかの割合を表現してみます。
今回は、MotionBoard を使用して、それぞれの割合を円チャートで表現してみました。
すると、上に配置した年代別の割合を表現した円チャートは問題ありませんが、下に配置した季節別の割合を表現した円チャートが、複数回答を許可しているため、うまく表現できません。
思い通りの割合を表現するために、データを加工する
そこで、季節別の割合を正しく表現するためにデータを加工します。(アンケートサンプルデータ_2.csv)
氏名,問1,問2
田中太郎,0~10 歳,春
鈴木次郎,11~20 歳,春
鈴木次郎,11~20 歳,夏
小林三郎,21~30 歳,夏
小林三郎,21~30 歳,秋
小林三郎,21~30 歳,冬
山田花子,31~40 歳,春
佐藤健太,41~50 歳,夏
佐藤健太,41~50 歳,秋
高橋美咲,21~30 歳,冬
中村直人,61 歳以上,春
中村直人,61 歳以上,夏
中村直人,61 歳以上,秋
中村直人,61 歳以上,冬
伊藤直子,51~60 歳,春
伊藤直子,51~60 歳,夏
木村大介,31~40 歳,冬
渡辺真理子,51~60 歳,秋
渡辺真理子,51~60 歳,冬
問2の回答を、区切り文字(/)で分割し、得られた配列を1行ずつ行に展開したデータを用意します。
もういちど、MotionBoard で可視化してみる
加工したデータを使用して、再度 MotionBoard でチャートを作成しました。
すると、季節別の割合もきれいに表現することができます。
アンケートに限らず、例えば製造現場での不具合報告やチェックシートなど、選択肢の中から複数データを選択するケースは業務の中で多くあると思います。
そのようなデータを可視化・分析する場合、このようなデータ側での工夫をあらかじめしておくと、そのあとの作業が簡単になります。
データの加工はさまざまな方法で行えますが、せっかくですので、今後、Dr.Sum で実装する場合や、MotionBoard でどうにか頑張る方法なども投稿していきたいと思います。
※ 注意点 ※
加工したデータ(アンケートサンプルデータ_2.csv)で、年代別の割合を表現する円チャートを作成する場合、回答した季節の分だけデータが行に展開されているため、「鈴木次郎」のデータが2行・「小林三郎」のデータが3行存在します。
そのため、集計方法は単純なデータ件数ではなく、Distinct 件数を使用する必要があります。