はじめに
時々、無性にヒストグラムを作りたくなるときってありますよね?(導入が雑になってきている!?)
昨今、学習指導要領の変更で小学生の英語必修化やプログラミング必修化が取り沙汰されてたりしますね。それ以外でも実は絶妙に大事な動きがあったりします。
自分は大学に入ってからヒストグラムを習いましたが、実は地味に少し前にヒストグラムや箱ひげ図といったデータの見方や統計に関する知識の習得が中学生の指導要領に追加されました。「データドリブン」という言葉が本当に身近になってきています。今後もデータの扱いに関する要領が追加される動きは加速するでしょう。
ということは、今の子供たちは将来当たり前のようにそれらを使い、プレゼンし、語りかけてくるわけです。
こういった方面の知識を無視して仕事するわけにもいかないだろうと思い、今回のテーマにしました。
ちなみに実際に僕は社内で他部署の方に詰問されて「Twitterのインプレッション数の中央値が下がり気味である」ことを指摘された際に、tableauではなくスプレッドシートでしたがインプレッション数を1万impごとの区間のヒストグラムにして、impの下がり傾向を説明し、理解していただいたことがあります。(以前に比べて低いimpの投稿数が全体的に増えてきている的な趣旨)
ヒストグラムとは
ご存じの方もいらっしゃるかと思うのであまり深くは触れないないですが、こちらの記事を見ていたらけたらと思います。
例えば100点満点のテストをしたとして、50〜60点台の生徒が◯人いた、60〜70点の生徒が△人いた、といったことを区間を設定して、何人その区間にいるか(度数、頻度)を可視化できるようにするものです。
例)
実際に作る
こちらの動画を見てください。1分もしないです。
ヒストグラム化したいデータを選んで右クリックで[作成]>[ビン]を選んでビンのサイズを設定すれば概ねできたようなものです。
ビンとは、サンプルデータをグラフ用に並べ替えるために使用する、等間隔の区間のことです。
動画では身長2.5cmごとに区間を区切るということでビンのサイズに2.5と入力しています。
動画にもありますが、あとはデータを「連続」にし、メジャーを「カウント」にすればこうなります↓
以上、お粗末さまでした。
【Tableau Data Saber挑戦記】の最初の記事はこちら
こちらもぜひ
【Tableau Data Saber挑戦記】1. はじめます