勤め先にメンター制度というのができまして、
てっきり強力なメンターをあてがってくれて
私の面倒を見てくれるのかと思いきや、
私がメンターとして新人さんの面倒を見なさいという内容でした。
教えられることと1いえば二日酔いでも会社に来るライフハックや
どんな寝不足でも元気そうに振る舞うちょっとのコツとかぐらいなので
どうしたもんだろう、なんて考えてたのですが
幸い私が対応する新人さんはデータ分析に興味があるらしく、
その方面でお付き合いのとっかかりでも作ろうかと考えました。
そんなこんなもあり、近いうちにデータ分析入門的な話をするので、
そこでぱっと浮かんだ構成やらを先に公開してみようかと思います。
データ分析入門(門前の参道まで)
データ分析とは?
データ分析とはなんぞや、という質問に対して、
「データを分析して情報にする」
とか
「データを使える状態にする」
とか、そんな感じの返事が返ってくるかと思います。
じゃあ、出てきた要素を分解して
- データとはなんぞや?
- 分析とはなんぞや?
- 情報とはなんぞや?
- 使えるとはなんぞや?
ということまで明言している方はいますでしょうか?
統計解析や計算機統計とかの世界だと
だいぶ概念的な定義や解説になるかと思うのですが、
幸い会社なので、ディープに概念世界に浸る必要はありません。
会議の席で部長とかに説明するとき、
一言二言でどんな感じかという感覚を伝えられる言葉を持っていればいいと思います。
そういう観点で、これが正解かどうかはおいといて、
それっぽい言葉としては次のような説明になるかと思います。
データとはなんぞや?
データとはなにか?
会社の世界では入金伝票2や出金伝票に書いてある項目が蓄積したもの、
と定義できるかもしれません。たぶん。
情報とデータの関係ってお互いを行き来するところがあると思っていて、
伝票に書いてある項目の情報が蓄積されてデータになり、
データを分析して情報を引き出すことができたり、
その情報が蓄積されてデータになったり。とか、つながりあっていると思っています。
じゃあ、考える起点を今回は“データ”にすれば良いので、
それの要素となるのは情報で、
その情報とやらは、会社の世界ではお金の動き3が確度の高い資料になると考えます。
分析とはなんぞや?
売上や出金の資料を元としたとき、ざっくりと次のような式4が成り立ちます。
\sum 売上 - \sum 出金 = 粗利
これは、全部の売上を足した金額から全部の出金の合計を引くと粗利になるという意味です。
けれども、会社の中では部署の予算や個人の成績、
プロジェクトに対する経費の割合とか、金銭的な値を多方面の要素でまとめなおして、
良し悪しを見たりしています。
この共通項もつ要素をまとめて合計し直す、
というのが分析の考え方の一つかと考えます。
たとえば売上。
月ごとであったり、クライアントごとであったり、
担当者ごとであったり、そういう伝票内に書いてある項目をキーに
合計値を属性ごとに切り分けて合計し直すというのが“分析”のスタートになるかと思います。
余談ですが、分析に近い言葉で解析や統計なんてのもあるかと思いますが、
上の説明を元に考え直すと、次のような違いがあると思います。
- 分析:全体の値を要素ごとに切り分ける。集計の上位概念?
- 解析:値の動きを捕まえられるようにして、先々の動きについても把握できるようにする
- 統計:事象全体がどのような分布になっているかをつかみ、全体像を把握する
この考え方が正解かどうかはわかりませんが、まあ、給料取りが仕事で使う範囲内なら
さほど支障はないかとも思いますので、一つの考え方として見といてください。
繰り返しますが、分析とは集計可能な数値を、要素ごとに分けてその内訳が見られるようにする、
というのが考え方になるかと思います。
情報とはなんぞや?
データのところでも書いた話なのですが、
データとは情報の積み重なりで、
データを分析すると情報となり得る、と、考えています。
先に上げた入出金伝票だと、伝票一枚、
仮に出金伝票一枚として、次のような項目が埋められているとします。
- 日付
- 支払先
- 勘定科目
- 摘要
- 金額
- 担当者
- 承認者
勘定科目というのは税金の処理や会計の処理をするときに必要な項目で、
説明が長くなるので省きますが、
他の項目についてをくっつけて読み解くと次のような意味になるかと思います。
誰がいつ何にいくら使って、それを誰が認めたか
見方を変えると、出金伝票一つにこれだけの意味が入っていて、
その伝票一つでお金が動いたシーンの大雑把な様子が書かれているとも読めます。
それを要素を並べて、レコード化すると蓄積が可能となります。
一昨日発生した伝票であろうが、さっき発生した伝票であろうが、
創業時に発生したデータであろうが、
とにかく蓄積されていれば、それをデータとして使うことが可能です。
そうすると、担当者ごとにいくら使ったか、
支払先ごとにどれぐらい使ったか、
月ごとにいくら使ったか。
そのような形で、新しい情報を掘り出すことができます。
売上伝票であれば、
誰が一番売上を上げているか、
お得意様はどこの会社か、
月ごとにどれぐらい売上があるか、
なんていう情報にもなります。
この中で挙げた月ごとにいくら売り上げたか、
という項目は、一年の中で12個の要素が発生して、
さらには創業時から綿々と繋がっていきます。
それが徐々に伸びていくような数値であれば、
会社は順調にいっていますという情報にもなりますし、
逆に下がっていれば、やばいかも、なんて情報にもなり得ます。
情報は付き重なるとデータとなり、
そこから情報を紡ぐことができる。
そして、その情報自体も積み重なるとデータとなる、
という考え方で、データと情報は可換であるよっていうのが説明できたかと思います。
使えるとはなんぞや?
データと情報は可換であるとの説明をしました。
ここでの使えるとは、会社の現場を想定しているので、
ものすごーく近視眼的にすると、上司が喜ぶ状態が使える情報なんだろうなと思います。
じゃあ、上司とやらはなにを見ると喜ぶのでしょうか?
次一歩を動くのに助けになる要素があったりすると喜んだりします。
例えば、話題となっている会社に対して受注している金額増えているか減っているかとか、
そもそも全体の受注額の中で、その会社はどれぐらいの割合なのか、とか、
会議の場とかで疑問に出そうなことを数字で説明できたりすると、
使える状態にしたと褒められるかもしれません。
上の話は技巧的には、まずは全体の受注金額合計を出して、
その上で、受注元ごとの合計値を出して、
そして、その金額は全体のどれぐらいの割合なのか、
という流れで見ていけばいいので、割と簡単にできたります。
データ分析とは
データとは情報の積み重なりで、
それを要素の集合ごとに集計し、新しい情報を引っ張り出す。
というのが、答えの一つになるかと思います。
要素ごとで集合を作る以外にも、
時系列で動きを見てみたり、
割合としてパフォーマンスを測ってみたり、
予測と実態とで成果を見てみたり、
そういったこともデータ分析の技法でできますが、
本質的には要素で集合を作って集計するというのが
操作の基本になるかと思います。
まずは、目の前にあるデータ5がどのような情報から出来上がっているか、
そして、そこからどのような情報が生み出せるか、という観点で、
仕事場にあるデータを読み解いてみてください。
ここまで書いてみての感想
丁寧にやりすぎたのか、分析手法に入る前で体力が尽きました。
Google Search Consoleの分析についてはここに書けるかもしれないので、
気が向いたら関連話として書いてみたく思います。
-
メンターは教える人ではないらしいが、よく知らない ↩
-
今どき入出金伝票を使ってる会社はないと思いますが、まあ、ファイルの保存にフロッピーディスクのアイコンが使われているように、概念を具現化する象徴ぐらいで見てください ↩
-
勤め先にはSalesforceが導入されていて、提案や失注とかもデータとして使えるけど、それはまた次のステップで言及しようかと ↩
-
TeXっぽく書けると評判のmath記法を使ってみたかっただけ ↩
-
幸いにして、営業活動についてはSalesforce、WebについてはGoogle Search ConsoleやAnalyticsのデータを教材として活用できるので、マーケティングやSEOなんかにも話を膨らませられるかと思ってます ↩