複数のエクセル表のデータをまとめて分析しようとするとき遭遇する10のがっかり。
1.行/列が入れ替わっている
がっかり度 ★★★★☆(4.0)
ある年から行と列の見出しが入れ替わってる。きれいに入れ替わっているだけなら、ご愛敬です。
2.見出しの名前が変わっている
がっかり度 ★★★☆☆(3.0)
よくあることなので、耐えるしかないです。見出しの文字と文字の間にスペースを入れて見栄えを揃えていたり、そのスペースが全角だったり半角だったりすることもあります。
ただし、以下のように、役に立たない、邪魔でしかない労力が費やされている場面に出会うと、がっかり度は4.0くらいに上がります。ある時、お役所で英語を併記する一過性のブームがあったように記憶しています。
3.集計の単位が変わっている
がっかり度 ★★★☆☆(3.0)
これは、気づきにくかったりするので、要注意です。グラフ化したときに、急激に値が変化していたら気が付きます。
温度の摂氏と華氏とか単位が変わったり、表示単が千単位なのか、万単位なのかとか。
4.集計方法が変わっている
がっかり度 ★★★★★(5.0)
もう、連続したデータとしてみるのは難しいかもしれません。おまけに、データの変化が小さい場合は、最後まで気が付きません。エクセル表の端っこに説明書きがあればまだましですが、ない場合は、過去の担当者にヒアリングしないとわかりません。
また、国をまたがるデータの場合、基準や粒度が異なる場合がありますので、注意が必要です。
誤差が許容範囲であればよいのですが、その判断は往々にして担当者任せになっている場合があり、後々発覚して大事になった例があります。
5.分類が変わっている
がっかり度 ★☆☆☆☆(1.0)
途中から分割されたり、再掲されたりすることがあります。合算されてしまう場合は、最終的な集計の形に影響を与えます。
6.レイアウトが変わっている
がっかり度 ★☆☆☆☆(1.0)
エクセルでデータ集計する場合は、これは絶対考慮しておく必要がある項目です。いくつかパターンがあります。
a)表の位置が変わる
表のタイトルがセル上に記載されていることが多いのですが、表が開始する行の位置がずれてしまう原因です。また、表の左に列を追加して位置を調整することも多いです。
b)表の中に列を追加している
表の見栄え調整のため、列を追加してデータとデータの間隔を調整する人がいます。
c)機械判読用と割り切った
罫線さえなくなっている場合もあり、割り切った感が伝わってきます。しかし、割り切り方がおかしく、この表だけ見ても意味が分かりにくくなってしまっています。
7.非表示の行、列がある
がっかり度 ★★★★★(5.0)
仮計算に使ってたとか、全体の位置調整のためとか、担当者の都合により表の中の行や列が非表示にされていることがあります。
気が付きにくく、データ数や合計の検証作業を入れておかないと、データ数が異なっていたり、合計値が合わなかったりして時間を取られることになります。検証作業を怠ると、正しい結果になりません。
8.値がない項目の扱いが変わっている
がっかり度 ☆☆☆☆☆(0.0)
ゼロの代わりに「ー」や「-」になっていたり、空白だったりします。後で一括で変換できるから、よくあることで、なんとかなります。
注意すべきは、割合を計算するときに、値のない項目はどのように扱うのが正しいのか考えることです。ゼロではなく、ブランクとする方が適切な場合があります。
9.セルに複数の値が入っている
がっかり度 ★★★★☆(4.0)
対応はなんとかするとしても、どうしてそんな使い方をしているのかが気になります。
上記の形は理解できますが、以下の形は勘弁してほしいです。
10.値が文字列になっている
がっかり度 ★★★★☆(4.0)
表の作成者がデータ形式に対して知見があるとは限りません。数値と文字列の違いを気にしている人は少ないと考えましょう。
エクセルには書式設定と言う機能があり、正負の数値を「△1,234」とか「▼1,234」や、「1,234円」と数値の単位を表記することができますが、大抵の人は文字列でその値を入力してしまいます。カンマ区切りしたという理由だけで文字列で入力する人もいます。
また、空白を使って値の位置調整をする人もいます。
集計時にエラーになることが多いので気づきますが、集計方法によってはエラーにならないで誤った値で集計されることがありますので注意が必要です。
データ作成時に大切なこと
旧エクセル形式(xls)にすることが、ファイルフォーマットの標準化だと思っている人もいるようです。肝心なのは中身のデータ形式です。
後々データを活用するのであれば、レイアウトはできるだけ変えない方がよいです。印刷の見栄え重視で小細工するのはやめましょう。
数値項目には数値、見出し、分類には空白を含まない文字列で記載しましょう。数値の区切りや単位など表示形式は書式設定で設定しましょう。注釈は、同一セル内に記載するのではなく、別の項目を設けるなどすべきです。
表内のセル結合は、後々扱いが面倒なので、極力避けることを考えましょう。
データ利用時に大切なこと
エクセルが正しく計算していると過信しないこと。
集計前にデータの件数の確認や、合計値など期待値を出しておくことが大切です。