データ分析に使うツールと言えばPythonやRを思い浮かべる人も多いかと思いますが、Excelだけでも相関分析や回帰分析などかなりのことができ、容量が大きくないデータなら手軽に集計・分析が可能です。本記事では、データ集計・分析をする場合に便利な関数をいくつかピックアップしてみました。
①CONCATENATE
文字列を結合できます。データの整形ではよく使う関数のひとつです。
CONCATENATE(文字列1, 文字列2,…)
ダミーデータで試してみましょう(ここではGoogleスプレッドシートを使います)。以下のように、県名や建物名がバラバラのセルに格納されている場合、CONCATENATE関数で結合するセルを指定することで、住所をひとつのセルにまとめることができます。
②COUNTIF
条件に合致する数値の数を集計します。条件を指定して合計値を出す場合はSUMIF、平均値を出す場合はAVERAGEIF、最大値を出す場合はMAXIFなど、さまざまなバリエーションがありデータ集計で重宝することも多いのではないでしょうか。
COUNTIF(範囲, 検索条件)
例えばcountif(E2:E11,"男")とすることで、リスト中の男性の数をカウントできます。
条件が複数ある場合はCOUNTIFSを使います。以下の例では、性別が男性かつ、住所が福島県の人をカウントしています。
③CORREL
比較したい配列の範囲を指定することで、配列同士の相関係数を算出します。相関の強さは、一般的な相関係数と同様に-1~1で表します。
CORREL(配列1の範囲,配列2の範囲)
この場合、年齢と購入金額には負の相関がある、つまり年齢が低いほど購入金額が高いということになります。
④FORECAST
FORECAST関数で、回帰直線を使った数値予測ができます。
FORECAST(予測するx列の値, yの範囲, xの範囲)
以下の例では、2015~2019年の金額をもとに2020年の見込み値を算出しています。
ここでは紹介しきれませんが、Excelにはこのほかにもピボットテーブルなど便利な機能は多数あり、データ分析の実務ではぜひ使いこなしたいところです。