◆目的
- Pythonとデータ分析関連資格を調べ、取得目標を立てる
- Pythonを使用しデータ分析するための環境構築方法を学ぶ
- データ分析に必要なPythonライブラリ等を学ぶ
- データ分析をするために何を学ぶ必要があるか理解する(統計学とか)
第一回目は、Pythonやデータサイエンティストについて何もしらないので、
方向性を決めるための調査を行うこととし、調査をしながら方向性を修正しながら進めることにします。
◆Python、データ分析関連の資格
Python関連資格
一般社団法人Pythonエンジニア育成推進協会が実施する
- Python 3 エンジニア認定基礎試験
- Python 3 エンジニア認定データ分析試験
- Python 3 エンジニア認定実践試験
があります。
いずれも税込11,000円です。
統計検定
公式サイト:http://www.toukei-kentei.jp/
試験の種別 | 受験料 | 偏差値 |
---|---|---|
統計検定 1級「統計数理」 | 税込6,000円 | 72 |
統計検定 1級「統計応用」 | 税込6,000円 | 72 |
統計検定 準1級 | 税込8,000円 | 70 |
統計検定 2級 | 税込5,000円 | 65 |
統計検定 3級 | 税込4,000円 | 50 |
統計検定 4級 | 税込3,000円 | 35 |
統計調査士 | 税込5,000円 | - |
専門統計調査士 | 税込10,000円 | - |
データサイエンス基礎(DS基礎) | 税込7,000円(一般価格)、税込5,000円(学割価格) | - |
データサイエンス発展(DS発展) | 税込6,000円(一般価格)、税込4,000円(学割価格) | - |
その他
データベーススペシャリスト、オラクルマスター、OSS-DBの資格などありますが、
今回は調査対象外とします。
結論
今回は、
「Python 3 エンジニア認定データ分析試験」
取得を目指すこととします。
比較的難易度は高くないという点、統計検定はPythonの基礎は学べそうにないという理由で。
◆データ分析に必要なライブラリなど
1. Annaconda
データ分析用のパッケージを纏めているのが、Anacondaというディストリビューションです。
個別にインストールするより簡単に楽なのかもです。
◆データアナリストとデータサイエンティスト
共通の必要スキル
- データベースやSQLを扱うスキル
- 分析用プログラミング言語を扱うスキル
- 統計学の基礎知識
データアナリストのスキル
共通のスキルに加えて、データの可視化やレポーティングに関するスキルが高いレベルで求められます。
Excelスキル
- 数千~数万程度のデータ量だとExcelを使うことも多い。
- IF、VLOOKUPなどの基礎関数の理解
- ピボットテーブルを使いこなせるスキル
Excelの関数は何となくで使用していることが多いので、ピポッドテーブルやVLOOKUPなど学びなおす機会を作りたいと思います。
BIツールを扱うスキル
ビジュアルに訴えるダッシュボードやレポート作成のためのBIツールを駆使するスキルが求められます。
BIツールは使用したことがないです。フリーで実用的なツールなど後ほど調べてみたいと思います。
資料作成、プレゼンスキル
以下のスキルが求められます。
- 分析結果を纏める
- 分析結果をプレゼン(コミュニケーション)する
- 簡潔にパワーポイントに纏める
データサイエンティストのスキル
アルゴリズム実装、分析モデル構築に高い専門性を持つ職種。
つまり、データアナリストよりも実装よりの職種かなと思います。
統計学、機械学習の理論などに知見が求められる。
結論
私は、
「データサイエンティスト」
を目指すこととします。
プレゼン能力、コミュニケーション能力は元々低いし、そこを向上しようとはあまり思わないので。。
◆ Pythonを気軽に試せる環境(colab)