本記事の目的
いつの間にかAIやデータサイエンス界隈の資格試験が大量に出ていた。
こういった資格試験が出てきたということは、データサイエンスを体系的に学べる環境整備がほぼ完了してきたということ。なのでもちろん歓迎すべきことではあるのだが、各資格の棲み分けがよく分からなかったので、自分なりに整理をしてみた。
データサイエンス周りの勉強を進めたいと思ったときに、どの資格試験を活用するかを考えるときの参考にしたい。
比較対象とした資格
比較にあたっての対象資格は以下の9つ。資格ごとの概要のまとめはそこら中にあるので、ここでは割愛。名称が長い資格試験もあるので、本記事内ではこれ以降【】内に記載した略称を使う。
- 【G検定】; G検定
- 【E資格】; E資格
- 【統計検定】; 統計検定 データサイエンティストエキスパート(CBT)
- 【Python3】; Python3エンジニア認定データ分析試験
- 【DS検定】; データサイエンティスト検定リテラシーレベル
- 【AI実装(B)】; AI実装検定(B級)
- 【AI実装(A)】; AI実装検定(A級)
- 【AI実装(S)】; AI実装検定(S級)
- 【DS数学】; データサイエンス数学ストラテジスト
なお以下の資格についてはデータサイエンスからやや分野が外れている、または情報が少ないなどの理由で今回の比較対象からは外した。
- DX検定(日本イノベーション融合学会)
- 画像処理エンジニア検定(公益財団法人 画像情報教育振興協会)
- データベーススペシャリスト試験(情報処理推進機構)
- データ解析士(一般財団法人 実務教育研究所)
- ビジネス統計スペシャリスト(株式会社 オデッセイ コミュニケーションズ)
- 統計データ分析士(統計科学研究所)
またクラウド系の資格についてもツール依存の内容が多くなるため今回は外した。
- AWS Certified Machine Learning - Specialty
- Azure Data Scientist Associate
- GCP Professional Machine Learning Engineer
整理の方針
検定試験ごとに情報を整理したものはよく見かけるが、それだと横串での比較がしづらい。ここでは大分類ごとに出題範囲の観点から、各資格試験を横断的に整理する。カテゴリの内容や粒度については独断と偏見に基づいて決定した。
G検定 | E資格 | 統計検定 | Python3 | DS検定 | AI実装(B) | AI実装(A) | AI実装(S) | DS数学 | |
---|---|---|---|---|---|---|---|---|---|
1. 歴史・事例 | 〇 | 〇 | 〇 | ||||||
2. 契約・法務・倫理 | 〇 | 〇 | |||||||
3. 組織・人材 | 〇 | ||||||||
4. 数学 | 〇 | 〇 | 〇 | 〇 | 〇 | 〇 | |||
5. 機械学習 | 〇 | 〇 | 〇 | 〇 | 〇 | ||||
6. 深層学習 | 〇 | 〇 | 〇 | 〇 | 〇 | 〇 | |||
7. 開発・運用環境 | 〇 | 〇 | 〇 |
ここでは7つのカテゴリを設け、「どの資格がどのカテゴリを特に重視しているか」を整理してみた。表で表しているのはあくまでも重視しているかどうかであって、〇が付いていないからといってその範囲が全く含まれないとは限らない。
※ 繰り返しますが、完全に主観での整理になるので、正確には各資格のシラバスや参考書、過去問を参照下さい。また、データサイエンス関連の検定を横断的に比較するような試みが他にあればぜひ教えてください。
1. 歴史・事例
データサイエンティストやAIエンジニアだけでなく、AIプランナーなどAIに関わる方が把握しておくべき基礎事項。入門者向けの内容で、比較的難易度の低い資格で重視されている傾向がある。
特にDS検定では、事例も含めて重点的にカバーされている。G検定でも、主に技術的な観点で「何ができるようになったか」という視点からこれまでの歴史が整理されている。
対応する資格とシラバス
G検定 - 「人工知能をめぐる動向」
DS検定 - 「社会におけるデータ・AI利活用」
AI実装(B) - 「歴史」
2. 契約・法務・倫理
何かと話題に事欠かない契約や法務問題だが、カバーしている資格は多くない。
G検定やDS検定では個人情報等のデータ保護についての内容が出題範囲になっている。
対応する資格とシラバス
G検定 - 「ディープラーニングの社会実装に向けて」
DS検定 - 「データ・AI利活用における留意事項」
3. 組織・人材
個人的に興味が強いが、まだ経験知に留まり未確立のところが大きいからか、各試験の出題範囲にはほぼ入っていない。データサイエンティストと機械学習エンジニアの違いなど、いまだに定義が揺れていることも背景にありそう。
今回確認した範囲だと、Python3エンジニア認定データ分析試験で、データエンジニアの役割が触れられている程度。
対応する資格とシラバス
Python3 - 「データエンジニアの役割」
4. 数学
数学は多くの資格試験がその出題範囲としているが、その範囲には大きなばらつきがある。やはり統計検定は数学に最も重点を置いている印象で、統計基礎(確率分布やベイズ理論)、線形代数(行列や固有値)、微分積分などを一通りカバーしている。
一方で、Python3エンジニア認定データ分析試験やデータサイエンティスト検定では従来の機械学習を中心に取り扱っている関係か、微分積分はシラバス上に確認できなかった。
対応する資格とシラバス
E資格 - 「応用数学」
統計検定 - 「統計基礎」「数学基礎」
Python3 - 「数学の基礎」
DS検定 - 「データリテラシー」
AI実装(A) - 「数学」
5. 機械学習
機械学習についても、統計検定が手厚い印象を受けた。教師あり学習(SVM、決定木系、ベイズ統計)、教師なし学習、時系列解析などテーブルデータに対する一通りのアプローチがカバーされているように見受けられる。
Python3エンジニア認定データ分析試験も機械学習の内容を多く含んでいるが、scikit-learnを使った実装面に焦点があたっている点が統計検定と違う印象を受けた。理論面を勉強したいのであれば統計検定、実装面を勉強したいならPython3エンジニア認定データ分析試験か。
G検定やE資格の出題範囲にも機械学習はあるが、「ディープラーニング協会」による資格試験ということもあり、(ディープラーニング以外の)従来の機械学習の範囲は薄め。
対応する資格とシラバス
G検定 - 「機械学習の具体的手法」
E資格 - 「機械学習」
統計検定 - 「モデリング・AIと評価」
Python3 - 「ライブラリによる分析実践」
6. 深層学習
ディープラーニングについては、やはりG検定とE資格が知名度が高い。E資格では理論面も含めてニューラルネットワークの一通りの理解が求められる。
一方で「AI実装」の資格は、E資格と対比して、より実装面に焦点を絞っていると思われる。特にS級の公式教材は「公式論文」とだけ記載があり、普段からPyTorchやKerasといったライブラリを使い、論文のモデルを実装しているような受験者を想定していると思われる。
対応する資格とシラバス
G検定 - 「ディープラーニングの概要」「ディープラーニングの手法」
E資格 - 「深層学習」
AI実装(B) - 「学習と推論」
AI実装(A) - 「AI」「プログラミング」
AI実装(S) - 「NLP」「Model」
7. 開発・運用環境
この分野は従来のITエンジニアが得意とする範囲(CPU/GPU/FPGA、エッジ、オンプレ/クラウド、コンテナ等)も多い。データサイエンス特有の議論としての再学習や軽量化技術(蒸留)も含めて、概念的に理解はしておくべきだが、実装面はツールに大きく依存する。
なのでこの分野をしっかり勉強するのであれば、今回対象外としたクラウド各社が出しているベンダー試験(GCP/AWS/Azure)で勉強したほうが良さそう。
対応する資格とシラバス
E資格 - 「開発・運用環境」
統計検定 - 「モデリング・AIと評価(AIの構築・運用)」
AI実装(B) - 「開発と運用」
※ クラウド各社の資格試験
終わりに
自分なりに整理をしてみましたが、私自身はE資格くらいしか取得していません。他の資格については基本的にシラバス(出題範囲)の章立てを見ながら整理しています。認識違いなどあるかもしれませんので、明確な誤りに気づいた方はご連絡いただけると嬉しいです。
AI・データサイエンス領域の契約・法務・倫理、組織・人材のあたりにも個人的に興味があるのですが、あまり資格試験の範囲として体系的に整備されているものはなさそうな点は残念でした。