1. データサイエンティスト検定とは
DS検定は一般社団法人データサイエンティスト協会によって主催されている検定です。現時点(2023年10月)では、「これからデータサイエンティストを目指すビジネスパーソン」や「データサイエンティストに興味を持つ大学生や専門学校生」など、初学者向けの「データサイエンティスト検定™ リテラシーレベル」のみ
が検定対象となっており、データサイエンティストとしてのキャリアをスタートする際に必要な知識があることを証明する試験となっています。本検定の取得により、データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力についてそれぞれ見習いレベルの実務能力や知識を証明することができます。
詳しくはデータサイエンティスト協会のページを参照してください。
今回の記事では試験対策や試験を受けた感想等を述べたいと思います。
参考までに、私のバックグラウンドについて簡単に紹介します。私はアカデミアとして長年、物理の研究に携わってきました。研究を通してデータ分析に関してはそれなりの経験を積んでいます。とくにC/C++やPythonをつかったプログラミングは10年以上の経験があります。ただ、今回の試験はプログラミングのスキルが問われているわけではありません。またアカデミアからの転身ということもあり、ビジネス界でのデータ分析がどのようなものかをざっくり知りたいと思い、興味本位で2023年6月の検定試験
を受けました。
2. 試験概要と対策
2.1 概要
試験の出題範囲は上記のDS検定ページもしくは下記で紹介する本にあるスキルチェックリストに記載されているとおりですが、主に、
- データサイエンス分野
- データエンジニアリング分野
- ビジネス分野
の3つの分野に分かれています。試験時間は90分で90問ほどの問題が出題されます。
2.2 対策
試験対策に3週間(毎日2‐3時間の想定)ほどの時間を割きました。対策をするために以下の2冊の本を購入しました。
- 徹底攻略データサイエンティスト検定問題集[リテラシーレベル]対応
- 最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版
これに加え、試験直前の1週間で、黒い本と同じスキルアップAI社の「DS検定アプリ」にも取り組みました。
私の場合はまず問題集(黒い本)からはじめ、どのような問題がでるのかということを感覚的に確かめました。解説がしっかり書かれており、解説を読むだけでも勉強になりました。
-
データサイエンス分野
: 数学や統計学に関してはだいたい知っていましたが、機械学習、とくに自然言語処理の分野において知らない専門用語が多々ありました。 -
データエンジニアリング分野
:これまでデータ分析では、物理実験に適合した独自のデータコンテナーを作成し、解析を行うスタイルだったため、RDBを使う機会はあまりありませんでした。このため、ER図やSQLなどで知らなかったものがありました。一方で、データ分散や暗号方式等についてはとくに新しいことはありませんでした。 -
ビジネス分野
:ここは法律や倫理の話など、想定通り新たに学ぶことが多かったです。一方、プロジェクト推進に関する部分は一般常識的な要素が強いかなと思いました。
黒い本の最後に90問の総仕上げ問題が付録しています。こちらも解説が充実しており、足りない知識を補うよい機会となりました。
黒い本を一通り終えた後に、白い本の模擬問題(ネット上でダウンロードできるものも含めて)を解きました。黒い本と出題傾向の違う問題もあるため、こちらもやっておいてよかったと思いました。解説もあるのですが、解説だけでは不十分で、本編にもどって対象項目を読んで確認するというスタイルで進めました。模擬問題で触れられていない項目も当然あるので、模擬問題を解いたのちに白い本を通しでざっと読みました。
ここまでにだいたい10日ほどかかったと思います。この時点で一通り終えられて安心できた記憶があります。この2冊でカバーしきれていないものまではフォローするつもりがなかったので、あとはこの2冊に載っている内容の定着を目指しました。具体的には、試験直前までにこの2冊を3周しました。最後の1週間でアプリも導入し、とにかく問題数をこなしました。アプリは黒い本と同じ会社が作っただけあって、黒い本の類似問題が多くあったと思いますが、本番試験でアプリにあり黒い本にはないような問題の出題もあったため、アプリもやっておいてよかったと記憶しております。
3. 試験本番
本番は試験センターで受験しました。試験日程は予約時点で決まってはいるものの、本番は個別ブースにあるPCで行うため、自分のタイミングで試験を開始できました。試験直後にスコアが確認できます。
本番試験で感じたこととしては、知識系以外の問題(例えばグラフの読み取りなど)もそれなりにあったという印象でした。知識系の問題は知っていれば即答できる場合が多いのに対し、多少の思考を伴う問題では見落としがないか慎重になることもあり、思ったより試験に時間がかかってしまったと思います。とはいえ、90問(厳密には90問でなかったかもしれません)に対し、90分という時間は十分だったと思います。78-80%の正答率が合格ラインだと思うのですが、私の正答率は88%でした。私は15-20分くらい余して退出しました。
4. 感想
正直90%はいきたかった気もしますが、「資格試験は合格することがすべて」
だと思うので、まずは合格点をとれてよかったです。また今回紹介した本2冊+アプリで対策をすれば、十分に合格点に達することは示せたかなと思います。次回以降(2023年11月以降)の試験の出題傾向が同じとは限りませんが、今回の体験がこれから受験される方の役に立つと嬉しいです。