はじめに
ども。見習いデータサイエンティストです。
皆さんデータサイエンティスト検定ってご存知ですか?
先日新しく始まった、「データサイエンティストってなんだ?」「そもそも何を勉強したらいいんだ?」という疑問を解決してくれる試験です!
今回はその第一回目試験を受講してきたので、勉強法や感想などを書いていこうと思います。
#1 そもそもデータサイエンス検定(DS検定)とは
昨今では、数理・データサイエンスを必修化する大学が現れるほど、データサイエンスは今後の社会に必要だと認識されています。
このデータサイエンス教育のカリキュラムの作成や必須スキルのチェックリストを作成しているのがデータサイエンティスト協会です!
データサイエンティスト協会は、作成したスキルチェックリストをもとに、データサイエンティストの否ライトしての技術があることを示すための検定を始めました。
https://www.datascientist.or.jp/dskentei/
データサイエンティスト検定では、ビジネス力・データサイエンス力・データエンジニア力の3つを軸に習熟度を判定します。
より詳しい説明は、協会のホームページやVtuberのAlica Solidさんが動画にしてくださっています。
https://www.youtube.com/watch?v=FxJnDJP2jNg
現在は第一回目の申込みを締め切っています;;
興味のある方は公式ページの第二回のお知らせを待ちましょう!
#2 自分の資格とテストの結果
自分は現在資格として、G検定2021#2・python3エンジニア認定試験などの資格を保有しています。
そのためデータサイエンス分野については、かんたんな復習のみで試験に向かいましたが、どの程度の知識が必要かは後ほど記そうと思います。
またテスト結果については、
- データサイエンス分野 88%
- データエンジニアリング 76%
- ビジネス分野 95%
で総合86%でした!これで合格点90%以上とかだったら泣くしかない、恥。
#3 どんな勉強をしたか
この章では、DS検定ではどの程度の知識が必要か・私がやったことの2つに分けて書こうと思います
###DS検定に必要な知識量
DS検定の範囲はかなり広いです。
データサイエンス分野だけでも、統計検定3級・行列入門書1冊・分析準備(データ加工・データ量削減)・機械学習手法(言語・画像・時系列分析 etc...)
これそれぞれで資格試験あるぐらいなので範囲の広さがわかりますね。範囲が広いので範囲を参考にそれぞれの試験を受けるのも手だと思います。
ですが実際にDS検定に受かるためだけであれば、範囲の単語の意味さえ説明できれば合格できます。
たとえば、分散の公式かけますか?クラスタリングと分類問題の違いがわかりますか?程度で大丈夫です。
DS協会が参考問題を提示しています。
https://www.datascientist.or.jp/common/docs/practice_v1.1.pdf
###どんな勉強をしたか
まずは範囲の把握をします。
githubにスキルチェックリストがあるのでこちらが参考になると思います。
https://the-japan-datascientist-society.github.io/skills-checklist-viewer/#
自分は時間がなかったため、DS協会の公式テキストを購入し一通り流し読みしました。
この中の項目でわからないところ、忘れているところを一通りメモします。
※G検定取得者が注意するのは、データエンジニアリング・ビジネス・AIについての倫理の部分はG検定のは範囲にはないので調べたほうがいいでしょう
公式テキスト買ってない方はチェックリストの星1を一通り確認しましょう
メモの内容をひたすら検索していきます。神様仏様qiita様です。
公式テキストには模擬問題があるので、これを用いて知識の確認をしました。一度しか説いてないので案の定苦手なエンジニアリングはボロボロでした;;
#4 感想
DSに必要な知識が体系的に得られるのは最高すぎますね。
自分はエンジニアリングが苦手で、どういうふうに分析して行くか思いついても、どんな構成で実装すべきかなどはわからないので、その学習の手がかりがこの検定で得られたと思います。
概要はつかめたのでガリガリ勉強していきます!!