はじめに
2021/9/15にデータサイエンティスト検定(リテラシーレベル)を受験しました。目的・きっかけとしては、
- 私が所属するKUNOではデータサイエンスの分野にも力も入れていて、自分もそちらに関わる機会を得るため
- データサイエンスの知識・技能を身につける
の2点です。社内で先輩社員の方とほぼ同時のタイミングで受けたので、この記事ではそれぞれの試験に向けた準備・当日の感想などを中心に書いていきます。
データサイエンティスト検定とは
データサイエンティスト協会が今回から開始した、データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力についての実務能力や知識、また、数理・データサイエンス・AI教育の実力を有していることを証明することができる検定試験です。
本検定の受験対象者はリテラシーレベルは以下のような方を想定しています。
- データサイエンティスト初学者
- これからデータサイエンティストを目指すビジネスパーソン
- データサイエンティストに興味を持つ大学生や専門学校生など
詳しい定義はデータサイエンティスト協会公式HPを参考
今後より上位の検定が行われると思われます。
2人のバックグラウンド
私
- ソフトウェアエンジニア1年目
- メイン業務 :Webアプリ開発
- 普段勉強していること
- ML, DS関連分野
* kaggleに入門中- 趣味で数学/物理学
- ML, DS関連分野
先輩
- エンジニア歴20年以上
- 保有資格:
- 統計検定2級
- TensorFlowデベロッパー認定資格
- 業務で機械学習セミナーの講師経験、ログデータの可視化経験あり
試験対策
私
-
試験対策の主な流れ
- 1 公式の試験対策講座(動画)を見て、概要を学習する
- 2 スキルチェックリストを確認する
- V-Tuberアイシアさんの記事がとても参考になりました
- 1, 2 の要点・曖昧部分をドキュメントにまとめる
各分野毎の対策詳細
-
ビジネス
- 方針: 出題用語を調べる / ユースケースを調べる
- IoTを中心にyoutubeでDS事例紹介動画を漁ってました..
- 方針: 出題用語を調べる / ユースケースを調べる
-
サイエンス
- 方針: 気になった分野を深ぼる
- 統計学の関連する本を何冊か適度に読む
- 「データサイエンス設計マニュアル」 「統計クイックリファレンス」「Pythonで始める機械学習」など
- 統計学の関連する本を何冊か適度に読む
- 方針: 気になった分野を深ぼる
-
エンジニアリング
- 方針: SQLの実践とDB関連の知識整理
- SQL問題: DS協会が出しているSQL100本ノックをやりながら、わからない点を調べる。(50くらいまで)
- 方針: SQLの実践とDB関連の知識整理
先輩
受験1ヶ月前
- 公式ページの試験範囲を確認した。項目が多く、かつ、それぞれどこまで深く勉強して良いかわからないので、公式テキストの販売を待って作戦を練ろうと思っていたが、公式テキストの発売が延期に延期を重ねなかなか発売されず(結局発売は受験予定日の約10日前になってしまった)
受験3週間前
- DS検定リテラシーレベル対応 データサイエンティスト基礎講座を見ることで試験範囲とレベル感を把握できた。その結果、今まで持っていた知識のおさらいでなんとかなりそうと言う手応えを掴んだので公式テキストの発売までは特に何もしなかった
受験10日前〜
- 公式テキストを購入し、試験範囲のおさらいをした。
模擬試験がついていたのでチャレンジし、その時点で8割の点数は取れていたので、より合格率を上げるために受験当日までは最も正解率が低かったビジネス力の用語を中心に確認を行った。
試験結果
※ 試験終了後に各分野ごとの正解率は画面に表示されます。おそらく2人とも合格基準に達していると思われますが、試験の正式な合格発表は11月になります。
-
私
- サイエンス 73.3%
- エンジニアリング 88.8%
- ビジネス 90.0%
-
先輩
- サイエンス 93.3%
- エンジニアリング 92.0%
- ビジネス 85.0%
試験を終えての感想
-
試験について
- 問題自体は基礎的な知識を部分を問う問題が多く、DSや統計学に理解の深い人にとってはもちろん、難易度的には統計検定2級より優しめかと思いました。
-
試験対策について
- ある程度既知の部分も多かったので、対策が緩みがちだった。
- 過去問がないので、模擬問題を頼りに試験対策を進めたが、どこまでのレベルでやればいいのかの線引きが難しかった。(公式テキスト買った方が安心はできたかも)
-
試験勉強を通して得られたこと
- サイエンス/エンジニアリング/ビジネスに渡る、DSの基礎知識・心得。
- DSの現状とビジネスにおけるユースケースや今後の産業界の展望。
-
これから受ける人へのアドバイスとして(先輩より)
- まず、試験のペース配分を決めるために、最初に問題数を確認した方がいいでしょう。自分の場合は画面上部に今の問題番号 / 問題数 みたいな感じで表示されていました。
- 公式テキストの方が対策講座の動画よりも少しだけ広く試験範囲を解説しているような気がします。おそらく対策講座で説明することが理解できれば合格レベルには達することができると思いますが、公式テキストにある模擬問題は予行練習として時間を測りながらやった方がいいかと思いました。
- 他にも対策動画が順次公開されているようなので、興味がある方はこまめに公式ページを覗きにいくと良いでしょう。
- 適切なもの / 適切でないものを選択する問題が多いのでそこを読み間違えないように
- 問題数が多いので、勉強してなかった問題には時間をかけず、取れるところを確実に取れるようにしましょう。
終わりに
データサイエンス関連の実務経験はまだないですが、kaggleや理論の勉強を通して専門性を高めたいと思います。今後、次のレベルのDS検定が出てくると思われますので、その際はまた受験したいです。
KUNOでは数理最適化や自己教師あり学習などの高度な手法を使った開発も行なっていて色々と刺激を受けるので、自分も早いスピード感で技術力を伸ばしていきたいです。
また、社内ではデータサイエンス・MLの他にもGCP/AWSのクラウドの資格保持者も多く、資格取得には報酬制度もあるため、次の資格目標としてAWS Certified Machine Learning - Specialtyの取得を狙おうと思います。